Прежде чем умереть на бумаге, лучше сначала найти набор полезных инструментов

Google искусственный интеллект GitHub HTTPS

Из среды, автор:Эдди Смолянски,Сердце Машины собрано,Участие: ЛюСяо Кун, Ван Шутин.

Все еще погружаетесь в океан статей по машинному обучению? Потратьте несколько минут, чтобы сначала изучить некоторые новые инструменты, никаких потерь, чтение статей, комментирование, общение, управление, поиск, воспроизведение и написание — все в порядке.

Как исследователи в продуктивной области, такой как глубокое обучение, мы часто оказываемся перегружены морем бумаг. Этих статей так много, что может показаться сложным прочитать их все и следить за последними исследованиями. Я думаю, что основная причина этого заключается в том, что мы не используем все преимущества существующих инструментов и сервисов для упрощения работы. Еще одна причина — отсутствие действительно хороших продуктов, удовлетворяющих все наши потребности в одном интерфейсе, но это будет отдельная запись в блоге.

Недавно я начал изучать подполе ML, и я был очень разочарован расстановкой приоритетов, чтением и курированием связанной литературы в этом подполе... В итоге я нашел инструменты, помогающие с этой задачей, и я хотел чтобы они могли использовать продукты и услуги с пользой, чтобы поделиться ими с вами. Надеюсь помочь тем, кому нужно иметь дело с научными работами, улучшить свой рабочий процесс.

Основное внимание я уделяю вопросам чтения и презентации (не письма):

  1. Диспетчер ссылок (также называемый библиотекой тезисов)

  2. Используйте социальные платформы для обмена знаниями

  3. Используйте алгоритмы автоматизированного анализа документов для получения дополнительных метаданных (ключевые слова, релевантные наборы данных, важные цитаты и т. д.).

Диспетчер ссылок (также называемый библиотекой тезисов)

На этих платформах вы можете создавать и управлять всеми предыдущими и будущими списками чтения, добавлять личные заметки и делиться ими с группами. Эти библиотеки синхронизируются с облаком, что означает, что вы можете открыть документ где угодно. Goodreads можно использовать для чтения книг, но для статей лучше всего выбирать из следующих инструментов:

  1. Mendeley: Хотя этот продукт выглядит не очень хорошо, он имеет бесплатную бизнес-модель и поддерживает несколько платформ, таких как Интернет, ПК, Mac и мобильные телефоны. В дополнение к обычным бумажным заметкам вы можете аннотировать и выделять файлы PDF напрямую. Его облачное хранилище ограничено, и вам придется заплатить более чем за несколько сотен бумаг.

  2. Paperpile: для этого требуется платная подписка (бесплатной версии нет, вы можете попробовать его в течение 30 дней бесплатно с учетной записью Google), но он выглядит модно и удобен в использовании. Вы можете легко импортировать библиотеку диссертаций с других сервисных платформ в этот продукт. Вы также можете синхронизировать библиотеку с собственным Google Cloud, что является одним из ее преимуществ. В настоящее время он доступен только в Google Chrome.

  3. Zotero: это бесплатная реализация с открытым исходным кодом, где вы платите только за избыточное облачное хранилище. Похож на Mendeley, но не так функционален.

  • Менделей: https://www.mendeley.com/

  • Бумага: https://paperpile.com/

  • Зотеро: https://www.zotero.org/

Конечно, у вас есть много вариантов, но это те, которые я использовал и чувствую себя довольно хорошо. Если бы мне пришлось выбирать, я бы выбрал Mendeley, потому что он поддерживает множество платформ и является бесплатным.

Интерфейс Менделея

Интерфейс Зотеро

arXiv эволюционировал

arXiv был запущен в 1991 году и оставался относительно неизменным в течение почти десяти лет, несмотря на значительное увеличение количества опубликованных статей (к октябрю 2016 года количество представлений превысило 10 000 в месяц). Конечно, у нас появилось много новых требований к функционалу бумажного репозитория. Нам нужны алгоритмы, которые могут выполнять бумажный анализ, мы хотим найти код, реализующий бумажные результаты, мы хотим, чтобы социальные платформы обменивались информацией, и мы, возможно, устали от pdf-документов в формате с двумя столбцами.

После поиска в Интернете существующих решений я нашел много таких инструментов.


Социальные платформы

  1. Shortscience: это платформа для обмена обзорами статей, в настоящее время существует более 1000 обзоров статей, и их число продолжает расти;

  2. OpenReview: это платформа, которая может обеспечить открытый процесс рецензирования статей. Все представленные статьи будут раскрывать имя автора и другую информацию, а также принимать экспертные оценки и вопросы. Статья может оцениваться анонимно или от настоящего имени. После завершения публичного рецензирования автор статьи также сможет корректировать и пересматривать статью. В настоящее время Openreview предоставляет функции рецензирования только для определенных академических конференций, таких как ICLR, и из-за широко распространенных сомнений рецензирование ICLR на Openreview также было изменено на двойное слепое рецензирование. В дополнение к официальному обзору, активный обмен мнениями между читателями и авторами также можно увидеть в комментариях ко многим недавним статьям.

  3. Scirate: вы можете просмотреть самые популярные статьи arXiv, классифицированные по темам, и просмотреть обзоры связанных статей. Но его рейтинг популярности основан на количестве лайков на сайте, который не очень активен.

  • Короткая наука: http://www.shortscience.org/

  • OpenReview: https://openreview.net/

  • Скират: https://scirate.com/


Пример обзора краткого научного эссе

Документы ICLR 2019 и примеры обзоров на Openreview

Найдите реализацию кода статьи

  1. Документы с кодом: автоматически связывайте документы с репозиториями и наборами данных GitHub, которые реализуют код, отсортированные по коллекциям GitHub. Каждая статья может иметь несколько объединенных записей.

  2. Github pwc: объедините документы и реализации кода в довольно краткий список, включая последние документы NIPS.

  3. GitXiv: Каждый проект удобно отображать в виде arXiv+GitHub+ссылка+обсуждение, к сожалению, этот проект больше не поддерживается.

  • Документы с кодом: https://paperswithcode.com/

  • Гитхаб pwc: https://github.com/zziz/pwc

  • GitXiv: http://www.gitxiv.com/

Документы с кодовым интерфейсом.

Некоторые ссылки на странице pwc на GitHub.

другие инструменты

  1. arXiv-sanity: большое улучшение по сравнению с arXiv, включая отображение сводок, комментариев и очень простых функций социальных сетей и библиотек при просмотре. Этот сайт, который объединяет множество удобных функций, был разработан Андреем Карпатым в свободное время.

  2. arXiv-vanity: преобразует документы из arXiv в адаптивные веб-страницы, чтобы людям не приходилось читать PDF-файлы.

  • arXiv-санити: http://arxiv-sanity.com/

  • arXiv-тщеславие: http://arxiv-тщеславие/

arXiv-здравомыслие интерфейс

Пример конверсионной бумаги arXiv-vanity

Поиск и анализ бумаги

  1. Ученый Google: первый выбор для поиска статей на сегодняшний день, здесь вы можете просмотреть статистику статей и ссылки на цитирование, вы также можете получать напоминания о новых обновлениях статей от следующих авторов или статей и использовать автоматические рекомендации для предоставления базовой библиотеки.

  2. Семантик: Семантический анализ статей можно сочетать с внешней интеграцией материалов. Функции включают в себя: отображение цитат и ссылок, измерение влияния статьи, отображение бумажных графиков, автоматическое создание ключевых слов (на основе названия), анализ авторов, поиск дополнительных ресурсов в Интернете (например, связанных видео на YouTube) и рекомендации статей.

  • Google ученый: https://scholar.google.co.il/

  • Специалист по семантике: https://www.semanticscholar.org/

  • Semantic Scholar: author profile page


Semantic Scholar: Интерфейс профиля автора

Инструменты для авторов

  1. Overleaf: онлайн-редактор LaTeX, который поддерживает совместную работу нескольких человек, например написание документов с помощью Google Docs, что очень легко реализовать.

  2. Authorea: метод поддержки совместной онлайн-записи статей несколькими людьми, направленный на сокращение использования LaTeX и поддержку современных редакторов WYSIWYG. Поддерживает встроенный код и данные, способствует воспроизводимости, поддерживает встроенные общедоступные комментарии и другие разумные функции.

  3. Code Ocean: облачная платформа воспроизводимости. Насколько я понимаю, вы загружаете свое исследование в виде кода среды Jupyter, запускаете его в Интернете и воспроизводите те же графики / результаты, которые были у автора.

  • На обороте: https://www.overleaf.com/

  • Автор: https://www.authorea.com/

  • Код океана: https://codeocean.com/

[Если вы считаете, что предыдущая статья слишком длинная, вы можете... не читать]

Мой совет

  • Управление библиотекой для чтения: Mendeley

  • Читайте и пишите рецензии на статьи: shortscience и openreview

  • Сопоставьте документы с репозиториями GitHub: paperswithcode и pwc

  • Статья и авторский анализ: Семантик

  • Написание статьи: оборотная сторона

Кстати, недавно выпущенный Google Dataset Search также является артефактом для поиска наборов данных.

Наконец, мы надеемся, что по крайней мере одна из сервисных платформ, рекомендованных в этом блоге, позволит вам улучшить рабочий процесс. хи хи~


Материалы на разные темы на arXiv, данные со страницы статистики.

Оригинальный адрес:к data science.com/finding-setting…