Из среды, автор:Эдди Смолянски,Сердце Машины собрано,Участие: ЛюСяо Кун, Ван Шутин.
Все еще погружаетесь в океан статей по машинному обучению? Потратьте несколько минут, чтобы сначала изучить некоторые новые инструменты, никаких потерь, чтение статей, комментирование, общение, управление, поиск, воспроизведение и написание — все в порядке.
Как исследователи в продуктивной области, такой как глубокое обучение, мы часто оказываемся перегружены морем бумаг. Этих статей так много, что может показаться сложным прочитать их все и следить за последними исследованиями. Я думаю, что основная причина этого заключается в том, что мы не используем все преимущества существующих инструментов и сервисов для упрощения работы. Еще одна причина — отсутствие действительно хороших продуктов, удовлетворяющих все наши потребности в одном интерфейсе, но это будет отдельная запись в блоге.
Недавно я начал изучать подполе ML, и я был очень разочарован расстановкой приоритетов, чтением и курированием связанной литературы в этом подполе... В итоге я нашел инструменты, помогающие с этой задачей, и я хотел чтобы они могли использовать продукты и услуги с пользой, чтобы поделиться ими с вами. Надеюсь помочь тем, кому нужно иметь дело с научными работами, улучшить свой рабочий процесс.
Основное внимание я уделяю вопросам чтения и презентации (не письма):
Диспетчер ссылок (также называемый библиотекой тезисов)
Используйте социальные платформы для обмена знаниями
Используйте алгоритмы автоматизированного анализа документов для получения дополнительных метаданных (ключевые слова, релевантные наборы данных, важные цитаты и т. д.).
Диспетчер ссылок (также называемый библиотекой тезисов)
На этих платформах вы можете создавать и управлять всеми предыдущими и будущими списками чтения, добавлять личные заметки и делиться ими с группами. Эти библиотеки синхронизируются с облаком, что означает, что вы можете открыть документ где угодно. Goodreads можно использовать для чтения книг, но для статей лучше всего выбирать из следующих инструментов:
Mendeley: Хотя этот продукт выглядит не очень хорошо, он имеет бесплатную бизнес-модель и поддерживает несколько платформ, таких как Интернет, ПК, Mac и мобильные телефоны. В дополнение к обычным бумажным заметкам вы можете аннотировать и выделять файлы PDF напрямую. Его облачное хранилище ограничено, и вам придется заплатить более чем за несколько сотен бумаг.
Paperpile: для этого требуется платная подписка (бесплатной версии нет, вы можете попробовать его в течение 30 дней бесплатно с учетной записью Google), но он выглядит модно и удобен в использовании. Вы можете легко импортировать библиотеку диссертаций с других сервисных платформ в этот продукт. Вы также можете синхронизировать библиотеку с собственным Google Cloud, что является одним из ее преимуществ. В настоящее время он доступен только в Google Chrome.
Zotero: это бесплатная реализация с открытым исходным кодом, где вы платите только за избыточное облачное хранилище. Похож на Mendeley, но не так функционален.
Менделей: https://www.mendeley.com/
Бумага: https://paperpile.com/
Зотеро: https://www.zotero.org/
Конечно, у вас есть много вариантов, но это те, которые я использовал и чувствую себя довольно хорошо. Если бы мне пришлось выбирать, я бы выбрал Mendeley, потому что он поддерживает множество платформ и является бесплатным.
arXiv эволюционировал
arXiv был запущен в 1991 году и оставался относительно неизменным в течение почти десяти лет, несмотря на значительное увеличение количества опубликованных статей (к октябрю 2016 года количество представлений превысило 10 000 в месяц). Конечно, у нас появилось много новых требований к функционалу бумажного репозитория. Нам нужны алгоритмы, которые могут выполнять бумажный анализ, мы хотим найти код, реализующий бумажные результаты, мы хотим, чтобы социальные платформы обменивались информацией, и мы, возможно, устали от pdf-документов в формате с двумя столбцами.
После поиска в Интернете существующих решений я нашел много таких инструментов.
Социальные платформы
Shortscience: это платформа для обмена обзорами статей, в настоящее время существует более 1000 обзоров статей, и их число продолжает расти;
OpenReview: это платформа, которая может обеспечить открытый процесс рецензирования статей. Все представленные статьи будут раскрывать имя автора и другую информацию, а также принимать экспертные оценки и вопросы. Статья может оцениваться анонимно или от настоящего имени. После завершения публичного рецензирования автор статьи также сможет корректировать и пересматривать статью. В настоящее время Openreview предоставляет функции рецензирования только для определенных академических конференций, таких как ICLR, и из-за широко распространенных сомнений рецензирование ICLR на Openreview также было изменено на двойное слепое рецензирование. В дополнение к официальному обзору, активный обмен мнениями между читателями и авторами также можно увидеть в комментариях ко многим недавним статьям.
Scirate: вы можете просмотреть самые популярные статьи arXiv, классифицированные по темам, и просмотреть обзоры связанных статей. Но его рейтинг популярности основан на количестве лайков на сайте, который не очень активен.
Короткая наука: http://www.shortscience.org/
OpenReview: https://openreview.net/
Скират: https://scirate.com/
Документы ICLR 2019 и примеры обзоров на Openreview
Найдите реализацию кода статьи
Документы с кодом: автоматически связывайте документы с репозиториями и наборами данных GitHub, которые реализуют код, отсортированные по коллекциям GitHub. Каждая статья может иметь несколько объединенных записей.
Github pwc: объедините документы и реализации кода в довольно краткий список, включая последние документы NIPS.
GitXiv: Каждый проект удобно отображать в виде arXiv+GitHub+ссылка+обсуждение, к сожалению, этот проект больше не поддерживается.
Документы с кодом: https://paperswithcode.com/
Гитхаб pwc: https://github.com/zziz/pwc
GitXiv: http://www.gitxiv.com/
другие инструменты
arXiv-sanity: большое улучшение по сравнению с arXiv, включая отображение сводок, комментариев и очень простых функций социальных сетей и библиотек при просмотре. Этот сайт, который объединяет множество удобных функций, был разработан Андреем Карпатым в свободное время.
arXiv-vanity: преобразует документы из arXiv в адаптивные веб-страницы, чтобы людям не приходилось читать PDF-файлы.
arXiv-санити: http://arxiv-sanity.com/
arXiv-тщеславие: http://arxiv-тщеславие/
Поиск и анализ бумаги
Ученый Google: первый выбор для поиска статей на сегодняшний день, здесь вы можете просмотреть статистику статей и ссылки на цитирование, вы также можете получать напоминания о новых обновлениях статей от следующих авторов или статей и использовать автоматические рекомендации для предоставления базовой библиотеки.
Семантик: Семантический анализ статей можно сочетать с внешней интеграцией материалов. Функции включают в себя: отображение цитат и ссылок, измерение влияния статьи, отображение бумажных графиков, автоматическое создание ключевых слов (на основе названия), анализ авторов, поиск дополнительных ресурсов в Интернете (например, связанных видео на YouTube) и рекомендации статей.
Google ученый: https://scholar.google.co.il/
Специалист по семантике: https://www.semanticscholar.org/
Semantic Scholar: author profile page
Инструменты для авторов
Overleaf: онлайн-редактор LaTeX, который поддерживает совместную работу нескольких человек, например написание документов с помощью Google Docs, что очень легко реализовать.
Authorea: метод поддержки совместной онлайн-записи статей несколькими людьми, направленный на сокращение использования LaTeX и поддержку современных редакторов WYSIWYG. Поддерживает встроенный код и данные, способствует воспроизводимости, поддерживает встроенные общедоступные комментарии и другие разумные функции.
Code Ocean: облачная платформа воспроизводимости. Насколько я понимаю, вы загружаете свое исследование в виде кода среды Jupyter, запускаете его в Интернете и воспроизводите те же графики / результаты, которые были у автора.
На обороте: https://www.overleaf.com/
Автор: https://www.authorea.com/
Код океана: https://codeocean.com/
[Если вы считаете, что предыдущая статья слишком длинная, вы можете... не читать]
Мой совет
Управление библиотекой для чтения: Mendeley
Читайте и пишите рецензии на статьи: shortscience и openreview
Сопоставьте документы с репозиториями GitHub: paperswithcode и pwc
Статья и авторский анализ: Семантик
Написание статьи: оборотная сторона
Кстати, недавно выпущенный Google Dataset Search также является артефактом для поиска наборов данных.
Наконец, мы надеемся, что по крайней мере одна из сервисных платформ, рекомендованных в этом блоге, позволит вам улучшить рабочий процесс. хи хи~
Оригинальный адрес:к data science.com/finding-setting…