15 библиотек Python, которые нужно знать ученым

база данных

图片

Чтобы узнать больше о машинном обучении, искусственном интеллекте, дополненной реальности, ресурсах Unity, Unreal и технической галантерее, вы можете обратить внимание на паблик-аккаунт: Cuba AIRX

Если вы специалист по данным, аналитик данных или просто энтузиаст, не пропустите несколько очень популярных и полезных библиотек Python. Библиотеки будут сгруппированы по категориям, а именно: сбор данных, очистка и преобразование данных, визуализация данных, моделирование данных, распознавание аудио и изображений и веб-страницы.

图片

1. Скрейпинг

Scrapy, вероятно, является самой популярной библиотекой Python, если вы хотите написать поисковый робот Python для извлечения информации с веб-сайта. Например, вы можете использовать его, чтобы извлечь все отзывы обо всех ресторанах в городе или собрать все отзывы об определенной категории продуктов на сайте электронной коммерции. Обычно используется для определения интересной информации, отображаемой на веб-странице, на основе шаблонов URL и шаблонов XPath. Как только вы поймете эти шаблоны, Scrapy поможет вам автоматически извлекать необходимую информацию и организовывать ее в структуры данных, такие как таблицы и JSON.

Scrapy можно установить с помощью pip

pip install scrapy

адрес:scrapy.org/

2. Красивый суп

Beautiful Soup — еще одна библиотека Python для парсинга веб-контента. Кроме того, для более мелких задач лучше подойдет Beautiful Soup.

адрес:

woohoo.crummy.com/software/be…

3. Селен

woohoo.selenium.Dev/selenium/делать…

4. Панды

Всякий раз, когда вы работаете с данными, вы должны использовать Pandas. Вы можете манипулировать данными во фрейме данных Pandas, и существует множество встроенных функций, которые помогут вам преобразовать ваши данные. Если вы хотите изучить Python, это обязательная для изучения библиотека.

pandas.pydata.org/

5. Нампи

Numpy также является библиотекой, которую необходимо изучать на языке Python. Он расширяет объекты списка Python до комплексных многомерных массивов, а также имеет большое количество встроенных математических функций для поддержки практически любых вычислительных потребностей. В общем, вы можете использовать массивы Numpy в качестве матриц, а Numpy позволяет выполнять матричные вычисления.

import numpy as npimport pandas as pd

numpy.org/

6. Просторный

Numpy и Pandas — это библиотеки для работы с числами и структурированными данными, а Spacy помогает нам преобразовывать свободный текст в структурированные данные. Spacy — одна из самых популярных библиотек NLP (обработка естественного языка) в Python. Представьте, что вы собираете большое количество отзывов с интернет-магазина, и вам нужно извлечь из этих текстов полезную информацию, прежде чем вы сможете их проанализировать. Spacy имеет множество встроенных функций, таких как токенизаторы заданий, распознавание именованных сущностей и обнаружение частей речи.

spacy.io

图片

7. Матплотлиб

Matplotlib — самая полная библиотека визуализации данных в Python.

matplotlib.org/

8. Сюжетно

Хотя Matplotlib является обязательной для изучения библиотекой визуализации, большую часть времени я предпочитаю использовать Plotly, потому что она позволяет нам создавать самые красивые графики с наименьшим количеством строк кода. Если вы хотите построить 3D-график поверхности, точечный график на основе карты или интерактивный анимационный график, Plotly поможет вам в кратчайшие сроки.

plotly.com/python/

9. Scikit Learn

Scikit Learn должен стать вашей библиотекой Python для начала работы с машинным обучением. Scikit-Learn имеет 6 основных модулей: предварительная обработка данных, уменьшение размера, регрессия, классификация, кластеризация, выбор модели.

scikit-learn.org/

10. ПиТорч

По сравнению с Tensorflow, PyTorch более «питоновский» синтаксис. Это также упрощает изучение и использование PyTorch. Как библиотека глубокого обучения, PyTorch имеет очень богатый API и встроенные функции, которые могут помочь специалистам по данным быстро обучать свои модели глубокого обучения.

pytorch.org/

11. Тензорный поток

Tensorflow — еще одна библиотека машинного обучения Python с открытым исходным кодом от Google. Одной из самых популярных функций Tensorflow является граф потока данных на Tensorboard. Последний представляет собой автоматически сгенерированную веб-панель для визуализации процессов и результатов машинного обучения, что очень полезно для отладки и презентации.

www.tensorflow.org/

图片

12. Либроза

Librosa — очень мощная библиотека Python для обработки звука и речи. Его можно использовать для извлечения различных характеристик аудиоклипов, таких как темп, такт. С помощью Librosa такие чрезвычайно сложные алгоритмы, как сегментация по Лапласу, могут быть легко реализованы всего несколькими строками кода.

librosa.github.io/librosa/

13. Открыть резюме

OpenCV — наиболее широко используемая библиотека для распознавания изображений и видео. Не будет преувеличением сказать, что OpenCV позволяет Python заменить Matlab в распознавании изображений и видео. Он предоставляет широкий спектр API-интерфейсов, поддерживающих не только Python, но также Java и Matlab.

opencv.org/

图片

До популярности области науки о данных Python часто использовался для веб-разработки. Поэтому существует также множество отличных библиотек для веб-разработки.

14. Джанго

Если вы хотите разработать серверную часть веб-сервиса с использованием Python, Django — лучший выбор. Он разработан как высокоуровневая структура для создания веб-сайта с очень небольшим количеством кода. Он поддерживает большинство популярных баз данных, экономя время на установление соединения и разработку модели данных.

www.djangoproject.com/
15. Колба

Flask — это легкий фреймворк для веб-разработки на Python. Его можно легко настроить под любые конкретные нужды. Многие другие известные библиотеки и инструменты Python, предоставляющие веб-интерфейсы, созданы с использованием Flask, например, plot Dash и потоки.

flask.palletsprojects.com/

Чтобы узнать больше о машинном обучении, искусственном интеллекте, дополненной реальности, ресурсах Unity, Unreal и технической галантерее, вы можете обратить внимание на паблик-аккаунт: Cuba AIRX