PyCon2018: две последние библиотеки визуализации данных машинного обучения: Altair и Yellowbrick.

оригинальный автор:David 9

Оригинальный текст опубликован в личном блоге автора, нажмитеПосмотреть исходный текст, НаггетсРазрешение на перепечатку получено. Еще раз спасибо автору.

Две последние библиотеки визуализации данных ML на PyCon2018: Altair и Yellowbrick, библиотека визуализации для функционального программирования и расширенная библиотека визуализации scikit-learn.

наука о данныхбиблиотека визуализацииПодобно библиотеке фреймворка глубокого обучения, хотя она и бесконечна, ее можно условно разделить на два типа:

одинУниверсальная библиотека визуализацииЛюбые статические данные, похожие на схему json, могут использоваться для построения графиков, например:Pandas, Seaborn , ggplot, Bokeh, pygal, Plotly.

ДругойБиблиотека визуализации с высокой степенью привязки к фреймворку, как в TensorFlowTensorBoard, расширенная библиотека визуализации scikit-learnYellowbrick.

Для первой общей библиотеки тренд на удобство, простоту и простоту использования не изменился. Доклад на этом PyCon2018:Exploratory Data Visualization with Vega, Vega-Lite, and Altairтолько что представилAltairПростота этой новой библиотеки визуализации функционального программирования может быть визуализирована, если вы получите данные кадра данных панды и добавите код оператора:

import altair as alt# to use with Jupyter notebook (not JupyterLab) run the following# alt.renderers.enable('notebook')# load a simple dataset as a pandas DataFramefrom vega_datasets import datacars = data.cars()# 这里是声明代码，是不是有函数式编程的味道 ？alt.Chart(cars).mark_point().encode(    x='Horsepower',    y='Miles_per_Gallon',    color='Origin',)

Подпрограммы Альтаира

Если вы хотите изменить стиль точки на стиль линии, просто измените функцию mark_point() на mark_line():

alt.Chart(cars).mark_line().encode(    x='Horsepower',    y='Miles_per_Gallon',    color='Origin',)

Здесь вы можете заметить, что независимо от того, сколько функций имеет ваш автомобильный набор данных, какие функции вам нужны для визуализации, могут быть объявлены в функции кодирования. Конечно, в Altair API есть много удобных мест,Многие примеры примеров jupyterNOTEBOOK можно сначала попробовать.

Для библиотек визуализации, тесно связанных с scikit-learn.Yellowbrick, даже в процессе визуализации, интегрирован в тренировочный процесс:

from sklearn.linear_model import LogisticRegressionfrom yellowbrick.classifier import ROCAUC# 初始化分类模型和可视化logistic = LogisticRegression()visualizer = ROCAUC(logistic)visualizer.fit(X_train, y_train)  # visualizer对象其实就是estimater类的继承，可以进行fit训练visualizer.score(X_test, y_test)  # 在测试集上得分g = visualizer.poof()             # 获得ROCAUC的分析图

Как и в приведенном выше коде, в модели логистической регрессииПосле обучения сразу выводить график анализа:

Откуда: http://www.scikit-yb.org/en/latest/api/classifier/rocauc.html

Аналогично для анализа PCA визуализация и обучающий код связаны:

from yellowbrick.features.pca import PCADecompositionvisualizer = PCADecomposition(scale=True, center=False, color=y)visualizer.fit_transform(X,y)visualizer.poof()

Приведенный выше код напрямую реализует двухмерную визуализацию PCA:

использованная литература:

www.scikit-yb.org/en/latest/
GitHub.com/Альтаир-виз/…

Этот документ принимаетАтрибуция — Некоммерческое использование — Без производных инструментов 3.0 Лицензионное соглашение для материкового КитаяЛицензия. Авторские права принадлежат оригиналу "Блог Дэвида 9", если вам нужно перепечатать, пожалуйста, свяжитесь с WeChat: david9ml или по электронной почте: yanchao727@gmail.com

Или отсканируйте QR-код напрямую: