оригинальный автор:David 9
Оригинальный текст опубликован в личном блоге автора, нажмитеПосмотреть исходный текст, НаггетсРазрешение на перепечатку получено. Еще раз спасибо автору.
Две последние библиотеки визуализации данных ML на PyCon2018: Altair и Yellowbrick, библиотека визуализации для функционального программирования и расширенная библиотека визуализации scikit-learn.
наука о данныхбиблиотека визуализацииПодобно библиотеке фреймворка глубокого обучения, хотя она и бесконечна, ее можно условно разделить на два типа:
одинУниверсальная библиотека визуализацииЛюбые статические данные, похожие на схему json, могут использоваться для построения графиков, например:Pandas, Seaborn , ggplot, Bokeh, pygal, Plotly.
ДругойБиблиотека визуализации с высокой степенью привязки к фреймворку, как в TensorFlowTensorBoard, расширенная библиотека визуализации scikit-learnYellowbrick.
Для первой общей библиотеки тренд на удобство, простоту и простоту использования не изменился. Доклад на этом PyCon2018:Exploratory Data Visualization with Vega, Vega-Lite, and Altairтолько что представилAltairПростота этой новой библиотеки визуализации функционального программирования может быть визуализирована, если вы получите данные кадра данных панды и добавите код оператора:
import altair as alt# to use with Jupyter notebook (not JupyterLab) run the following# alt.renderers.enable('notebook')# load a simple dataset as a pandas DataFramefrom vega_datasets import datacars = data.cars()# 这里是声明代码,是不是有函数式编程的味道 ?alt.Chart(cars).mark_point().encode( x='Horsepower', y='Miles_per_Gallon', color='Origin',)
Если вы хотите изменить стиль точки на стиль линии, просто измените функцию mark_point() на mark_line():
alt.Chart(cars).mark_line().encode( x='Horsepower', y='Miles_per_Gallon', color='Origin',)
Здесь вы можете заметить, что независимо от того, сколько функций имеет ваш автомобильный набор данных, какие функции вам нужны для визуализации, могут быть объявлены в функции кодирования. Конечно, в Altair API есть много удобных мест,Многие примеры примеров jupyterNOTEBOOK можно сначала попробовать.
Для библиотек визуализации, тесно связанных с scikit-learn.Yellowbrick, даже в процессе визуализации, интегрирован в тренировочный процесс:
from sklearn.linear_model import LogisticRegressionfrom yellowbrick.classifier import ROCAUC# 初始化分类模型和可视化logistic = LogisticRegression()visualizer = ROCAUC(logistic)visualizer.fit(X_train, y_train) # visualizer对象其实就是estimater类的继承,可以进行fit训练visualizer.score(X_test, y_test) # 在测试集上得分g = visualizer.poof() # 获得ROCAUC的分析图
Как и в приведенном выше коде, в модели логистической регрессииПосле обучения сразу выводить график анализа:
Аналогично для анализа PCA визуализация и обучающий код связаны:
from yellowbrick.features.pca import PCADecompositionvisualizer = PCADecomposition(scale=True, center=False, color=y)visualizer.fit_transform(X,y)visualizer.poof()
Приведенный выше код напрямую реализует двухмерную визуализацию PCA:
использованная литература:
Этот документ принимаетАтрибуция — Некоммерческое использование — Без производных инструментов 3.0 Лицензионное соглашение для материкового КитаяЛицензия. Авторские права принадлежат оригиналу "Блог Дэвида 9", если вам нужно перепечатать, пожалуйста, свяжитесь с WeChat: david9ml или по электронной почте: yanchao727@gmail.com
Или отсканируйте QR-код напрямую: