Публичный аккаунт WeChat: «Python Reading Finance»
Если у вас есть какие-либо вопросы или предложения, пожалуйста, оставьте сообщение в публичном аккаунте
Seaborn — это библиотека визуализации Python, основанная на matplotlib. Он предоставляет расширенный интерфейс для рисования привлекательных статистических графиков. Seaborn на самом деле инкапсулирует более продвинутый API на основе matplotlib, что упрощает рисование и делает ваши графики более точными без большого количества настроек.
Сегодня я собираюсь познакомить вас с парным сюжетом, без лишних слов, давайте сразу к теме.
Примечание. Весь код реализован в блокноте IPython.
pairplot
В парном графике пара означает пару. Парный график в основном показывает отношения между переменными (линейные или нелинейные, есть ли более очевидная корреляция). Как обычно, давайте посмотрим на API парного графика.
Далее используется набор данных радужной оболочки, чтобы представить использование парного графика. Набор данных радужной оболочки использовался много раз, но большинство людей (и я тоже), вероятно, не знают, как выглядит радужная оболочка, поэтому давайте сначала поместим изображение радужной оболочки.
Сначала импортируйте соответствующие пакеты и настройте соответствующие параметры.
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
sns.set_style('white',{'font.sans-serif':['simhei','Arial']})
#导入seaborn自带iris数据集
data=sns.load_dataset("iris")
#为了方便大家观看,把列名换成中文的
data.rename(columns={"sepal_length":"萼片长",
"sepal_width":"萼片宽",
"petal_length":"花瓣长",
"petal_width":"花瓣宽",
"species":"种类"},inplace=True)
kind_dict = {
"setosa":"山鸢尾",
"versicolor":"杂色鸢尾",
"virginica":"维吉尼亚鸢尾"
}
data["种类"] = data["种类"].map(kind_dict)
data.head() #数据集的内容如下
Давайте посмотрим, как выглядит парный график.
sns.pairplot(data)
Видно, что гистограмма (карта распределения) каждого признака находится по диагонали, а карта корреляции между двумя разными признаками — по недиагонали.Из рисунка находим, что длина и ширина лепестков и чашелистики Существует относительно очевидная корреляция между длиной лепестков и длиной и шириной лепестков.
Далее я представлю основные параметры парного графика и их использование.
kind
: используется для управления типом графика вне диагонали, опционально"scatter"
и"reg"
diag_kind
: управляет типом графика по диагонали, необязательно"hist"
и"kde"
sns.pairplot(data,kind="reg",diag_kind="kde")
будетkind
параметр установлен на"reg"
Линия регрессии подгоняется к графику недиагонального рассеяния, чтобы более наглядно показать взаимосвязь между переменными.
Каковы отличительные особенности чашелистиков и лепестков разных видов цветов? мы проходимhue
По параметрам различают разные виды цветов для дальнейшего анализа.
hue
: классифицировать поле
#不同类别的点会以不同的颜色显现出来
sns.pairplot(data,hue="种类")
мы можем пройтиhue
секретныйpairplot
Из карты распределения на диагональной линии или точечной диаграммы после классификации видно, что для разных типов цветков распределение длины чашелистиков, длины лепестков и ширины лепестков весьма различно, другими словами, эти свойства могут помочь нам различать виды цветов.
Например, для цветка с короткими чашелистиками и лепестками и узкой шириной лепестков, скорее всего, это ирис.
Конечно, поpalette
параметры для вызова нужного цвета
palette
: управление цветовым тоном
sns.pairplot(data,hue="种类",palette="husl")
markers
: управляет стилем разброса
sns.pairplot(data,hue="种类",markers=["+", "s", "D"])
Когда мы хотим изучить взаимосвязь двух (или более) переменных по отдельности, нам нужно только передатьvars
параметр указывает переменную, которую вы хотите изучить
vars
,x_vars
,y_vars
: выберите конкретное поле данных дляlist
форма входящего
#单独用vars参数选择"萼片长 "和"花瓣长"两种属性
sns.pairplot(data,vars=["萼片长","花瓣长"])
# 用x_vars和 y_vars参数指定
# 需要注意的是,x_vars和y_vars要同时指定
sns.pairplot(data,x_vars=["萼片长","花瓣宽"],
y_vars=["萼片宽","花瓣长"])
Дополнительные стили доступны черезplot_kws
иdiag_kws
контролировать
plot_kws
: используется для управления стилем графика на недиагональных линиях.
diag_kws
: используется для управления стилем диагонального графика
sns.pairplot(data,diag_kind="kde",
plot_kws=dict(s=50,edgecolor="w",color="g",alpha=.5),
diag_kws=dict(shade=True,color="r"))
Отсканируйте код, чтобы подписаться на официальный аккаунт"Питон Чтение Финансов", получите галантерейные товары в первый раз, и вы также можете присоединиться к группе обмена обучением Python! !