Визуализация Python | Seaborn 5-минутное введение (семь) - парный сюжет

визуализация данных
Визуализация Python | Seaborn 5-минутное введение (семь) - парный сюжет

Публичный аккаунт WeChat: «Python Reading Finance»
Если у вас есть какие-либо вопросы или предложения, пожалуйста, оставьте сообщение в публичном аккаунте

Seaborn — это библиотека визуализации Python, основанная на matplotlib. Он предоставляет расширенный интерфейс для рисования привлекательных статистических графиков. Seaborn на самом деле инкапсулирует более продвинутый API на основе matplotlib, что упрощает рисование и делает ваши графики более точными без большого количества настроек.

Сегодня я собираюсь познакомить вас с парным сюжетом, без лишних слов, давайте сразу к теме.

Примечание. Весь код реализован в блокноте IPython.

pairplot

В парном графике пара означает пару. Парный график в основном показывает отношения между переменными (линейные или нелинейные, есть ли более очевидная корреляция). Как обычно, давайте посмотрим на API парного графика.

image

Далее используется набор данных радужной оболочки, чтобы представить использование парного графика. Набор данных радужной оболочки использовался много раз, но большинство людей (и я тоже), вероятно, не знают, как выглядит радужная оболочка, поэтому давайте сначала поместим изображение радужной оболочки.

image

Сначала импортируйте соответствующие пакеты и настройте соответствующие параметры.

import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
sns.set_style('white',{'font.sans-serif':['simhei','Arial']})
#导入seaborn自带iris数据集
data=sns.load_dataset("iris")  
#为了方便大家观看,把列名换成中文的
data.rename(columns={"sepal_length":"萼片长",
                     "sepal_width":"萼片宽",
                     "petal_length":"花瓣长",
                     "petal_width":"花瓣宽",
                     "species":"种类"},inplace=True)
kind_dict = {
    "setosa":"山鸢尾",
    "versicolor":"杂色鸢尾",
    "virginica":"维吉尼亚鸢尾"
}
data["种类"] = data["种类"].map(kind_dict)
data.head() #数据集的内容如下 

image

Давайте посмотрим, как выглядит парный график.

sns.pairplot(data)

image

Видно, что гистограмма (карта распределения) каждого признака находится по диагонали, а карта корреляции между двумя разными признаками — по недиагонали.Из рисунка находим, что длина и ширина лепестков и чашелистики Существует относительно очевидная корреляция между длиной лепестков и длиной и шириной лепестков.

Далее я представлю основные параметры парного графика и их использование.

kind: используется для управления типом графика вне диагонали, опционально"scatter"и"reg"

diag_kind: управляет типом графика по диагонали, необязательно"hist"и"kde"

sns.pairplot(data,kind="reg",diag_kind="kde")

image

будетkindпараметр установлен на"reg"Линия регрессии подгоняется к графику недиагонального рассеяния, чтобы более наглядно показать взаимосвязь между переменными.

Каковы отличительные особенности чашелистиков и лепестков разных видов цветов? мы проходимhueПо параметрам различают разные виды цветов для дальнейшего анализа.

hue: классифицировать поле

#不同类别的点会以不同的颜色显现出来
sns.pairplot(data,hue="种类") 

image

мы можем пройтиhueсекретныйpairplotИз карты распределения на диагональной линии или точечной диаграммы после классификации видно, что для разных типов цветков распределение длины чашелистиков, длины лепестков и ширины лепестков весьма различно, другими словами, эти свойства могут помочь нам различать виды цветов.

Например, для цветка с короткими чашелистиками и лепестками и узкой шириной лепестков, скорее всего, это ирис.

Конечно, поpaletteпараметры для вызова нужного цвета

palette: управление цветовым тоном

sns.pairplot(data,hue="种类",palette="husl")

image

markers: управляет стилем разброса

sns.pairplot(data,hue="种类",markers=["+", "s", "D"])

image

Когда мы хотим изучить взаимосвязь двух (или более) переменных по отдельности, нам нужно только передатьvarsпараметр указывает переменную, которую вы хотите изучить

vars,x_vars,y_vars: выберите конкретное поле данных дляlistформа входящего

#单独用vars参数选择"萼片长 "和"花瓣长"两种属性
sns.pairplot(data,vars=["萼片长","花瓣长"]) 

image

# 用x_vars和 y_vars参数指定
# 需要注意的是,x_vars和y_vars要同时指定
sns.pairplot(data,x_vars=["萼片长","花瓣宽"],
             y_vars=["萼片宽","花瓣长"]) 

image

Дополнительные стили доступны черезplot_kwsиdiag_kwsконтролировать

plot_kws: используется для управления стилем графика на недиагональных линиях.

diag_kws: используется для управления стилем диагонального графика

sns.pairplot(data,diag_kind="kde",
             plot_kws=dict(s=50,edgecolor="w",color="g",alpha=.5),
             diag_kws=dict(shade=True,color="r")) 

image

Отсканируйте код, чтобы подписаться на официальный аккаунт"Питон Чтение Финансов", получите галантерейные товары в первый раз, и вы также можете присоединиться к группе обмена обучением Python! !

底部二维码.png