напиши первым
Визуализация данных часто может помочь нам проанализировать состав признаков, найти интервалы признаков и объяснить функцию экспериментальных результатов. Тепловые карты — один из наиболее часто используемых методов визуализации данных.
код
def plot_heatmap(df, imagSavePath):
"""
:param df: dataframe, which has column names
:param imagSavePath: save the image to this path
:return: no return, save files
"""
matrix = abs(df.corr())
plt.subplots(figsize=(50, 50)) # 设置画面大小
sns.heatmap(matrix)
plt.savefig(imagSavePath)
Наша функция вводит кадр данных, а затем записывает изображение по указанному пути. Вообще не очень понятно выводить напрямую, но лучше сохранить.
Стоит отметить, что диапазон значений матрицы корреляции, первоначально рассчитанной функцией corr(), равен (-1, 1), -1 представляет собой полную отрицательную корреляцию, 1 представляет собой полную положительную корреляцию, а 0 представляет отсутствие корреляции. Я думаю, что в области машинного обучения отрицательная корреляция в некотором смысле согласуется с положительной корреляцией. Таким образом, неуместность — это то, что мы считаем бессмысленным. Поэтому я добавил ему пресс, чтобы получить абсолютное значение