Отличный инструмент pandas3 -map/apply/applymap

анализ данных

Три основных инструмента Pandas — map, apply, applymap

Когда мы используем pandas для обработки данных, мы часто обрабатываем одну строку, несколько строк (также применимы столбцы) или даже все данные во фрейме данных одним и тем же способом. Например, замените мужчину на 1, а женщину на 0 в поле пола в данных. В последнее время я столкнулся со многими подобными потребностями при работе с данными.

В этом случае использование цикла for — очень простой и понятный способ, но очень неэффективный. описано в этой статьеpandasТри основных инструмента в: map, apply, applymap для решения вышеуказанных требований.

Данные моделирования

Через смоделированные данные, чтобы проиллюстрировать использование трех функций, в этом примере научились генерировать различные смоделированные данные. Данные следующие:

import pandas as pd
import numpy as np

boolean = [True, False]
gender = ["男","女"]
color = ["white","black","red"]

# 好好学习如何生成模拟数据:非常棒的例子
# 学会使用random模块中的randint方法

df = pd.DataFrame({"height":np.random.randint(160,190,100),
                     "weight":np.random.randint(60,90,100),
                     "smoker":[boolean[x] for x in np.random.randint(0,2,100)],
                     "gender":[gender[x] for x in np.random.randint(0,2,100)],
                     "age":np.random.randint(20,60,100),
                     "color":[color[x] for x in np.random.randint(0,len(color),100)]
                    })
df.head()

map

demo

map()Указанная последовательность будет отображена в соответствии с предоставленной функцией.

Первая функция-параметр вызывает функцию-функцию с каждым элементом в последовательности параметров и возвращает значение, содержащее возвращаемое значение каждой функции-функции.новый список.

map(function, iterable)

Фактические данные

Изменить мужской пол на 1 и женский на 0

# 方式1:通过字典映射实现
dic = {"男":1, "女":0}  # 通过字典映射
df1 = df.copy()   # 副本,不破坏原来的数据df
df1["gender"] = df1["gender"].map(dic)
df1

# 方式2:通过函数实现
def map_gender(x):
    gender = 1 if x == "男" else 0
    return gender

df2 = df.copy()
# 将df["gender"]这个S型数据中的每个数值传进去
df2["gender"] = df2["gender"].map(map_gender)
df2

apply

applyкак работает метод иmapМетод аналогичен, разница в том, чтоapplyМожет передавать функции с более сложными функциями, можно сказать, что apply является расширенной версией карты.

пандыapply()функция может воздействовать наSeriesили весьDataFrame, функция также заключается в автоматическом обходе всегоSeriesилиDataFrame, запускает указанную функцию для каждого элемента.

существуетDataFrameВ большинстве методов объекта будетaxisЭтот параметр определяет, выполняется ли указанная вами операция по оси 0 или по оси 1.axis=0представляет пару действий列columnsпровести,axis=1представляет пару действий行rowпровести

demo

  1. В приведенных выше данных от значения поля age отнимите 3, то есть прибавьте -3
def apply_age(x,bias):
    x + bias
    
df4 = df.copy()
# df4["age"]当做第一个值传给apply_age函数,args是第二个参数
df4["age"] = df4["age"].apply(apply_age,args=(-3,))
  1. Рассчитать ИМТ
# 实现计算BMI指数:体重/身高的平方(kg/m^2)
def BMI(x):
    weight = x["weight"]
    height = x["height"] / 100
    BMI = weight / (height **2)
    
    return BMI

df5 = df.copy()
df5["BMI"] = df5.apply(BMI,axis=1)  # df5现在就相当于BMI函数中的参数x;axis=1表示在列上操作
df5 

Краткое описание операции применения данных DF:

  1. когдаaxis=0когда, да每列columnsвыполнить указанную функцию; когдаaxis=1когда, да每行rowВыполнить указанную функцию.
  2. несмотря ни на чтоaxis=0все ещеaxis=1, форма по умолчанию, переданная в указанную функцию,Series, можно установитьraw=Trueвходящийnumpy数组.
  3. После выполнения результатов для каждой серии результаты будут интегрированы и возвращены (если вы хотите иметь возвращаемое значение, вам нужно определить функциюreturnсоответствующее значение)

применять требования к реализации

Вышеупомянутые требования преобразования пола реализуются с помощью метода применения.Первый параметр, передаваемый в методе применения, должен быть функцией.

applymap

Данные пеленгации плюс 1

Функция applymap используется для выполнения одной и той же функциональной операции над каждым элементом в данных типа DF, например, следующая плюс 1:

Сохраняйте 2 значащие цифры