панды обрабатывают повторяющиеся значения

искусственный интеллект

Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность

Пример данных:

import pandas as pd

df = pd.DataFrame({'a':['Python', 'Python', 'Java', 'Java', 'C'], 'b': [2, 2, 6, 8, 10]})
df

在这里插入图片描述

Проверять, только если один столбец имеет повторяющиеся значения

  1. использоватьvalues_counts()Подсчитайте количество вхождений значений в столбце. По умолчанию результаты сортируются в порядке убывания, и необходимо только определить, равно ли число вхождений значения первой строки 1, чтобы определить, имеются ли повторяющиеся значения.
df['a'].value_counts()

在这里插入图片描述

  1. использоватьdrop_duplicates()Удалите повторяющееся значение, оставьте только значение, которое появляется впервые, и оцените, совпадает ли обработанное значение с исходным значением.dfравно, еслиFalseозначает, что есть повторяющиеся значения.
df.equals(df.drop_duplicates(subset=['a'], keep='first'))

False

Проверьте, есть ли во всех столбцах повторяющиеся строкитакже использоватьdrop_duplicates()Удалите повторяющиеся значения и сохраните только первое вхождение значения, которое в настоящее время неприменимо.subsetСтолбец настройки параметров, по умолчанию все столбцы, чтобы определить, совпадает ли обработанное значение с исходным.dfравно, еслиFalseозначает, что есть повторяющиеся значения.

df.equals(df.drop_duplicates(keep='first'))

False

Подсчитайте количество повторяющихся строк

len(df) - len(df.drop_duplicates(keep="first"))

Показать повторяющиеся строки данныхСначала удалите повторяющиеся строки, оставьте только первое вхождение, получите набор данных, уникальный для строк, а затем используйтеdrop_duplicates()УдалитьdfВсе повторяющиеся данные вdrop_duplicates()Дедупликация вновь созданного набора данных может получить данные о повторяющихся строках.

df.drop_duplicates(keep="first").append(df.drop_duplicates(keep=False)).drop_duplicates(keep=False)

在这里插入图片描述

Для началаPythonИли хотите начатьPythonдрузей, вы можете искать на WeChat [Python新视野], чтобы общаться и учиться вместе, все они исходят от новичков. Иногда простой вопрос застревает надолго, но, может быть, кто-то другой вдруг поймет его с небольшой помощью. Я искренне надеюсь, что все вместе смогут добиться прогресса.