Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность
Пример данных:
import pandas as pd
df = pd.DataFrame({'a':['Python', 'Python', 'Java', 'Java', 'C'], 'b': [2, 2, 6, 8, 10]})
df
Проверять, только если один столбец имеет повторяющиеся значения
- использовать
values_counts()
Подсчитайте количество вхождений значений в столбце. По умолчанию результаты сортируются в порядке убывания, и необходимо только определить, равно ли число вхождений значения первой строки 1, чтобы определить, имеются ли повторяющиеся значения.
df['a'].value_counts()
- использовать
drop_duplicates()
Удалите повторяющееся значение, оставьте только значение, которое появляется впервые, и оцените, совпадает ли обработанное значение с исходным значением.df
равно, еслиFalse
означает, что есть повторяющиеся значения.
df.equals(df.drop_duplicates(subset=['a'], keep='first'))
False
Проверьте, есть ли во всех столбцах повторяющиеся строкитакже использоватьdrop_duplicates()
Удалите повторяющиеся значения и сохраните только первое вхождение значения, которое в настоящее время неприменимо.subset
Столбец настройки параметров, по умолчанию все столбцы, чтобы определить, совпадает ли обработанное значение с исходным.df
равно, еслиFalse
означает, что есть повторяющиеся значения.
df.equals(df.drop_duplicates(keep='first'))
False
Подсчитайте количество повторяющихся строк
len(df) - len(df.drop_duplicates(keep="first"))
Показать повторяющиеся строки данныхСначала удалите повторяющиеся строки, оставьте только первое вхождение, получите набор данных, уникальный для строк, а затем используйтеdrop_duplicates()
Удалитьdf
Все повторяющиеся данные вdrop_duplicates()
Дедупликация вновь созданного набора данных может получить данные о повторяющихся строках.
df.drop_duplicates(keep="first").append(df.drop_duplicates(keep=False)).drop_duplicates(keep=False)
Для начала
Python
Или хотите начатьPython
друзей, вы можете искать на WeChat [Python新视野
], чтобы общаться и учиться вместе, все они исходят от новичков. Иногда простой вопрос застревает надолго, но, может быть, кто-то другой вдруг поймет его с небольшой помощью. Я искренне надеюсь, что все вместе смогут добиться прогресса.