更改

使用Pandas统计元素出现次数

添加1,302字节, 2023年2月11日 (六) 17:39
撤销51.142.170.252讨论)的版本8685
import numpy as np
df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']})
 
[[File:PythonPandasStat1.png]]
 
2.使用print(df['性别'].count())即可输出“性别”的统计次数。
 
[[File:PythonPandasStat2.png]]
 
3.使用print(df['性别'].nunique())即可输出“性别”的不重复个数。
 
[[File:PythonPandasStat3.png]]
 
4.使用print(df['性别'].unique())即可输出“性别”的不重复值。
 
[[File:PythonPandasStat4.png]]
 
5.使用print(df['性别'].value_counts())即可输出“性别”为“男”的个数为3,“性别”为“女”的个数为2。
 
[[File:PythonPandasStat5.png]]
 
6.使用print(df.loc[df['性别'] == '男'.value_counts())即可单独输出“性别”为“男”的所有值。
 
[[File:PythonPandasStat6.png]]
 
7.使用print(list(df.性别).count('男'))即可单独输出“性别”为“男”的个数为3。
 
[[File:PythonPandasStat7.png]]
 
8.使用print((df == 1).sum())即可将DataFrame中所有值为1的数据个数统计。
import pandas as pd
import numpy as np
df = pd.DataFrame({'第一列':['a',1,'1','one','two'],'第二列':['a','one',1,2,'one'],'第三列':['a',2,1,'one','b']})
print(df)
print('数字1的总次数:\n',(df==1).sum())
print('单词one的出现次数:\n',(df=='one').sum())
print('字母a的出现总次数:\n',(df=='a').sum())
 
[[File:PythonPandasStat8.png]]
1,138
个编辑