更改

使用Pandas统计元素出现次数

添加1,302字节, 2023年2月11日 (六) 17:39

撤销51.142.170.252（讨论）的版本8685

import numpy as np

df = pd.DataFrame({'姓名':['张三','李四','王五','赵六','刘七'],'性别':['男','女','男','男','女'],'年龄':[25,17,30,20,17],'兴趣':['篮球','跑步','排球','游泳','足球']})

[[File:PythonPandasStat1.png]]

2.使用print(df['性别'].count())即可输出“性别”的统计次数。

[[File:PythonPandasStat2.png]]

3.使用print(df['性别'].nunique())即可输出“性别”的不重复个数。

[[File:PythonPandasStat3.png]]

4.使用print(df['性别'].unique())即可输出“性别”的不重复值。

[[File:PythonPandasStat4.png]]

5.使用print(df['性别'].value_counts())即可输出“性别”为“男”的个数为3，“性别”为“女”的个数为2。

[[File:PythonPandasStat5.png]]

6.使用print(df.loc[df['性别'] == '男'.value_counts())即可单独输出“性别”为“男”的所有值。

[[File:PythonPandasStat6.png]]

7.使用print(list(df.性别).count('男'))即可单独输出“性别”为“男”的个数为3。

[[File:PythonPandasStat7.png]]

8.使用print((df == 1).sum())即可将DataFrame中所有值为1的数据个数统计。

import pandas as pd

import numpy as np

df = pd.DataFrame({'第一列':['a',1,'1','one','two'],'第二列':['a','one',1,2,'one'],'第三列':['a',2,1,'one','b']})

print(df)

print('数字1的总次数:\n',(df==1).sum())

print('单词one的出现次数:\n',(df=='one').sum())

print('字母a的出现总次数：\n',(df=='a').sum())

[[File:PythonPandasStat8.png]]

1,138

个编辑