python第三方库pandas是很多开发者都会去使用的一个数据分析和处理软件包,而它也有很多不同的方法来实现数据筛选功能。下面文章所要来介绍的内容就是pandas库筛选数据的方法,感兴趣和想要了解一下的小伙伴可以继续往下看看哦。
1.首先需要知道pandas库一般都是以Dataframe这个行列表格形式的结构来保存数据的,而筛选数据指的就是从该结构之中将自己所需要的数据取出来。而筛选数据最简单方式就是取哪些行的数据,代码如下:
# 取3-5行数据 import pandas as pd df = DataFrame(pd.read_csv(test.csv)) data=df.loc[2:5]
2.第二种方式就是与行相等的从列中筛选数据出来了,不过这种方式是会从df对象之中将某列中具有指定值的数据给筛选出来。它可以同时指定多个列和多个值来实现多条件数据筛选,代码如下所示:
# 多条件 data_many=df[(df['ane']== 2)&(df['pqr']== 3)] # 多值 data_many=df[df['name'] in [20,30]]
3.筛选出某列中以指定字符串开头的数据,或者是以包含有指定字符串的数据。这些都是会将该筛选后数据所在的一行全部都给获取到,代码示例如下所示:
# 开头 cond=df['age'].str.startswith(’十七’) # 中间 cond=df['列名'].str.contains('值')
4.而很常见的一种数据筛选方式就是通过行和列来得到某一个单元格的的数据,一般只有在需要及其准确的数据时才会使用这种方式,详细代码示例如下所示:
print(ridership_df.iloc[4,0])
以上就是关于“Python中的pandas库如何筛选数据?Pandas筛选数据的方法有哪些”的全部内容了,希望对你有所帮助。