打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Pandas系列5

Pandas的条件过滤是使用非常频繁的技巧,在这一节我们将看到各种不同的过滤技巧,如果读者有其它过滤技巧,也欢迎告诉我。

条件过滤与赋值

通过loc进行行过滤,并对过滤后的行进行赋值

除了上述的过滤方式外,还可以通过query method来进行过滤查询,如下:

空值判断

在数据处理的过程中,空值判断是非常常用的技巧,在Pandas中我们主要通过以下几种方式来判断空值。

  • isnull函数: 用于针对Series、DataFrame判断是否为null
  • notnull函数: 用于判断非null值
  • np.isnan函数: 用于针对某个标量值进行判断是否为nan(null)。需要注意的是这个函数不能用于字符串类型的值进行判断,因此如果array中有字符串类型,需要用其它方式进行判断,如isinstance
isnull函数

将isnull用于过滤条件:

notnull函数

notnull的使用与isnull类似,如下:

np.isnan函数

需要注意的是判断dataframe中某个值是否为空,不能直接用== np.nan来判断,而需要使用np.isnan函数如下

isin函数

使用isin函数

多过滤条件

当有多个过滤条件时,我们就需要使用逻辑操作符&, |,如下:

过滤后的赋值计算

在实际项目中,很多时候我们根据条件选取了一些行之后,我们要针对这些行中的数据需要做些操作(比如针对age进行加1操作),更复杂的我们需要获取本行的其它列的数据共同计算和判断。这里我们可以使用如下技巧:

关于vectorization矢量化的相关议题,可以参考文章Pandas系列4-数据矢量化

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
python pandas消除空值和空格的混淆
数据分析之基于pandas的数据清洗
为什么我们需要数据预处理?
dataframe缺失值(NaN)处理
这些方法解决了数据清洗80%的工作量
SAS,R和Python应对数据管理和分析挑战
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服