Pandas的条件过滤是使用非常频繁的技巧,在这一节我们将看到各种不同的过滤技巧,如果读者有其它过滤技巧,也欢迎告诉我。
通过loc进行行过滤,并对过滤后的行进行赋值
除了上述的过滤方式外,还可以通过query method来进行过滤查询,如下:
在数据处理的过程中,空值判断是非常常用的技巧,在Pandas中我们主要通过以下几种方式来判断空值。
将isnull用于过滤条件:
notnull的使用与isnull类似,如下:
需要注意的是判断dataframe中某个值是否为空,不能直接用== np.nan来判断,而需要使用np.isnan函数如下
使用isin函数
当有多个过滤条件时,我们就需要使用逻辑操作符&
, |
,如下:
在实际项目中,很多时候我们根据条件选取了一些行之后,我们要针对这些行中的数据需要做些操作(比如针对age进行加1操作),更复杂的我们需要获取本行的其它列的数据共同计算和判断。这里我们可以使用如下技巧:
关于vectorization矢量化的相关议题,可以参考文章Pandas系列4-数据矢量化
联系客服