打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【demo】python 按照标签分组取前N行
强烈推介IDEA2021.1.3破解激活,IntelliJ IDEA 注册码,2021.1.3IDEA 激活码
  1. import pandas as pd

  2. train_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\tagging.tsv', sep='\t',encoding='utf-8',index_col=0,header=None,

  3. names=['label', 'textA', 'textB'])

  4. train_data.drop_duplicates(inplace=True)

  5. df = pd.DataFrame(train_data)

  6. grouped = df.groupby(['label']).head(3000)

  7. grouped = grouped.sort_values(['label'], ascending=True)

  8. #

  9. print(grouped)

  10. grouped.to_csv('E:\\tmp\\2\\tagging2.tsv',

  11. sep='\t',

  12. encoding='utf-8',

  13. header=None)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
文件转换为utf
Pandas也能爬虫?还如此简单!
Python写的csv文件,如何让 Excel 双击打开不乱码?
如何正确读入文本数据不乱码(解决文本乱码问题)
pandas数据统计
【Python数据分析】第二篇
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服