打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
火车头采集器第三章第2节:正则提取数据
大家好,我是教程君,这节给大家讲解数据采集第二种方式:正则提取。我们还是用上节采集的光明网:http://politics.gmw.cn/node_9840.htm
我们打开内容采集选择正则提取:

然后打开我们采集到的一个页面:

源代码找出文章起始和结束点:


在正则提取中如下操作:

把首尾部中间添加参数,这样是最简单的正则提取内容数据。这种方式再面对结构复杂的网页内容时更能灵活的采集内容,可以设置多个参数,对参数进行组合。
我们测试看一看:


下面是我找的一个正则表达式的网上教程,学习一些这种表达式能够让你更加灵活的使用这种提取方式。

正则表达式教程:https://www.runoob.com/regexp/regexp-tutorial.html
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【Excel函数教程】VLOOKUP活学活用,IF也能做VLOOKUP的小三?
印度火车头调头的方式,长见识了!
印度火车头调头的方式,之前没看过,长见识了
印度火车头调头的方式,之前没见过,长知识了
?印度火车头调头的方式,之前没见过,长知识了
火车头采集:如何下载文章里面的图片
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服