打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
公众号简单爬虫

Ps:经历两个多月家里的麻烦事,泛舟终于又有空更新了。

起因是之前帮一个朋友做一个企业网站,没有啥功能,单纯的展示和发布信息。其实是很简单的事情,随便下载个个人博客源码,改一下,以为就可以了,但是。。。。他要把公众号里的历史信息全部搬到网站上,如果手工一篇一篇复制,那也是及其痛苦的事情,于是泛舟只能用爬虫了。

Ps:本文用51cto的公众号做例子.

好消息是,要的是文章内容,不是点赞数和阅读数,可以免去好大的麻烦。

那么这个任务的目的很简单,复制公众号上的文章,然后粘贴到网站里面。具体需要什么内容呢?安装好网站,然后进入后台,添加文章那里看到:

文章标题,文章作者,文章来源,缩略图,文章描述,文章内容,都是我们需要的内容.其实很好找,除了具体文章内容,其他基本在公众号的历史消息页全部都有了.

就是用爬虫把公众号的所有历史文章都爬下来。然后根据连接,再爬具体网页内容.分两步处理,其中关键是如何爬取历史信息.

需要用到抓包工具Fiddler,思路是这样的:

打开Fiddler软件,清除所有Sessions,

微信电脑版打开需要抓取的公众号历史消息页,

向下滚动,大于10条消息,就是等它加载出二页,转到Fiddler查看

这个就是我们需要的地址,直接点开用浏览器查看,红圈就是关键,我们要修改的参数.

得到这个连接以后,就是已经成功一半了,下一篇文章继续具体的代码.

感谢各位的阅读,望勿喷!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
我是怎么保存公众号历史文章合集到本地的?当然是用python了!
如何批量采集微信公众号文章
Python为什么适合爬虫?常用框架!
安卓版微信终于有了这个新功能,一秒查到公众号里你想要的文章!
微信公众号文章为什么能赚钱?
微信公众号文章“号内搜”新功能玩法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服