2020
11-29
11-29
基于Python采集爬取微信公众号历史数据
鲲之鹏的技术人员将在本文介绍一种通过模拟操作微信App的方式采集指定公众号的所有历史数据的方法。通过我们抓包分析发现,微信公众号的历史数据是通过HTTP协议加载的,对应的API接口如下图所示,其中有四个关键参数(__biz、appmsg_token、pass_ticket以及Cookie)。为了能够拿到这四个参数,我们需要模拟操作App,让其产生这些参数,然后我们再抓包获取。对于模拟App操作,前面我们曾介绍过通过Python模拟安卓App的方法(详见http...
继续阅读 >
现在每天都可以看到很多微信分享的链接上面有网站或者商家的自定义的分享标题,和分享链接的描述及分享出去的图像,例如下面的分享出去的链接: 上面这个是微信的js-SDK页面分享给微信好友在聊天列表中显示的视觉效果。 微信JS-SDKDemo:这个是微信网页分享出去的标题。 微信JS-SDK,帮助第三方为用户提供更优质的移动web服务:这个是...
18岁的曹琦岳是一名高三文科生,喜欢历史及国际关系的话题,他开通了一个公众号“历史真有意思”,专门用来转载和历史及国际关系相关的文章。让他惊喜的是,随着粉丝量的逐渐增多,公众号开始有广告收入,现在这个公众号每月能给他带来两三千元的收入。两年前表哥做公众号他也动心了“我的儿子曹琦岳还是一名中学生,他自己做了一个微信公众号,没想到现在这个微信公众号有收入了,一个月能挣两三千元,足够养活他自己了。我觉...