微信公众号抓取

URL 解析

公众号文章地址

链接:http://mp.weixin.qq.com/s?__biz=XXX&mid=XXX&idx=XXX&sn=XXX

  • __biz 公众号的一个外部 id
  • mid 推送消息的编号,每次推送一组消息会产生一个 mid
  • idx 文章在消息中的位置,第一条 idx 为 1
  • sn 一个加密字段,如果没有这个字段,无法打开文章

二维码接口

http://mp.weixin.qq.com/mp/qrcode?scene=10000004&size=XXX&__biz=MzA5Njg3MjAzOA==

微信 UA

Mozilla/5.0 (Linux; Android 6.0.1; Redmi Note 4X Build/MMB29M; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043305 Safari/537.36 MicroMessenger/6.5.8.1060 NetType/WIFI Language/zh_CN

万能 key

获得账号认证信息,https://mp.weixin.qq.com/mp/getverifyinfo?__biz=MjM5NjM4MDAxMg==,2017 年 7 月万能 key 已经失效

如果包含个人字样,则是个人账号,否则是公司账号

及时获取更新,请关注公众号“爬虫技术学习”(spider-learn)

多年大厂求职&面试官经验,简历付费优化,¥ 500/次。

公众号“爬虫技术学习(spider-learn)”

About 逸飞

后端工程师

发表评论

邮箱地址不会被公开。 必填项已用*标注