对于月休党来说,回家的两天实在是搞不出什么打飞机,在家里闲的很,不知我在整理我的收藏夹以及网盘文件的时候,我突然想起来,不是还有一个"编程猫论坛"吗?那么编程猫主打的是Python,论坛的防护机制做的也不是很好,那我用Python爬虫去爬取论坛的网页数据应该是情有可原的吧?
随意打开一个帖子开始抓包,我先拿爬取编程猫论坛的帖子数。
不错这句是获取帖子信息的请求,分析接口,使用GET方式,加上帖子ID就可以获取帖子的信息了。
当没有此帖子的时候就会返回404。
那么编程猫最早的帖子是什么呢?
由图可知,编程猫最早的帖子ID为54号。网址:
https://shequ.codemao.cn/community/54
找一个最近的帖子,
出现的"断崖层",看来截止目前为止帖子数最多到304265。
我们来做一个新帖自动回复,找一个自己的帖子
测试一下,
这个就不可以简单的调用了,总之通过以上的调用方法可以正常发送一条评论,现在只要循环遍历每一个文章就行了。
开始!
哦,这个机制是防止狂刷,那么我们等待5秒。
我可不想被封号,那就到这里吧。
现在来做做自动点赞。
同样的抓包,
中间的数字应该就是评论ID了,与文章不同,
找了半天终于找到了,现在开始写代码。。。。
结果是第一层全点赞了,若要把回评论需要进一步分析,我本来就图个乐何为呢?
(下期 编程猫刷浏览量)