抓取百度贴吧信息,并短信发送最新动态

貌似网上还没有人做这个东西,或者详细分析贴吧的DOM结构,所以这个应用原创的成分比较大,出于一点点的私心,我就不上代码了,不然被搜索引擎找到就不太好了,有意私下找我要。

我简单说下原理:
1.一个脚本命名为kv.php 每隔十分钟把所有人订阅的贴吧名字与ID,装入内存中
2.一个脚本命名为tieba.php每隔一分钟去抓取一个贴吧的最新50条帖子,抓取完毕把该贴吧信息从内存中删除,以便下次抓取下一个贴吧,因为每一分钟只从内存中读入一个贴吧的信息。抓取完毕后,分析所有帖子信息,做出如下判断:
(1)为最新帖子:
存入数据库,并标记为待抓取的帖子(注意,待抓取的帖子是说,要抓取该帖子的最新回复);
(2)不是最新帖子:
与数据库存在的帖子做比较,判断是否需要抓取最新动态
3.一个脚本为detial.php,每隔一分钟运行一次,抓取标记过的最新帖子
4.一个脚本为mail.php ,查询出每个待发送短信的帖子,查询出订阅该帖子所在贴吧信息的人的电话号码,139邮箱发过去,接下来就等着短信喽,昨晚手机爆掉了,收了五百多条短信。
有想用这个应用的联系我,奋进网群里有我的QQ号,发送格式为手机号+所订阅的贴吧名(限制为最多两个贴吧,且该贴吧会员数不超过一百,河海吧不受限制);、
以后接着更新

Leave a Reply

Time limit is exhausted. Please reload CAPTCHA.

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据