• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧

抓取源码 – php有没有功能完整的网页数据采集开源项目呢

PHP admin 1年前 (2018-06-08) 8次浏览 未收录 0个评论
文章目录[隐藏]

请问有没有开源的工具来采集网页的数据

比如要包含连续规则抓取,例如先抓取分页信息,从中获取详情页,从详情页抓取真正需要的dom字段

包含最后自定义存到数据库,

包含可以伪造ip等

包含自动队列机制,自动延迟

等等

谢谢

回复内容:

请问有没有开源的工具来采集网页的数据

比如要包含连续规则抓取,例如先抓取分页信息,从中获取详情页,从详情页抓取真正需要的dom字段

包含最后自定义存到数据库,

包含可以伪造ip等

包含自动队列机制,自动延迟

等等

谢谢

有,你可以试试【神箭手云爬虫开发平台。】
神箭手云爬虫是一个帮助JS开发者快速开发爬虫系统的SaaS服务平台。神箭手提供上手简单,灵活开放的云爬虫开发框架,让开发者只需要在线写几行js代码就可以实现一个爬虫。并且爬虫将自动运行在云服务器上,爬取速度更快,效率更高。

phpcrawler,php爬虫,php采集器,多进程,多线程

phpQuery


39MO , 版权所有丨如未注明 , 均为原创丨转载请注明原文链接:抓取源码 – php有没有功能完整的网页数据采集开源项目呢
喜欢 (0)
[1353713598@qq.com]
分享 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址