AnyPapa插件背景简介
现在移动端上有越来越多的内容营销,比如抖音、火山小视频、微信公众号等,如果我们要分析、整理和统计短视频和公众号的各种数据,比如标题、内容、评论等,就会需要爬虫技术来爬取内容,今天小编就为大家推荐一款免费的数据爬虫工具AnyPapa插件。
AnyPapa插件简介
AnyPapa插件是一款开源的免费数据爬虫工具,能够帮你在浏览器中爬到一些需要的数据。可在Chrome浏览器、360浏览器、QQ 浏览器、搜狗浏览器等Chromium内核的浏览器中使用。
AnyPapa插件功能
1、无需写代码,所见即所爬
2、可导出Excel文件
3、无人值守自动爬数
4、支持抖音、快手、微信、微博、天猫等多种网站
AnyPapa插件安装使用
1、AnyPapa插件离线安装的方法参照一下方法:老版本Chrome浏览器,首先在标签页输入【chrome://extensions/】进入chrome扩展程序,解压你在本站下载的插件,并拖入扩展程序页即可。
2、最新版本的chrome浏览器直接拖放安装时会出现“程序包无效CRX-HEADER-INVALID”的报错信息,参照:Chrome插件安装时出现"CRX-HEADER-INVALID"解决方法,安装好后即可使用。
3、插件安装后会出现在浏览器右上方的插件栏中,点击插件图标会出现下图。
4、点击更多设置注册或登陆插件。
5、只要在安装AnyPapa插件的浏览器中打开一篇公众号、知乎话题,或者短视频,浏览器顶部会弹出相关提示,然后便在后台自动爬取相关数据,效果如图:
6、点击本地数据,然后选择相关数据源,即可查看刚才爬取到的内容了。爬取到的视频数据包括点赞数、转发数还有视频地址等等。
7、AnyPapa插件支持的数据源包括知乎话题、爱奇艺视频、微信文章、微信文章评论、豆瓣电影、大众点评等等。
8、点击书签按钮会出现下图,它将自动同步你的浏览器书签,但不会上传到服务器中。
9、点击队列按钮会出现下图,你可以在下方文本框中输入要采集的UPL,每行一个,也可以点击获取任务按钮获取任务。
AnyPapa插件注意事项
1、采集微信数据需要特定微信版本的支持(Windows版确认支持1.x,Mac版确认支持2.2.8及以下,Windows上QQ浏览器自带的微信也支持)。
2、请务必在微信客户端中打开微信文章链接,无论是纯文本的链接或是图文样式的链接。
3、启动分钟监测后,文章大约每分钟刷新一次,自动采集数据。最多持续2小时。监测约2小时后,请重新在微信对话框中点击文章链接。
AnyPapa插件联系方式
wentao@toobigdata.com