你能用这个插件做什么?
wordpress的Crawlomatic多站点Scraper Post Generator插件是一个突破性的网站爬行和抓取、后生成器自动博客插件,它使用网站爬行和刮擦将您的网站变成自动博客甚至赚钱机器!
从几乎任何网页获取内容!您不再需要API,它需要注册并提供有限的访问权限,您还可以从非API提供网站检索数据。安排一次,让它像大师一样全天候为你自动驾驶你的帖子!
它是如何工作的?
此插件将对您提供的种子URL进行爬网(爬网意味着它将搜索网页包含的所有链接),并访问每个已爬网的URL并从中提取内容。爬网过程是可自定义的:您可以设置爬网深度、爬网速率、最大已爬网文章数、仅爬网具有特定类或ID的链接以及更多自定义设置。
Crawlomatic v2.0更新
在v2.0更新中,插件中添加了一个新的实时scraper快捷代码:[crawlomatic scraper]。这个新功能使这个插件成为wordpress易于实现的web数据提取器。因此,它可以用于将任何网站的实时数据直接显示到您的帖子、页面或侧边栏中。它还临时缓存抓取的内容,这样你的网站就不会过度使用资源。您可以使用此插件来包括实时股票报价、板球或足球比分或任何其他来自公共域的通用内容!
此更新中包含的新功能:
抓取的输出可以通过自定义模板标签、页面中的短代码、帖子和侧边栏(通过文本小部件)显示。
可配置的刮取数据缓存。缓存超时可以定义为每个抓取数据的分钟数。
可以为每次刮片设置刮片器的可配置Useragent。
可配置的默认设置,如启用、用户代理、超时、缓存、错误处理。
查询内容的多种方式–CSS Selector、XPath或Regex、自动检测。
用于分析内容的各种参数。
将post参数传递到要抓取的URL的选项。
将抓取的内容动态转换为指定的字符编码,以使用不同的字符集从网站抓取数据。
动态生成URL,根据页面的获取或发布参数来抓取或发布参数,创建动态抓取页面。
用于对抓取数据进行高级解析的回调函数。
查看v2更新的官方文档,浏览示例并查看常见问题解答,了解如何制作一个完美优化的web scraper。
有关插件的更多信息
你几乎可以从你在浏览器中打开的每个网站上抓取内容。如果内容是使用JavaScript加载的,则插件可以与PhantomJS组合,以抓取JavaScript生成的内容。
此外,您还可以自动生成数量不限的自定义网站抓取和抓取。
其他插件功能:
v2.5.5更新:如果源网站发生更改,则自动更新已抓取的帖子/页面/产品 如果已抓取的URL在源网站上不再可用,则取消发布(设置为草稿)帖子/页面或产品(可选功能,可以启用/禁用)
v2.5.1更新:从其他WooCommerce/shopify商店抓取WooCommCommerce产品变体
v2.5.0更新:从谷歌或必应上为您的自定义关键词搜索抓取搜索引擎结果。查看此新功能的教程视频。
v2.4.1更新:抓取WooCommerce产品的产品图片库(对于非产品帖子类型,帖子附件将根据抓取的图片创建)
v2.3.5更新:在抓取的HTML上执行您自己的JavaScript代码并抓取结果-只有在使用无头浏览器进行抓取(Puppeteer/Tor/PantomJS)或HeadlessBrowserAPI时,此功能才可用
v2.2.1更新:抓取RSS提要中的链接并抓取其中列出的文章
v2.2.0更新:使用HeadlessBrowserAPI从互联网上的任何网站抓取JavaScript生成的HTML内容,而无需在服务器上安装任何东西(除此插件外)-教程视频
v2.1.0更新:使用Tor浏览器和Puppeter从暗网中抓取.onion网站!–教程视频
v2.0.0更新:添加了Live Scraper快捷代码,以获得更大的爬行控制和抓取能力:[爬行爬行器]
v1.7.1更新:支持站点地图抓取-视频教程
v1.6.5更新:增加了对视觉内容选择器的支持-视频教程
v1.6.0更新:增加了抓取页面的屏幕截图功能,并在生成的帖子内容中使用它们-视频教程
v1.5.2更新:使用Short.st链接缩短服务缩短传出(后源)链接(并将其货币化)的能力-缩短链接的示例
v1.4.8更新:增加了对已爬网页面的JavaScript执行支持-需要在服务器上安装PhantomJS-如何安装Phantom Js?-视频教程
v1.4.4更新:增加了为抓取页面设置多个代理的功能。插件将在每次访问页面时随机选择一个
v1.4.0更新:添加了分页爬网功能(文章的爬网将在种子页面的下一页继续)。
v1.4.0更新:增加了导入已爬网产品的产品价格的功能(兼容WooCommerce) 自动修改直运价格-视频教程
v1.4.0更新:增加了将进口产品价格增加一个固定数字或将其与预定义数字相乘的功能(对于直运来说非常有价值!)
v1.2.8更新:添加了分页帖子导入支持(到单个已爬网的帖子中)检查:视频。
v1.2.4更新:增加了为爬网页面设置代理的功能
v1.2.3更新:添加了一个选项,当直接爬网失败时从谷歌缓存中爬网页面(已阻止)
谷歌翻译支持–选择您想要发布文章的语言
Text Spinner支持-自动修改生成的文本,用同义词更改单词-内置、The Best Spinner、SpinRewriter、WordAI、TurkceSpin等-极具SEO价值!
可自定义生成的帖子状态(已发布、草稿、挂起、私有、垃圾)
列出此插件生成的所有帖子的快捷代码:[crawlomatic list posts type=’any’,order=’ASC’,’orderby’=’date’,’posts’=50,’category’=”,’ruleid’=”]
爬行和抓取可以设置为尊重网站的robots.txt文件和抓取页面的robots HTML头
从市场项目自动生成帖子类别或标签
手动向项目添加帖子类别或标记
声明:本站所有资源版权均属于原作者所有。更多说明请参考 VIP介绍。禁止复制、盗用、采集、发布本站内容到任何网站、等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需安装,修复,wordpress主题定制,wordpress插件开发,shopify主题定制,shopify开发,请与我们联系。