万能文章采集器-金宝利商贸案例展示-一品威客网

返回案例列表

万能文章采集器

逆风软件出品的一款万能文章采集软件，可输入关键词采集各大搜索引擎网页和新闻，也可以采集指定网站文章。

基于逆风自主研发的正文识别智能算法，能在互联网纷繁复杂的网页中尽可能准确地提取出正文内容。

正文识别有 3 种算法，“标准”、“严格”和“精确标签”。其中“标准”和“严格”是自动模式，能适应绝大多数网页的正文提取，而“精确标签”只需指定正文标签头，如“

”，就能通吃所有网页的正文提取。

关键词采集目前支持的搜索引擎有：百度、搜狗、360、谷歌、必应

采集指定网站文章的功能也非常简单，只需要稍微设置（不需要复杂的规则），就能批量采集目标网站的文章了。

因为墙的问题，要使用谷歌搜索和谷歌转译文章的功能，需要使用VPN换国外IP。

________________________________________________

下面是界面组件的说明：

采集分页：如果正文有分页显示，则自动采集分页合并
删除链接：删除网页中锚文本的链接功能，只留下锚文本的标题
txt 格式：保存成txt文本（自动清除HTML标签）
调试模式：在正文的开头插入“调试模式：标题和链接”的内容，以方便进入原网页对比正文识别效果
标题有关键词：只有标题中包含搜索关键词的网页才采集
放弃短标题：当自动识别的标题的长度低于原始标题三分之一时，即为短标题，通常这种标题是错误的，因此可以勾选放弃它，这样就使用原始标题（此段遇到时自会理解）。

________________________________________________

【精确标签】特别说明：

请使用谷歌浏览器或傲游浏览器，鼠标右键单击正文的开始位置-审查元素，然后定位正文的代码段，将该代码段的标签头复制。

如代码段：

正文部分

，则复制

多个标签可以使用“|”隔开

________________________________________________

关键词采集的文章自动比对本地相同标题的文章，相似度超过60%就跳过，低于60%就自动重命名保存。

特色频道

精选服务

交易保障

企业服务

一品知识产权

一品财税

一品优选

有其屋

企知认证

精彩推荐

V客优享

诚信卫士

一品合同

请慎重交易

未加入诚信卫士计划

万能文章采集器

相关案例

一品威客承担

一品威客获评

一品威客入选

一品威客荣膺

一品威客荣膺

关于我们

交易保障

案例中心

帮助中心

400-128-6668

免费官方金牌顾问

客服

400-128-6668

反馈

400-128-6668

福利

推新用户、任务引荐

推广服务好友成交