号码采集器使用须知
360安全卫士,会频繁的对云菠萝号码采集软件做无意义的告警,请一律选择“信任”。否则软件会无法正常运行,会莫名其妙的自动退出,360也会拦截云菠萝电话号码采集器软件的网络访问过程,导致号码采集器采集过程无法运行。或者请更换其它任意的安全软件,如腾讯的电脑管家等,都不会出现无意义的安全告警。
试用账号:test 密码:123456
云菠萝号码采集器 功能
內容网页页面的深层嵌套循环浏览:
指完成模板网页页面的無限嵌套循环浏览能力,能够将分散化在好几个网页页面内的不一样內容内容一次性合拼采集。针对繁杂的采集新项目,将会必须应用该功能。
多模板功能:
对每一个采集新项目的每一个总体目标网页页面能够订制好几个模板,系统软件会自动识别最好的模板开展采集配对。针对內容网页页面款式、版块非单一的采集新项目,必须应用此多模板功能。
父子俩表功能
指采集結果的储存能够应用多个数据库表来联合储存,默认设置有且务必有一个主表,可选数个子表。视采集新项目的复杂性,繁杂采集新项目将会必须该功能。
基本仿真模拟发布功能:
指将采集結果,根据web发布方式开展发布,其全过程是仿真模拟人工服务手工制作发布实际操作。只适用单一发布网页页面。此功能是小熊猫采集手机软件的基础功能之一,全部版本号均具有该项功能。但该项功能不同于“多级别仿真模拟发布功能”。
多级别仿真模拟发布功能:
功能上类似“基本仿真模拟发布功能”,但适用好几个发布网页页面的联合发布。比如:公司基本资料和公司好几个产品资料的一次性联合采集后的一次性联合发布;社区论坛贴子文章正文和全部回应內容的一次性联合采集后的一次性联合发布;招骋公司的基本资料和全部招聘岗位的一次性联合采集后的一次性联合发布;这些。
文章正文全自动分析功能:
指由系统软件全自动剖析网页页面的题目、文章正文內容,已不必须界定內容网页页面模板。能够全自动分析新闻报道、社区论坛、blog等流行內容。是舆情系统必需功能。
搜索关键词采集功能:
依靠各种百度搜索引擎的全网搜索能力,立即输入关键字,就可以采集全网搜索客户资料。是舆情系统必需功能。
海量信息髙速配对模块:
含网站地址可重复性配对和文章内容类似配对。具有大量规模性客户资料数据信息的髙速解决能力。可完成对采集結果文章内容的词性标注功能,高频词汇的剖析获取功能,最类似文章内容排序功能,反复(类似)文章内容的过虑功能等。
单独的云计算技术桥介网络服务器 可建立自身专用型的、单独的云计算技术群集。大中型采集监控器新项目才有必须应用。
全部基本基础功能:
除本网页页面非常列举外的其他全部功能。在其中包含:自动升级、多个任务c#多线程、分页查询內容合拼、cookie仿真模拟登陆、动态性cookie、多数据库引擎的适用、FTP上传、压缩文件下载、時间提早、原创文章、仿真模拟发布、OCR图文识别、这些。等于传统式采集手机软件的详细功能!
浏览间距:
指采集手机软件在采集运作时,邻近2次浏览采集网址的时间间隔。是以便不给采集浏览网址导致显著浏览工作压力而作出的自我约束要求,不一样版本号的小熊猫采集手机软件对浏览间距干了相对的限定。