随着互联网技术的发展和网络信息的海量增长,综合运用搜索引擎、分词系统、任务与索引系统等技术,获取海量数据。数据采集后,将进行分拣、过滤、分类、分组及二次加工,实现网络数据的价值最大化。后期数据还可以与数据挖掘技术、智能展示服务进行结合,实现数据全生命同期的信息化管理、处理及利用,实现数据的价值最深化。
利用互联网搜索引擎,按照定义的规则和标准,有针对性地面向各种业务,准确地抓取数据。
使用自定义表单,业务数据由用户根据自身应用设计,其它逻辑控制数据由系统自动生成。
系统支持自适应采集、集群采集,可根据采集过程收集到的系统反馈消息,调整采集模式。
采集结果可与展示和挖掘工具结果,实现各种报表的输出。
支持多种采集方式:登录、代理、列表、内容分页等。
可采集多种数据如图片、附件、音频,视频等文件或附件,附件可与正文自动映射与关联。
实现采集过程、采集情况的图形监控,可记录操作内容、操作人及操作时间等。