| Internet 新闻收集工具: NewsCollect |
这是一个在 Internet 上收集新闻的解决方案。
简介:
NewsCollect是一个可以在 Internet
上按照一定规则,从网页中抽取 URL,从而打开更多的网页,然后从这些网页中抽取出你需要的信息。该版本是试用版,只有一个线程,并且只能收集100条新闻。但是已经可以搜索新闻并导出新闻稿件。特别适合于新闻、媒体、网站等进行新闻自动收集用途。
特点:
1。采用关键词对 HTML
文本进行全文匹配,适合于搜索任意类型的新闻。
2。采用搜索规则,可以更加精确的进行搜索,同时对各种类型的网页都可以进行搜索。
3。尤其适合于搜索条件不断准确的渐进式搜索。
4。采用多线程技术,搜索更加快速;采用动态界面技术,使用更加直观、方便。
性能:
1。可以分析、抽取任何文本信息。
2。可以自由构造 URL,特别适合于交互式网站。
3。良好的文本分析规则,可以对各种复杂情况进行扩展分析。
4。丰富的结果汇总、去重、过滤功能,使得搜索更加得心应手。
5。不断丰富的功能。
6。大约速度为 10-15页/分钟(50线程)。