RT 最近要用JAVA做一个面向主题的搜索引擎,对这方面还不是很了解,有什么参考资料希望大家推荐一下 我所知道的搜索引擎著名开源项目有Nutch和Heritrix 不知道这两个哪个更适合做这个项目,或者有其它更为方便的?希望有经验的前辈们指教一下 谢谢。
java 搜索引擎 网页爬虫
Apache Lucene Core
爬虫如何设置代理爬被墙网站内容
java web 搜索一般用什么,是不是用搜索引擎,数据量一百万左右
java保存繁体网页打开后出现乱码
我正在写一个爬虫,怎么通过网页内容误别出是否为中文网页?
HtmlUnit爬虫登录搜狐网的时候重定向不成功,得到的是“登录中。。。”的页面。
如何利用java语言编写一个小型的搜索引擎?大致的思路是什么?