需要构建一个实时的全文搜索系统,要撑住5000+的并发,可分布式,用JAVA的Lucene开源来实现,我需要怎么样使用其他的一些开源项目来支撑这个搜索系统,有高性能的非JAVA实时全文检索开源项目推荐参考也行。
lucene java
我们基于lucene的搜索在千万数据级别下压测单机3万并发是没问题的,这和lucene本身索引机制有关,如仅搜索而言,在合理的索引下瓶颈在磁盘吞吐,所以一块高速SSD即可解决问题,所以并不需要你说的那些架构,选择一个最适合你们项目的分词,尽量提高磁盘吞吐降低寻道时间是lucene搜索的关键点
Lucene 4 setBoost 异常
Lucene3.5实现对泰语的分词、搜索!
lucene和数据库有什么相同点和不同点呢?
lucene如体做中英文分词搜索
lucene solr 是否支持string类型字段排序
lucene 如何实现超复杂SQL查询的功能?