发布于 2014-06-25 22:26:30 | 135 次阅读 | 评论: 0 | 来源: 网友投递
Apache Lucene全文检索引擎工具包
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Apache Lucene 4.9.0 发布,此版本包括大量的 bug 修复,优化和改进,现已提供下载。
Lucene 4.9.0 值得注意的改进: * New Terms.getMin/Max methods to retrieve the lowest and highest terms per field. * New IDVersionPostingsFormat, optimized for ID lookups that associate a monotonically increasing version per ID. * Atomic update of a set of doc values fields. * Numerous optimizations for doc values search-time performance. * New (default) Lucene49NormsFormat to better compress certain cases such as very short fields. * New SORTED_NUMERIC docvalues type for efficient processing of multi-valued numeric fields. * Indexer passes previous token stream for easier reuse. * MoreLikeThis accepts multiple values per field. * All classes that estimate their RAM usage now implement a new Accountable interface. * Lucene files are now written by (File)OutputStream on all platforms, completely disallowing seeking with simplified IO APIs. * Improve the confusing error message when MMapDirectory cannot create a new map. 更多内容请看 CHANGES.txt。
Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Lucene最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构的研究。他贡献出Lucene的目标是为各种中小型应用程式加入全文检索功能。
OSChina 使用 Lucene 实现全文搜索。