发布于 2015-07-25 11:32:26 | 328 次阅读 | 评论: 0 | 来源: 网络整理
词组查询用于搜索包含词条的特定序列的文档。
以下是org.apache.lucene.search.PhraseQuery类的声明:
public class PhraseQuery
extends Query
S.N. | 构造函数和说明 |
---|---|
1 | PhraseQuery() 构造一个空的短语查询。 |
S.N. | 方法 & 描述 |
---|---|
1 | void add(Term term) 增加了一个术语的查询短语的末端。 |
2 | void add(Term term, int position) 增加了一个术语的查询短语的末端。 |
3 | Weight createWeight(Searcher searcher) 构造一个适当的重量实现这个查询。 |
4 | boolean equals(Object o) 返回true如果o为等于这一对象。 |
5 | void extractTerms(Set<Term> queryTerms) 加上在此查询到设定的条款发生的所有条款。 |
6 | int[] getPositions() 返回这个词组方面的相对位置。 |
7 | int getSlop() 返回斜率。 |
8 | Term[] getTerms() 返回这个词组条款集合。 |
9 | int hashCode() 返回此对象的哈希码值。 |
10 | Query rewrite(IndexReader reader) 调用重新编写查询到原始查询。 |
11 | void setSlop(int s) 设置了查询短语中两个词之间允许其它词的数量。 |
12 | String toString(String f) 打印这个查询的一个用户可读的版本。 |
这个类从以下类继承的方法:
org.apache.lucene.search.Query
java.lang.Object
private void searchUsingPhraseQuery(String[] phrases)
throws IOException, ParseException{
searcher = new Searcher(indexDir);
long startTime = System.currentTimeMillis();
PhraseQuery query = new PhraseQuery();
query.setSlop(0);
for(String word:phrases){
query.add(new Term(LuceneConstants.FILE_NAME,word));
}
//do the search
TopDocs hits = searcher.search(query);
long endTime = System.currentTimeMillis();
System.out.println(hits.totalHits +
" documents found. Time :" + (endTime - startTime) + "ms");
for(ScoreDoc scoreDoc : hits.scoreDocs) {
Document doc = searcher.getDocument(scoreDoc);
System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
}
searcher.close();
}
让我们创建一个测试Lucene的应用程序中使用PhraseQuery测试搜索。
步骤 | 描述 |
---|---|
1 | 创建下名称为LuceneFirstApplication的一个项目作为解释Lucene的应用在包packagecom.yiibai.lucene下,在第一个应用程序的篇章。也可以使用Lucene创建的项目理解搜索过程。 |
2 | 创建LuceneConstants.java和Searcher.java作为Lucene的解释- 第一应用程序一章。保持其它文件不变。 |
3 | 创建LuceneTester.java如下所述。 |
4 | 清理和构建应用程序,以确保业务逻辑按要求工作。 |
LuceneConstants.java
这个类是用来提供可应用于示例应用程序中使用的各种常量。
package com.yiibai.lucene;
public class LuceneConstants {
public static final String CONTENTS="contents";
public static final String FILE_NAME="filename";
public static final String FILE_PATH="filepath";
public static final int MAX_SEARCH = 10;
}
Searcher.java
这个类用来读取就使用Lucene库的原始数据,并搜索数据的索引。
package com.yiibai.lucene;
import java.io.File;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
public class Searcher {
IndexSearcher indexSearcher;
QueryParser queryParser;
Query query;
public Searcher(String indexDirectoryPath) throws IOException{
Directory indexDirectory =
FSDirectory.open(new File(indexDirectoryPath));
indexSearcher = new IndexSearcher(indexDirectory);
queryParser = new QueryParser(Version.LUCENE_36,
LuceneConstants.CONTENTS,
new StandardAnalyzer(Version.LUCENE_36));
}
public TopDocs search( String searchQuery)
throws IOException, ParseException{
query = queryParser.parse(searchQuery);
return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}
public TopDocs search(Query query) throws IOException, ParseException{
return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}
public Document getDocument(ScoreDoc scoreDoc)
throws CorruptIndexException, IOException{
return indexSearcher.doc(scoreDoc.doc);
}
public void close() throws IOException{
indexSearcher.close();
}
}
LuceneTester.java
这个类是用来测试Lucene库的搜索能力。
package com.yiibai.lucene;
import java.io.IOException;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.PhraseQuery;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
public class LuceneTester {
String indexDir = "E:LuceneIndex";
String dataDir = "E:LuceneData";
Searcher searcher;
public static void main(String[] args) {
LuceneTester tester;
try {
tester = new LuceneTester();
String[] phrases = new String[]{"record1.txt"};
tester.searchUsingPhraseQuery(phrases);
} catch (IOException e) {
e.printStackTrace();
} catch (ParseException e) {
e.printStackTrace();
}
}
private void searchUsingPhraseQuery(String[] phrases)
throws IOException, ParseException{
searcher = new Searcher(indexDir);
long startTime = System.currentTimeMillis();
PhraseQuery query = new PhraseQuery();
query.setSlop(0);
for(String word:phrases){
query.add(new Term(LuceneConstants.FILE_NAME,word));
}
//do the search
TopDocs hits = searcher.search(query);
long endTime = System.currentTimeMillis();
System.out.println(hits.totalHits +
" documents found. Time :" + (endTime - startTime) + "ms");
for(ScoreDoc scoreDoc : hits.scoreDocs) {
Document doc = searcher.getDocument(scoreDoc);
System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
}
searcher.close();
}
}
从record1.txt到record10.txt的文件中包含简单的名称以及学生的其他细节,并把它们放在目录E:LuceneData。这是测试数据。索引目录路径应创建为E:LuceneIndex。期间,运行 Lucene索引程序后- 索引过程中,可以看到该文件夹中创建的索引文件的列表。
一 旦创建源,创造了原始数据,数据目录,索引目录和索引完成后,已经准备好这一步是编译和运行程序。要做到这一点,请LuceneTester.Java文 件选项卡中使用Eclipse IDE可使用Run选项,或使用Ctrl+ F11来编译和运行应用程序LuceneTester。如果您的应用程序一切正常,这将在Eclipse IDE的控制台打印以下消息:
1 documents found. Time :14ms
File: E:LuceneDatarecord1.txt