发新话题

Lucene 2.4.0 一些过期方法的解决方案

今天更新网站的搜索引擎到Lucene 2.4.0 ,这个是 2008年10月8日发布的版本,结果发现许多方法和类被声明为过期(@deprecated),且某些方法和类被声明在3.0引擎中将被删除。我这里只写出自己用到的几个方法和类,并替换为新版本的。


1 IndexWriter 的构造器
IndexWriter writer = new IndexWriter(indexPath, getAnalyzer(), true);

其中
indexPath 为目录,是一个字符串,
getAnalyzer()是分析器
true 代表重建索引

这个方法需要替换为
IndexWriter writer = new IndexWriter(indexPath, getAnalyzer(), true, IndexWriter.MaxFieldLength.UNLIMITED);

其中前面三个完全相同,
第四个参数代表允许的最大字段长度,UNLIMITED代表不限制长度


2 Field.Index.UN_TOKENIZED
这个被替换为
Field.Index.NOT_ANALYZED
没啥特殊的,改了一个名字而已

Field.Index.TOKENIZED 替换为 Field.Index.ANALYZED

3 IndexWriter.flush();
替换为
IndexWriter.commit();

4 org.apache.lucene.search.Hits;
这个类将在3.0中被删除
新的搜索代码如下
      IndexSearcher isearcher = new IndexSearcher(indexPath);
      BooleanClause.Occur[] clauses = { BooleanClause.Occur.SHOULD, BooleanClause.Occur.SHOULD };

      TopDocCollector collector = new TopDocCollector(10); // 启用这个
      Query query = MultiFieldQueryParser.parse(queryString, new String[] { "subject", "content" }, clauses, getAnalyzer());
      isearcher.search(query, collector); // 作为参数
      ScoreDoc[] hits = collector.topDocs().scoreDocs; // 拿到结果
      List<Long> rtn = new ArrayList<Long>();
      Long id;
      Long idParent;
      int docId;
      for (int i = 0; i < hits.length; i++) { // 循环
        docId = hits[i].doc; // 一个内部编号
        Document doc = isearcher.doc(docId); // 通过编号,拿到文档
      }


以上是我用到的几个修改的地方,希望对大家有帮助
快乐渡过每一天,减肥坚持每一天
编辑 回复 快速回复 TOP
看不懂是什么呀?
编辑 回复 快速回复 TOP
十分感谢!我正在研究2.4
编辑 回复 快速回复 TOP
# TopDocCollector collector = new TopDocCollector(10); // 启用这个
# Query query = MultiFieldQueryParser.parse(queryString, new String[] { "subject", "content" }, clauses, getAnalyzer());
# isearcher.search(query, collector); // 作为参数
# ScoreDoc[] hits = collector.topDocs().scoreDocs; // 拿到结果

这里hits只能获取10个,new TopDocCollector(10);这里参数传入的是多少,hits就只能取多少个。
能不能遍历所有啊?
编辑 回复 快速回复 TOP
发新话题