Lucene 性能

Lucene performance(Lucene 性能)

本文介绍了Lucene 性能的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

能否请您就 lucene 性能应遵循的步骤提出建议.尤其是大数据(大约 1TB 的 pdf 文件要被索引)

could you please suggest on the steps to be followed for lucene performance. especially with large data (around 1TB of pdf files to be indexed)

推荐答案

  1. 阅读 扩展 Lucene 和 Solr.
  2. 从 Lucene 定义您的需求(例如:您正在为 PDF 编制索引 - 您需要存储全文,只是为了使其可搜索,还是根本不需要?)
  3. 做一个小规模的实验——索引几个文档,看看检索是否足够好.
  4. 尝试对整个内容进行索引(考虑论文中关于快速索引和索引以提高检索速度的提示)- 检索是否足够好?性能够好吗?
  5. 迭代.

这篇关于Lucene 性能的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本文标题为:Lucene 性能

基础教程推荐