关于Lucene检索数据库的几个问题:(50分)

  • 主题发起人 小灰兔
  • 开始时间

小灰兔

Unregistered / Unconfirmed
GUEST, unregistred user!
1、如何增量索引数据库的动态更新?
我的想法是从数据库的日志中得到数据库所做的改动,如插入、删除和更新,然后将这些改动做增量索引,然后合并到原有的索引中!
2、我的SQL SERVER 2000数据库中有image字段,存储了一些文件,如TEXT、WORD、PDF等。如何索引和检索这些文件?我在资料中看到了:
Field 的其中一个方法是
public static final Field Text(String name, Reader value)
Constructs a Reader-valued Field that is tokenized and indexed, but is not stored in the index verbatim. Useful for longer text fields, like "body".
我使用的是
ResultSet.getCharacterStream("字段名") 返回的一个Reader。传给Field.Text()方法。不知道这种方法行不行?
但是经过我试验,好像如果存储在该字段中的文件是纯文本文件或者是HTML文件的时候可以,如果存储的是WORD、PDF好像不行。是不是如果是WORD、PDF文件必须使用相应的Parser或者是将这些文件中的文本信息抽取出来?
 
你好,我帮不了你,但我想请你帮帮我,我以前没学过java,不过现在要搞一个全文搜索的东西,主要搜索本机的,我想试一试lucene,不知该如何下手。我想先试一下demo,但运行不了,要如何配置系统。??请帮忙。我的邮箱号:cloudymoon@163.com..谢谢
 
你好,我帮不了你,但我想请你帮帮我,我以前没学过java,不过现在要搞一个全文搜索的
东西,主要搜索本机的,我想试一试lucene,不知该如何下手。我想先试一下demo,
但运行不了,要如何配置系统。??请帮忙。我的邮箱号:cloudymoon@163.com..谢谢
 
顶部