小
小灰兔
Unregistered / Unconfirmed
GUEST, unregistred user!
1、如何增量索引数据库的动态更新?
我的想法是从数据库的日志中得到数据库所做的改动,如插入、删除和更新,然后将这些改动做增量索引,然后合并到原有的索引中!
2、我的SQL SERVER 2000数据库中有image字段,存储了一些文件,如TEXT、WORD、PDF等。如何索引和检索这些文件?我在资料中看到了:
Field 的其中一个方法是
public static final Field Text(String name, Reader value)
Constructs a Reader-valued Field that is tokenized and indexed, but is not stored in the index verbatim. Useful for longer text fields, like "body".
我使用的是
ResultSet.getCharacterStream("字段名") 返回的一个Reader。传给Field.Text()方法。不知道这种方法行不行?
但是经过我试验,好像如果存储在该字段中的文件是纯文本文件或者是HTML文件的时候可以,如果存储的是WORD、PDF好像不行。是不是如果是WORD、PDF文件必须使用相应的Parser或者是将这些文件中的文本信息抽取出来?
我的想法是从数据库的日志中得到数据库所做的改动,如插入、删除和更新,然后将这些改动做增量索引,然后合并到原有的索引中!
2、我的SQL SERVER 2000数据库中有image字段,存储了一些文件,如TEXT、WORD、PDF等。如何索引和检索这些文件?我在资料中看到了:
Field 的其中一个方法是
public static final Field Text(String name, Reader value)
Constructs a Reader-valued Field that is tokenized and indexed, but is not stored in the index verbatim. Useful for longer text fields, like "body".
我使用的是
ResultSet.getCharacterStream("字段名") 返回的一个Reader。传给Field.Text()方法。不知道这种方法行不行?
但是经过我试验,好像如果存储在该字段中的文件是纯文本文件或者是HTML文件的时候可以,如果存储的是WORD、PDF好像不行。是不是如果是WORD、PDF文件必须使用相应的Parser或者是将这些文件中的文本信息抽取出来?