yysun, I need your help about Lucene!!!(200分)

  • 主题发起人 主题发起人 Yakuu
  • 开始时间 开始时间
Y

Yakuu

Unregistered / Unconfirmed
GUEST, unregistred user!
我现在准备做一个站内全文检索引擎,准备使用lucene作为基础。
大富翁里面的文章我也看过了。中文转换问题还有一部分疑问,
以及数据库设计也有一部分问题。目前还不是很了解lucene的用法。
我现在正在学习,不过,我想您用过一段时间了,希望您能给我一部分指导。
非常感谢!!!
能不能给我一些资料?我的email是:taochina@msn.com或者yakuu@163.com
等待您的答复。
 
还有我呀!有劳孙老师了。 大家也来看看。
[8D]
http://delphibbs.com/delphibbs/dispq.asp?lid=1022841
 
我一直都不了解全文检索的原理,
从没有作过这类工作,也希望能学习一下
 
听一下吧·高手的意见!
 
各位,别都是听啊。
不管对错,你说两句也可以啊。呵呵。
 
听课,不知道可不可以先给介绍一下全文检索的原理呀?
 
我现在按照lucene的demo将index建立起来了,并且可以运行了。
只是,我的数据如果在oracle中的话,怎么个操作???
现在我理解的也就是lucene将搜索硬盘指定目录文件,根据V-Twin 引擎生成index,
然后根据index来检索。这个在进行web网页检索的时候非常有用。
但是,如果我将内容放到数据库中间的话,怎么操作呢?
研究中。。。
孙老大,麻烦您给点意见可否?
谢谢!
 
lucene 中的一些基本概念:
index - 索引(它存储在一个目录中),如果要建立索引,则创建一个 IndexWriter 对象,
如果使用索引坐检索则用 IndexReader 对象。
Document - 索引中的基本单位,例如一个网页,一个贴子,一篇文章。
Field -do
cument 中的元素,例如网页的标题、网页的内容,贴子的作者、贴子的正文。
将 Field 加到do
cument 的时候需要设置 Filed 的属性 isIndexed,isStored,isTokenized
和数据库联合使用的做法是:
为每个数据库记录建立一个do
cument,为数据库记录的主关键字段建立一个建立一个
isIndexed + isStored 的 Lucene Field,为其它需要检索的数据库字段建立 isIndexed
(不用 isStored) 的 Lucene Field。
当用 Lucenc 做检索查到内容后,可以根据关键字从数据库取出相关内容。
建议大家仔细看看 Lucene 的 FAQ
http://lucene.sourceforge.net/cgi-bin/faq/faqmanager.cgi
 
yysun:
http://lucene.sourceforge.net/cgi-bin/faq/faqmanager.cgi
我知道,不过现在好像上不去。另外,我找到了你的帖子。关于中文问题的。
另外,我发现了另外一个faq,可以连到其它许多相关资源。
http://www.jguru.com/faq/printablefaq.jsp?topic=Lucene
弟子:建议你去上面写的几个地方去看看。
另外:我查到了关于消除jsp里面tag标记的方法。目前还只是初步研究。
关于数据库检索,我目前只是这么理解:通过自定义一个application,将数据库中的
相关检索数据读取出来,然后用lucene写成index,搜索的时候再还原。。。
其它的正在study中。
以上观点,请yysun和其余高手指正。谢谢!
 
请问YYSUN,DELPHI的协作有没有办法了?
 
我也正在研究 Lucene,目前只是进行到 Demo 阶段
 
谢谢 Yakuu 提供的连接。
房客, DELPHI的协作 是不是指从 Delphi 调用 lucene ?
我打算用 JAX-RPC 做个 SOAP Server,供 Delphi 或者其他客户端调用。
Delphi SOAP Client - JAX-RPC SOAP Server - Lucene - Database
 
yysun:您好,能不能给我简单讲解一下您怎么操作数据库的?
比如,我的后台数据库是oracle,您是怎么用servlet读取数据库关键字段信息,
然后用lucene去index它?
又或者,用xml和oracle去交互?
^_^,我卡住了。
 
yysun:
Good idea...SOAP的经典实例
详细请教JAX
Yakuu:
阁下不妨考虑JAX和ORACLE的通讯,虽然没有实作过,
JDOM可以读写,JDBC可以直接和ORACLE通讯(试试JDEVELOP看)
YYSUN说的SOAP就是一个通讯的办法
ORACLE的SOAP好象还没有出规范,但已经申明支持SOAP。。
 
中文问题YYSUN早已经公开
http://marc.theaimsgroup.com/?l=lucene-dev&m=100705753831746&w=2
其他接口
http://jakarta.apache.org/lucene/docs/contributions.html
 
谢谢房客,这些我都知道了。
欢迎您给我帮助。^_^
 
oh,thx,i think i have got the feeling!^_^
谢谢yysun,房客!
研究中……
 
我现在用xml和数据库交互生成全文检索成功!
哈哈,谢谢各位!
欢迎大家给我意见。这个问题保留到下个星期,期待大家继续交流!
 
后退
顶部