关于全文检索的算法-->>寻求高效率算法(100分)

  • 主题发起人 LiChaoHui
  • 开始时间
L

LiChaoHui

Unregistered / Unconfirmed
GUEST, unregistred user!
我已经能够实现忽略大小写的全文检索算法,
但是对于 or 和 and 连接的关键字怎么进行处理?(暂时不考虑not的算法)

最笨的办法是进行多遍扫描,每遍处理一个关键字,
但关键字多时需要扫描多遍,这样的效率就很成问题,
有没有更好的算法之扫描一遍或较少的遍数,就能判断此文件是否符合此条件
 
订个邮件
 
真正的全文检索/搜索引擎不用扫描,
用索引...
 
你那不叫全文检索,叫遍历,请参考此贴:
http://www.delphibbs.com/delphibbs/dispq.asp?lid=924201
一定对你有所帮助
 
那么全文检索是不是需要对数据进行预处理,并生成索引呢?
 
对于中文建立全文检索索引,太困难了,
必须有丰富的字典,将文本拆分为词或短语以及短句来建立索引,
那这样的全文检索系统的确是很复杂和庞大,

这么复杂的技术也不敢去想了,
还是用我的全文扫描吧,
目前我也想到了一些方法可以优化遍历扫描(只考虑and)
 
多人接受答案了。
 
顶部