搜索引擎新版本测试通知 2007-03-18 ( 积分: 20 )

  • 主题发起人 主题发起人 dcms
  • 开始时间 开始时间
另外,搜索提交之后的页面里,关键词并没有出现在上方的编辑框里——算是疏漏么? :P
 
那个问题是我今天换成了了 Apache, 那个 C写的 CGI还没有更新造成的,属于汉字编码问题!
 
呵呵,我没有什么“宽泛思维”的概念:P 不过,即便词库中不存在,是不是可以让引擎
将在文本上用户要找的各个字排列距离较近的页面有较高的排序优先级呢?
 
这个实现起来目前对我来说还有点困难
 
一个思路:在已有的固定词库之外,将网页中相邻的2到4个汉字当成某种“未决词汇”,
将这种词也编入索引,当用户的输入不在固定词库内时,就使用针对未决词库的索引。未决
词库可以根据出现数量的多少进行自动优先级排序——这样页面词法分析器就可能进行更加
准确的分词。


ps: 可以参考一下 http://www.delphibbs.com/delphibbs/DispQ.asp?LID=378017
 
我只知道楼猪是个狂人:

"严重鄙视那些用 Lucene、nutc h 等开源软件制作所谓搜索引擎的垃圾公司和垃圾程序员!"
希望你有一天能把这些"垃圾"都干掉!!!
哈哈..............
 
觉得很不错,顶一下.
 
感觉不错,搜索引擎也是我感兴趣的一个方面,可惜现在还能力有限,向lz学习!
顶!
 
接受答案了.
 
后退
顶部