yysun老师帮个忙,dotlucene加上您的分析器不太好用 ( 积分: 50 )

  • 主题发起人 主题发起人 cozo
  • 开始时间 开始时间
C

cozo

Unregistered / Unconfirmed
GUEST, unregistred user!
yysun老师你好,帮一下忙吧。
我下载了dotlucene1.4.3,最新的那个,还有它自带的那个nls,里面的cn应该就是您的chineseAnalysis吧,我用这两个部分生成索引以后,查询中文词查不出来,不知道为什么?我想语法方面应该没什么问题,因为用standardAnalysis模块对英文文件索引以后可以正确的查出来,然后替换成chineseAnalysis再索引中文,就查不出来了。请问,这里面有什么要特别注意的吗?
 
yysun老师你好,帮一下忙吧。
我下载了dotlucene1.4.3,最新的那个,还有它自带的那个nls,里面的cn应该就是您的chineseAnalysis吧,我用这两个部分生成索引以后,查询中文词查不出来,不知道为什么?我想语法方面应该没什么问题,因为用standardAnalysis模块对英文文件索引以后可以正确的查出来,然后替换成chineseAnalysis再索引中文,就查不出来了。请问,这里面有什么要特别注意的吗?
 
问题似乎已经找到,被检索的文本文件默认是ANSI格式的,我另存成UNICODE格式以后重新索引就可以检索到了。
 
OK,问题已经找到,VB.net的FileStream读取文本文件默认使用utf-8编码,而windows系统上的文本文件默认是ascii编码,因此读文件的时候就全部都乱码了,不是lucene的问题。另外,好像1.4版已经不需要chineseanalyzer的,StandardAnalyzer就已经支持中文索引了,搜索效果还不错,也是采用单字索引算法。
 
后退
顶部