yysun老师帮个忙，dotlucene加上您的分析器不太好用 ( 积分: 50 )

cozo · 2005-01-09

yysun老师你好，帮一下忙吧。
我下载了dotlucene1.4.3，最新的那个，还有它自带的那个nls，里面的cn应该就是您的chineseAnalysis吧，我用这两个部分生成索引以后，查询中文词查不出来，不知道为什么？我想语法方面应该没什么问题，因为用standardAnalysis模块对英文文件索引以后可以正确的查出来，然后替换成chineseAnalysis再索引中文，就查不出来了。请问，这里面有什么要特别注意的吗？

cozo · 2005-01-09

yysun老师你好，帮一下忙吧。
我下载了dotlucene1.4.3，最新的那个，还有它自带的那个nls，里面的cn应该就是您的chineseAnalysis吧，我用这两个部分生成索引以后，查询中文词查不出来，不知道为什么？我想语法方面应该没什么问题，因为用standardAnalysis模块对英文文件索引以后可以正确的查出来，然后替换成chineseAnalysis再索引中文，就查不出来了。请问，这里面有什么要特别注意的吗？

cozo · 2005-01-10

问题似乎已经找到，被检索的文本文件默认是ANSI格式的，我另存成UNICODE格式以后重新索引就可以检索到了。

cozo · 2005-01-11

OK,问题已经找到，VB.net的FileStream读取文本文件默认使用utf-8编码，而windows系统上的文本文件默认是ascii编码，因此读文件的时候就全部都乱码了，不是lucene的问题。另外，好像1.4版已经不需要chineseanalyzer的，StandardAnalyzer就已经支持中文索引了，搜索效果还不错，也是采用单字索引算法。

yysun老师帮个忙，dotlucene加上您的分析器不太好用 ( 积分: 50 )

cozo

Unregistered / Unconfirmed

cozo

Unregistered / Unconfirmed

cozo

Unregistered / Unconfirmed

cozo

Unregistered / Unconfirmed

Similar threads