C chur Unregistered / Unconfirmed GUEST, unregistred user! 2007-08-29 #1 想编写一个基于局域网的搜索引擎? (集团内部网络,与外网不连通,能否建立自己的搜索引擎?如何着手?) 哪位大虾给些指导? 偶一窍不通……
C chur Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-20 #5 怎么分词啊? 没有人会吗? 给点思路,偶一点不会,呵呵。 感激阿。 谁给些详细的答案,我多给分数。 1000分? 各位帮忙啊
J jfyes Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-21 #7 内部搜索引擎,也要实现在大部分搜索引擎的功能,抓网页可以直接读数据库,分词索引要做的,不过还是比较麻烦。 建议使用或参考Lucene,不过它的没有中文分词,还得自己写中文分词
W wolf_cyj Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-30 #9 先是找一个搜索引擎,比如楼上说的lucene,适当修修改改,这个有支持各种语言版本的,看你们的情况。 然后是大头,分析你们的状况,比如要建怎么样的索引策略(当然老的数据都是一次性先建好)、索引存储策略以及增量索引策略等。分析用户需要什么样的查询需求,分析需要准备多大的存储服务器等。 OK,然后就是申请机器,写代码实现。
先是找一个搜索引擎,比如楼上说的lucene,适当修修改改,这个有支持各种语言版本的,看你们的情况。 然后是大头,分析你们的状况,比如要建怎么样的索引策略(当然老的数据都是一次性先建好)、索引存储策略以及增量索引策略等。分析用户需要什么样的查询需求,分析需要准备多大的存储服务器等。 OK,然后就是申请机器,写代码实现。