如何编写基于局域网的搜索引擎? ( 积分: 200 )

  • 主题发起人 主题发起人 chur
  • 开始时间 开始时间
C

chur

Unregistered / Unconfirmed
GUEST, unregistred user!
想编写一个基于局域网的搜索引擎?
(集团内部网络,与外网不连通,能否建立自己的搜索引擎?如何着手?)
哪位大虾给些指导?
偶一窍不通……
 
既然连不出去,那数据哪里来?没有数据的话,还搜索啥。
 
内网有自己的tcp/ip,诸多内部网站,论坛,数据很多
 
第一步现要做的就是中文分词.
 
怎么分词啊?
没有人会吗?
给点思路,偶一点不会,呵呵。
感激阿。
谁给些详细的答案,我多给分数。
1000分?
各位帮忙啊
 
内部搜索引擎,也要实现在大部分搜索引擎的功能,抓网页可以直接读数据库,分词索引要做的,不过还是比较麻烦。
建议使用或参考Lucene,不过它的没有中文分词,还得自己写中文分词
 
先是找一个搜索引擎,比如楼上说的lucene,适当修修改改,这个有支持各种语言版本的,看你们的情况。

然后是大头,分析你们的状况,比如要建怎么样的索引策略(当然老的数据都是一次性先建好)、索引存储策略以及增量索引策略等。分析用户需要什么样的查询需求,分析需要准备多大的存储服务器等。

OK,然后就是申请机器,写代码实现。
 
长见识了 学习一下Lucene
 

Similar threads

S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
I
回复
0
查看
551
import
I
后退
顶部