好像是个高难问题,全文检索(50分)

  • 主题发起人 主题发起人 tomboy
  • 开始时间 开始时间
T

tomboy

Unregistered / Unconfirmed
GUEST, unregistred user!
最近我去了一家软件公司,看了别人的产品,他们给新华社,人民银行等做过
查询系统,号称2G的数据全文检索时他们的程序能在0.3秒内响应,我也要做个类似的程序,不知为啥速度这么快?(我已见识了他们的系统,的确快)


 
1. 机器好
2. 数据库结构合理
3. 算法好
4. 记录数少

当然也可能是:
5. 吹牛本事好. ^_*
 
好像是用多线程,一次只出一部分检索结果
 
因为查到了多个记录,所以一边查询,一边输出,显的就快了。
如果刚好 这 2G 数据中只有一个符合条件的,我不信它能在 0.3秒
中找出来。
 
说不定还有什么索引什么的
 
是做个全文索引,关键在于全文索引的算法,很烦的。
大致是对字词做到文章的索引,而不是一般的记录排序。
 
2G??0.3秒??这个牛皮大!!!世界第一。呵,,
你想想,,硬盘的速度给你1000M/s吧,也要2秒钟(你算术不会不及格吧。。
呵,开个玩笑。。)
 
你需要一台 ES2000 主机
 
可能是通过访问FAT来提高速度的吧
(不好意思,可能会引来一大帮人的反对)
 
用固态硬盘会提高访问速度
不过很很很贵!
 
答非所问,我要作得和计算机世界光盘差不多,怎么办?
 
建立分词词典,查找时在词典查找,速度可能快些。
 
还是不信!
 
厉害!看来高手还是高手!虚心向他们学习吧.
能搞来源码吗?
 
接受答案了.
 
后退
顶部