有一件事情不大明白,为什么很多人一谈到搜索引擎,首先想到的不是算法和数据结构而是数据库呢? ( 积分: 100 )

  • 主题发起人 主题发起人 dcms
  • 开始时间 开始时间
D

dcms

Unregistered / Unconfirmed
GUEST, unregistred user!
有一件事情不大明白,为什么很多人一谈到搜索引擎,首先想到的不是算法和数据结构而是数据库呢?
据我所知目前全世界的自主研发的搜索引擎中只有
google baidu 还有我的搜索引擎用的不是数据库
估计 sogou用的也不是数据库。
为什么很多人一谈到搜索,首先想到的不是算法和数据结构而是数据库?
难道离开数据库你们连程序都不会写了?有时间用别人的数据库,难道没时间研究算法和数据结构?还是说用数据库就能做出真正的高效的搜索引擎?
其他的我就不知道了。
你要是有不同意见可以给我留言:http://hi.baidu.com/earthsearch
 
怎么会没有数据库呢?!
楼主,你把数据库的理解狭隘了
 
发这个贴子没有别的意思:)
主要是我每次 DEMO的时候,都有一堆人过来问我要所谓的分页存储过程!
这使我大为吃惊.......
本次DEMO http://loserq.cn 也不例外!
才有感而发!
郑重的告诉大家我可以用 100台PC搜索一亿网页时间还不会超过 1秒钟,所有的程序都不使用任何数据库。这次DEMO用我的分布计算平台经过这几天的测试看起来我的整个程序和算法是稳定而且高效的,经过我仔细而且精确的计算 “从 100台PC中检索 1亿网页时间还不超过 1秒钟,而不用数据库”是完全现实可行的:)
 
市场买的叫做菜,自己种的叫做植物,商品化的数据库才叫数据库,自定格式的就不是数据库?
我的主页都已经过时,什么谷歌之流的东西,还在怀旧,这不是存数据库中,难道存在空气中?
 
我又碰到一个火星人
 
TO: flfqnet: 你别不服.出钱给我要做什么样的搜索随便开口,做不到那才叫SB
 
TO: flfqnet 提醒你说话别满口喷粪!
 
完了 吵起来了[:D]
 
其实我觉得广义上的数据库就是可以存储和管理数据的产品都叫数据库啊.
不过就搜索引擎来说我觉得还是用自己的算法和数据结构而不是用狭义的数据库好一些.
一个设计良好的哈希表可能是速度最快的了.
 
完全理解并相信楼主说的。
100:1亿=1:10万,就是说1台pc机1秒钟搜索10万网页,如果以前年比较主流的pc机来做,而你的数据结构很过关,这个速度算比较慢的了。
google的主机是一台超级计算机,也就是它自己做的网格,节点个数超的100台的很多倍。操作系统听说是FreeBSD。
 
TO: 你计算错误了吧? 100:1亿=1:10万
应该是 100:1亿=1:100万
 
不好意思,口算的。100万也不算多阿,10个毫秒应该就可以搞定,如果算法好的话。
 
没事别吵。
脏话一出口,难免伤人。
 
你们有没有注意到他的所谓的搜索引檠的结果
你们有没有注意看他的结果的链接
 
别人想到数据库,是因为现在这个注重业务的时代,多数开发人员已经不再关心算法了,
在他们看来,“数据库”已经成了算法和数据结构的代名词了。在精力有限的情况下,更多
的借用数据库引擎的能力,减少自己程序内部的算法、结构的复杂度,也是可以考虑的。
楼主要处理的海量数据检索领域是没有办法借助数据库引擎的能力的,刚好楼主是勤劳智
慧Coder的先进代表,自己从头开始搞算法和数据结构而不用数据库——这也是很容易理解
的。
另外,还有句话送给楼主:即便您不在乎言语会不会导致树敌太多,但是,真正有事情忙
的人物应该不会有空贬低那些水平、层次都远不及自己的人吧?

一沙一世界——任何一件事情,要想真正做好,涉及到的方方面面要学、要做的事情肯定
不会少。祝愿吾兄励精图治,早日成就 :)
 
做技术的也互相XX???哦也...dcms貌似有点过了哦;
ps:做技术的应该谦虚...
 
大家还是研究技术吧!我正想学习全文检索技术,同样不打算用数据库!
我的设想是:将每个月的数据以文件形式存放在相应的文件夹中,但是我用的是delphi,不知道该怎样开始!
 
creation-zy说得真好,不愧是研究佛法的。[:)]
 
这年月,搜索引擎再先进,搜出的内容是垃圾,也等于零。
 
楼上说的太对了,正在改进权重算法!
多谢宝贵意见!
 
后退
顶部