300分求搜索引擎的方案,请畅所欲言! (300分)

  • 主题发起人 主题发起人 lps
  • 开始时间 开始时间
L

lps

Unregistered / Unconfirmed
GUEST, unregistred user!
有一个企业网,类似军网吧(就是要理解为和外界物理上不通的,所以不能利用GOOGLE等
现成的搜索引擎),可能有1000台或几百台服务器(IIS),分布在不同地方,由不同的人管理,分别
有各自的网站或主页,现在想建一个搜索引擎,具体要求如下:
1.提供基本的网页搜索和网站导航
2.用一台服务器提供搜索引擎的服务
3.服务器自动去搜索网页(有哪些网站预先不知道)
  4.要能检索所有的服务器

请讨论一下面几个问题:
1.有无现成的软件能满足以上要求?如果是商业软件,价格多少?
2.如果要开发,用什么做好(JAVA、DELPHI...?),用什么数据库?
PS:服务器OS用WINDOWS 2000
3.开发,周期和MONEY?
4.服务器配置?(如硬盘多大如何估算)

特别请军界人士谈一下,我想军界的情况类似,应该有自己的搜索引擎吧!


另一个相关问题: http://www.delphibbs.com/delphibbs/dispq.asp?lid=1916667
 
Search Engine Builder V1.65 汉化版
 
我也很想知道,这样的应用确实挺多的
 
如果用Java的话,
可以Lucene,
可以做集群,性能不错
 
Lucene是什么?
群集不大可能,这只是一个小项目。
 
军品啊?????
这样的活你们也能弄到手,厉害啊!
有一个叫“Rubicon”,不太大,你在网上搜索一下吧
 
Rubicon的官方网站是:http://www.tamaracka.com/
好像Delphi7的光盘上有,
http://homepages.borland.com/jkaster/ccds/delphi7disk1/tamarack_associates/rubicon_2_full_text_search/
 
关注中~~~

搬个凳子坐!~~~

学习~~~
 
关注!
很想学习!
 
本人关于搜索引擎的设想:
假设有服务器A的HTTP服务端口为80(系统默认),向A:80发出HTTP访问请求,A会将该默认网页的内容全部返回给请求者.然后将返回的内容保存到本地数据库.剩下的就是对本地数据库内容的检索问题了.
 
我曾简单地研究过Search Engine Builder软件,它并不是依靠扫描80端口来发现有web服务的主机的,
而是定义一个启始页,遍历该页所有链接,保存页面内容,然后再遍历链接页的链接,以此类推,基
本上可以将内部网上所有的网页信息扫描出来,然后保存。最后再建动态检索页面,用什么jsp、asp.net
啊就随你的便了。我试着做了一个简陋的程序(用了控件),几天就OK了,反而是用asp.net做检索页费了我不少脑筋,
主要是sql语句及数据库引擎的优化,目前SQLServer数据库里存着接近2万张页面(60MB),基本上1-2秒就可查询到
需要的信息了(比Google是差远了^_^),如果象Google那样多台服务器并行查询,速度应该更快,不过
我觉得对于局域网来说没什么必要。
 
用delphi7.0 里的IDHTTP控件可以轻松实现http访问.代码如下.

Tstr:=idhttp1.Get('http://www.sina.com.cn');
memo1.lines.Add(Tstr);
 
后退
顶部