最近 我研究 搜索引擎 (六) 搜索引擎 实战篇(内含搜索引擎的demo URL地址)(100分)

  • 主题发起人 主题发起人 dcms
  • 开始时间 开始时间
呵呵呵...
 
我从南京学习回来了! 明天(2006-06-01)照常开放测试

IP地址暂时不变
 
顶一下,支持楼主...继续努力
 
恩,看起来不错。不过离商业化还有点距离。
 
你用什么工具做的 搜索引擎,是delphi吗?
 
我要试试,呵呵。我顶啊。
 
试了一下,自己一个人做出来的不容易。顶一把!
 
问天阁中文分词已经有所改进,所以后期制作的索引支持长语句的搜索比如搜索: 1. 新闻传播广告艺术课程光盘 2. 亚洲最大在线宽频影院 3. DNET百万像素DS603新机 4. 看到这几张时尚图片 还有很多请大家慢慢挖掘

当然分词还是不够理想,所以这个月中旬我会做一次大的调整,还有索引部分也不理想,所以目前速度还不是非常快,也需要改进.
 
据我所知在浙江、上海和沈阳都有人做专业搜索引擎,就是利用一台机器搜他100万页,根据这些网页去检索资料,网页数不是没有限制的,不只受机器功能的限制,可能还有算法等。你想存一亿网页对数据库、硬盘要求不会低的。
 
再说了人家百度不是还有自己的专利吗,就是超链分析,不是搜出来就行了,搜索引擎很多的。
 
,这样更智能,而且搜索的结果会更符合实际情况,更符合民主的精神。)另外,在盈利模式方面,我不搞竞价排名,因为那会打乱大众的正常投票,属于人为控制排名了,就好象台湾花钱买选票一样。我打算开放相关关键词的广告编辑功能,就是说,谁对某个关键词的广告做了编辑,就用谁的广告,以后也只有这个人可以进行维护,但是由于电脑配置实在太低了,所以暂时先不做这两个功能。但请大家记住,这两个方法,都是我发明的。
=====================================
是真无知还是假无知呢,都是你发明的........忘了google的AdWords吗,连这句都敢吹,笑话
 
做人哪,要踏实,别搞出了点过时的小技术就欣喜若狂,头脑发热,笑...
 
看看我的搜索引擎:search.ebook-toolbar.com,每天搜索的独立IP在200万以上
 
已经开放相关关键词的广告编辑功能,就是说,谁对某个关键词的广告做了编辑,就用谁的广告.
广告编辑之后的效果请搜索:

baidu 或 googel
 
不好意思,我又玩了一个绝的......
大家搜索一下下面的词看看:
1. 日本
2. 狗日
3. 小日本
4. 战争
5. 狗
6. jp
7. japan

下面是广告的 html代码:

<!-- 请在这里输入您想做的广告的 html代码 如果有图片请使用完整url地址 -->
<font size=&quot;5&quot;>日本人与狗不得入内</font>
<p></p>
<img src=&quot;http://www.qwzx.org/UploadFiles/20051030231238199.jpg&quot; width=300>
<p></p>
((勿忘国耻-灭了小日本)南京大屠...)
 
这个世界上还真有不要脸的人,我才开放测试不到两周时间,就有不要脸的东西做了一个叫做 www.wentiange.com 的网站,结果用的确实搜狐的爱问搜索引擎,中国为什么不能强大?就是这样的不要脸的垃圾太多了! 为为了防止再次出现这样不要脸的事情发生,我决定暂时改名叫“无名”!作为一个中国的有志青年每每想到这里我就想哭!
 
顶..........
 
百度搜索引擎搜索到的东西大概一个更新一次,你看看百度快照就知道了,百度抓取网页的速度很快的,可能有很多机器、线路并行,不然怎么能在一个月抓几亿页,你一台机器怎么作?
 
不好意思, 我有几个疑问:
1.(原话: ) &quot;那我告诉你,这次我搜索 300万个网页,可能实际要少一点,但我的理论告诉我搜索 1亿个网页的速度和搜索300万个网页的速度基本接近(除非所有的网页内容都一样)。估计又有人开始笑了,那你搜索要多长时间,这个我可以肯定的告诉你,不管是1亿网页还是300万网页我都可以在1台PC上做到不超过 2秒钟时间。不信你现在去看 demo。&quot;
因为目前自己只有一些数据库的相关知识, 但无论如何都不会相信 1亿网页和 300W的网页速度 一样, 而且在这样的配置环境下 时间不到2秒: (原话: ) &quot;我的电脑配置(P4 630CPU, SATA 250G硬盘 2G内存 整机购买价格 6000元,带宽 20几K的有线通)&quot;
先不说CPU怎么样, 就说带宽吧, 不知道你说的是下载速度还是真正的带宽, 一般情况下: 理论下载速度 = 带宽 / 8 因为带宽的单位是 b(bit: 位), 而下载速度的单位是 B(Byte: 字节), 算最少的网页量 300W, 先不管你搜到的网页内容有多大, 先算你的下载速度是 20KB/s 就是 20 * 1024 = 20480 B/s 这是 理论速度, 因为忽略了网络传输中的数据包的大小, 算上时间 2秒钟, 20480 * 2 = 40960 B/s 这样就出问题了, 总下载量才 4W多字节, 你却能下 300W 多的网页, 真不知道你是不是在电脑上加了什么下载加速器, 如果真的有的话请告诉我, 我这网速才 512 Kbps , 我整天都幻想 2M的带宽是怎么样的[:D]
 
后退
顶部