最近我研究 全文搜索引擎的心得(二)(0分)

  • 主题发起人 主题发起人 dcms
  • 开始时间 开始时间
D

dcms

Unregistered / Unconfirmed
GUEST, unregistred user!
最近我研究 全文搜索引擎的心得(二)

我最近在做搜索引擎最后的一个工序的两个程序(任务调度中心和任务执行)

我现在有 10太工作站,每台上面有 200万笔资料,电脑启动时就加载到内存中,由任务调度中心给他们分配工作任务,执行完毕后由任务中心将结果返回客户端 每个任务调度中心下面可以管理 254个工作站,每个工作站分配 200万笔数据信息,这样一来就可以满足更大数据量的处理了, 同时工作站的数据一开始就在内存中,所以处理起来速度会非常快,我想也许这是最好的方法了, baidu 或 google 也不可能有比这更好的办法了。(也许你会说这家伙太狂了),是的,确实有点。(在这些工作站里面会考虑专门给交费客户专用的工作站,专门用于新闻信息的工作站等划分)
 
说了和没说一样,你有点实质的东西出来没有?时序图什么的来一张也凑合,你红嘴白牙的在这胡扯硬件配置有p用.
 
欢迎批评指正啊!
 
既然是心得,就要讲讲搜索引擎的原理;
原理都不清楚,如何讨论?!
 
你这个问题可以实现。
比如首先将数据排序,然后处理,将数据存放在不同服务器上面。
比如银行将每个省的数据放置在几台数据上。然后大家协同处理。
 
有点让人恶心的帖子
 
TO:SmallGhost, 我不知道你是什么东西,也不知道你是干什么的,但是你这么说话,好象我强奸了你全家一样的感觉。我想问一句,我干了你娘还是你姐还是你妹还是你老婆?
 
今天有好几个人都要求我去baidu的,还说我要是没有去baidu将是一种遗憾:)
 
TO: dcms
我最看不起的就是你这种人了,没做出什么东西来就在这里炫,脑子进水了吧!
骄傲自大,你能做出什么大事来,我的姓就倒过来写!
 
富翁称号 总积分 本轮得分 专家分 本轮排名 总排名
dcms 320 0 105 263 13312
注册时间 上次来访 登陆次数 提问次数 回复次数 每贴得分
2005-5-23 2006-3-1 313 44 153 .69
自我描述
软件开发!
dcms 有: 43个待答问题, 1个已答问题, 回答了: 12 个问题。 富翁笔记




(以下是我的话:)
我也不多说了,有实力不是空口白话说出来的,俗话说的好,是骡子是马拉出来溜溜!
--哦,我多嘴了。实在忍不住也,善哉!
 
既然说了,就再说几句吧,顺便问你个问题:为什么你有43个待答问题?很奇怪!
 
有两种解释,可以服人:
1:别人好心帮你解决了问题,你却不结帖不给分!
2:人缘太差!
其实两种解释都一个意思!
算了,我去干活了,以后看到你大侠的帖子再不进去看一眼,有辱吾眼也!
 
谦受益,满招损,阿弥陀佛。
 
是我自己删除了,可以吗?

哈哈!
 
没有问题, 没有演示代码, 你在炫耀?
 
我不骂人,我吐一下~~~~嘿嘿。。。。同意楼上的意见。
 
一个自我吹嘘的帖子,没啥实质内容
 
拿内存换速度
另外 10台 机器 作 数据分区
另外 再加 自己的 索引。

这是 很通用 的做法。而且 很早很早 就有了


甚至 在 win32 的年代。
那时候 将数据文件 根据 首字母 分成 多个 同时 建 索引
然后 全部 映射 到内存 中
也是 多机 协作阿。
另外 2000年以前 就有 memoryDB的 做法 ,我是 在 csdn的杂志
看到的 ,有一系列的 产品,另外 xml的 xpath 查询
支持 在内存 中阿(网上的数字 是速度提高 不少倍,还有案例 说明
好像 是 bbc新闻 的 一个 ?? 系统阿)。
 
对不起 我记错了
是2002年
来自:
程序员增值合订本2002年(上、下) - dearbook.com.cn - 题解,编程,建 ...wxWindows开发指南 wxWindows常见问题 “MemoryDB 内存数据库系统 ”
 

Similar threads

回复
0
查看
991
不得闲
S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
后退
顶部