关于搜索引擎返回的结果(100分)

  • 主题发起人 主题发起人 rwyabc
  • 开始时间 开始时间
R

rwyabc

Unregistered / Unconfirmed
GUEST, unregistred user!

我想编一个客户端程序将用户的搜索请求自动提
交给数个搜索引擎,现在的问题是:如何将各个
搜索引擎返回的HTML页面中的关于搜索结果的那
一部分URL、TITLE、DESCRIPTION提取出来(因为
页面中还包括有诸如广告等与搜索无关的连接),
就像COPERNIC或实达铭泰的东方快车一样。
另外建议孙老师将去年7月以来的问题再打一个包
供大家下载,我这里访问大富翁实在太慢了。
感谢所有来看问题的朋友!
 
通过分析搜索结果页面的HTML标志即可.
不过每种搜索引擎的结果页面形式是有差异的,必须分别处理.
 
呵呵
这个难了,那么多的引擎,你必须自己分析好他的页面结构。
一两个也罢

如果有那么一大堆....呵呵
 
to deckyou:COPERNIC或实达铭泰的东方快车好像不是
分析搜索结果页面的HTML标志,我该怎么办呢,急死了!
 
是不是专家们都不用copernic呢?
 
肯定是分析html实现的,不可能有别的办法.可能他事先针对典型的网站做好了模板,直接拿
某个位置的值就是了,这归根结底还是分析html,不可能有别的办法,除非那个搜索引擎返回的
是XML
嘿嘿,那倒是好办了.
 
将问题提前
 
rwyabc:如果还想接着讨论请定期提前自己的帖子,如果不想继续讨论请结束帖子。
 
多人接受答案了。
 
后退
顶部