关于获取网页中的链接地址。(100分)

  • 主题发起人 主题发起人 delphir
  • 开始时间 开始时间
D

delphir

Unregistered / Unconfirmed
GUEST, unregistred user!
我想获取搜索引擎中搜索到的链接地址,把这些超链接地址导入到我软件中的列表框中,
请大家给点思路该如何实现,有没有这方面的控件。
 
用Indy中的IdHttp
HTML:=IdHttp.Get('搜索引擎'+'搜索参数');
分析返回的HTML,取出链接地址
 
我做asp的时候用vb写过这样的控件,理论上叫web数据挖崛,主要用于搜索引擎上,基本思路是先找到该页的网址,如果有网页,则读取网页的所有内容,并存入一下变量,再对其进行正则表达式扫描,找出链接地址,我想delphi也和这个差不多吧,你找一下相关资料吧
 
先导入 mshtml_tlb(Component->Import ActiveX->Microsoft HTML Object Libary)
use mshtml_tlb
首先 执行 webbrowser1.Navigate('http://www.adsad.net/asa.htm')

procedure TFrom1.WebBrowser1DocumentComplete(..)
var
doc:IHTMLDocument2;
all:IHTMLElementCollection;
len,i:integer;
item:OleVariant;
begin
if not webbrowser1.busy then
begin
doc:=webbrowser1.Document as IHTMLDocument2;
all:=doc.Get_Links;
len:=all.length;
for i:=0 to len-1 do
begin
item:=all.item(i,varempty);
Memo1.Lines.Add(item);
end;
end;
end;

结果全部在Memo1里面了!每一行一个链接~!
给分吧!^_^
 
to:pihome
请问Indy是什么?是组件吗?有什么功能?谢谢。
 
接受答案了.
 
后退
顶部