如何获得网页中所有的连接地址(100分)

  • 主题发起人 主题发起人 leixiao
  • 开始时间 开始时间
L

leixiao

Unregistered / Unconfirmed
GUEST, unregistred user!
比如说
获得一个网页中所有的连接地址,最好可以对其进行分类,能分出是MP3的连接或着是图片的连接等等
我用IDHTTP.GET('URL')或的网页的源代码
 
  var
   doc:IHTMLDocument2;
   all:IHTMLElementCollection;
   len,i:integer;
   item:OleVariant;
  begin
   doc:=WebBrowser1 .Document as IHTMLDocument2;
   all:=doc.Get_links;             //doc.Links亦可
   len:=all.length;
   for i:=0 to len-1 do begin
    item:=all.item(i,varempty);        //EmpryParam亦可
    memo1.lines.add(item.href);
   end;
  end;
 
先导入 mshtml_tlb(Component->Import ActiveX->Microsoft HTML Object Libary)
use mshtml_tlb
首先 执行 webbrowser1.Navigate('http://www.adsad.net/asa.htm')

procedure TFrom1.WebBrowser1DocumentComplete(..)
var
doc:IHTMLDocument2;
all:IHTMLElementCollection;
len,i:integer;
item:OleVariant;
begin
if not webbrowser1.busy then
begin
doc:=webbrowser1.Document as IHTMLDocument2;
all:=doc.Get_Links;
len:=all.length;
for i:=0 to len-1 do
begin
item:=all.item(i,varempty);
Memo1.Lines.Add(item);
end;
end;
end;

结果全部在Memo1里面了!每一行一个链接~!
 
后退
顶部