如何读取目标网页的源代码,来提取网页链接 ?(200分)

  • 主题发起人 主题发起人 夏敏
  • 开始时间 开始时间

夏敏

Unregistered / Unconfirmed
GUEST, unregistred user!
急需,最好是VB程序!
 
用 WebBrowser控件 和 DHTML 文档模型
 
http://www.delphibbs.com/delphibbs/dispq.asp?lid=1414973
 
Delphi的好说,用WebBrowser:

10、提取网页中所有链接

  这个方法来自大富翁论坛hopfield朋友的对一个问题的回答,我本想自己试验,但总是没成功。

  var
   doc:IHTMLDocument2;
   all:IHTMLElementCollection;
   len,i:integer;
   item:OleVariant;
  begin
   doc:=WebBrowser1 .Document as IHTMLDocument2;
   all:=doc.Get_links;             //doc.Links亦可
   len:=all.length;
   for i:=0 to len-1 do begin
    item:=all.item(i,varempty);        //EmpryParam亦可
    memo1.lines.add(item.href);
   end;
  end;

VB就不清楚了,可能也类似吧。
 
也一样用,用 activeX
 
假如我的目标网页名放在dbf数据库中一个page字段,能否得到它的所有超连接组成的字符串放入另一个lian字段?
 
那你的网页在哪儿?
 
用zw84611的方法.
或者用DHTML和這類是.
 
提取已知文件名的页面源码
var
HTMLDocument: IHTMLDocument2;
PersistFile: IPersistFile;
begin
...
HTMLDocument := WebBrowser1.Document as IHTMLDocument2;
Persist := HTMLDocument as IPersistFile;
Persist.Save(StringToOleStr('test.htm'), True);

while HTMLDocument.readyState <> 'complete' do
Application.ProcessMessages;
...
end;
直接从TWebBrowser得到网页源码
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);
 
多人接受答案了。
 

Similar threads

D
回复
0
查看
1K
DelphiTeacher的专栏
D
D
回复
0
查看
873
DelphiTeacher的专栏
D
D
回复
0
查看
1K
DelphiTeacher的专栏
D
D
回复
0
查看
933
DelphiTeacher的专栏
D
后退
顶部