如何提取一个网页中所有的链接(包括链接文字) (100分)

H

hhzxf

Unregistered / Unconfirmed
GUEST, unregistred user!
如何提取一个网页中所有的链接(包括链接文字),就像网络蚂蚁那样,当你选择“download all by netants”之后就会出现这个网页中所有的链接和链接文字。怎么实现
 
IHtmlDocument2
 
具体如何实现?
 
  var
   doc:IHTMLDocument2;
   all:IHTMLElementCollection;
   len,i:integer;
   item:OleVariant;
  begin
   doc:=WebBrowser1 .Document as IHTMLDocument2;
   all:=doc.Get_links;             //doc.Links亦可
   len:=all.length;
   for i:=0 to len-1 do begin
    item:=all.item(i,varempty);        //EmpryParam亦可
    memo1.lines.add(item.href);
   end;
  end;
 
搜索msdn或google
 
set links = external.menuArguments.document.links
ReDim params(links.length*2)
params(0)=external.menuArguments.document.Url
for i = 0 to links.length-1
params(i*2+1)=links(i).href
params(i*2+2)=links(i).innerText
next
 
function gethref()
{
var i;
var sn;
for (var i = 0; i < document.links.length; i++)
{ sn = document.links;
document.forms(0).image.value = sn;
}
}
 
to: hhzxf
朋友我也需要这个代码,如果你做出来了能给我一份好吗?
E-mail: tulparmaster@eyou.com
 
我也需要 麻烦你了 iamed@etang.com
 
用正则表达式,请看程序和例子
主要函数
function ReplaceWholeContent(strContent:string):string;
UBB码转HTML码函数库和例子
简介: 目前一般论坛发贴都不支持html代码,而是采用ubb代码

[-url]http://www.ultimatebb.com[-/url]
ubb代码说明
http://www.51tv.net/tvnet/ubb/ubbcode.html
中间多个-,因为这里支持ubb代码
使用正则表达式可以提取文档中所需要的字符
我写的通过正则表达式将UBB码转HTML码函数库和例子
几乎支持所有ubb代码
花了好几天学习在delphi中使用正则表达式,写这个库也花了好几天
下载 
http://www.datacn.com/acdown/index.asp?classid=3
 
推荐用正则表达式,非常好用的
 
非常感谢山泉,我正好需要将 ubb 转换为 html
谢谢谢谢谢谢谢谢!
 
delphi中能用正则表达式吗?
 
对于电子邮件中的LINK不能抓到呀!怎么解决!
 
to 以上高人
如下那个代码似乎有问题吧
var
   doc:IHTMLDocument2;
   all:IHTMLElementCollection;
   len,i:integer;
   item:OleVariant;
  begin
   doc:=WebBrowser1 .Document as IHTMLDocument2;
   all:=doc.Get_links;             //doc.Links亦可
   len:=all.length;
   for i:=0 to len-1 do begin
    item:=all.item(i,varempty);        //EmpryParam亦可
    memo1.lines.add(item.href);
   end;
  end;

这句
doc:=WebBrowser1 .Document as IHTMLDocument2;

如果是随便的IE 如何处理? 比如 IE浏览时候希望提取一下内容。如何doc:= ?
 
顶部