如何提取一个网页中所有的链接（包括链接文字） (100分)

hhzxf · 2003-04-25

如何提取一个网页中所有的链接（包括链接文字），就像网络蚂蚁那样，当你选择“download all by netants”之后就会出现这个网页中所有的链接和链接文字。怎么实现

bilyx · 2003-04-25

IHtmlDocument2

hhzxf · 2003-04-25

具体如何实现?

awl · 2003-04-25

　　var
　　　doc:IHTMLDocument2;
　　　all:IHTMLElementCollection;
　　　len,i:integer;
　　　item:OleVariant;
　　begin
　　　doc:=WebBrowser1 .Document as IHTMLDocument2;
　　　all:=doc.Get_links;　　　　　　　　　　　　　//doc.Links亦可
　　　len:=all.length;
　　　for i:=0 to len-1 do begin
　　　　item:=all.item(i,varempty);　　　　　　　　//EmpryParam亦可
　　　　memo1.lines.add(item.href);
　　　end;
　　end;

bilyx · 2003-04-25

搜索msdn或google

cxz9 · 2003-04-25

set links = external.menuArguments.document.links
ReDim params(links.length*2)
params(0)=external.menuArguments.document.Url
for i = 0 to links.length-1
params(i*2+1)=links(i).href
params(i*2+2)=links(i).innerText
next

巡城浪子 · 2003-05-12

function gethref()
{
var i;
var sn;
for (var i = 0; i < document.links.length; i++)
{ sn = document.links;
document.forms(0).image.value = sn;
}
}

tulpar · 2003-07-16

to: hhzxf
朋友我也需要这个代码，如果你做出来了能给我一份好吗？
E-mail: tulparmaster@eyou.com

edren · 2003-07-17

我也需要麻烦你了 iamed@etang.com

山泉 · 2003-07-17

用正则表达式,请看程序和例子
主要函数
function ReplaceWholeContent(strContent:string):string;
UBB码转HTML码函数库和例子
简介：目前一般论坛发贴都不支持html代码,而是采用ubb代码
如
[-url]http://www.ultimatebb.com[-/url]
ubb代码说明
http://www.51tv.net/tvnet/ubb/ubbcode.html
中间多个-，因为这里支持ubb代码
使用正则表达式可以提取文档中所需要的字符
我写的通过正则表达式将UBB码转HTML码函数库和例子
几乎支持所有ubb代码
花了好几天学习在delphi中使用正则表达式,写这个库也花了好几天
下载　
http://www.datacn.com/acdown/index.asp?classid=3

bq.xu · 2003-07-17

推荐用正则表达式，非常好用的

mllee · 2003-09-29

非常感谢山泉，我正好需要将 ubb 转换为 html
谢谢谢谢谢谢谢谢！

talent002 · 2003-09-30

delphi中能用正则表达式吗？

fxrm411 · 2004-03-25

对于电子邮件中的LINK不能抓到呀！怎么解决！

carolson2 · 2004-03-31

to 以上高人
如下那个代码似乎有问题吧
var
　　　doc:IHTMLDocument2;
　　　all:IHTMLElementCollection;
　　　len,i:integer;
　　　item:OleVariant;
　　begin
　　　doc:=WebBrowser1 .Document as IHTMLDocument2;
　　　all:=doc.Get_links;　　　　　　　　　　　　　//doc.Links亦可
　　　len:=all.length;
　　　for i:=0 to len-1 do begin
　　　　item:=all.item(i,varempty);　　　　　　　　//EmpryParam亦可
　　　　memo1.lines.add(item.href);
　　　end;
　　end;

这句
doc:=WebBrowser1 .Document as IHTMLDocument2;

如果是随便的IE 如何处理？比如 IE浏览时候希望提取一下内容。如何doc:= ？

如何提取一个网页中所有的链接（包括链接文字） (100分)

hhzxf

Unregistered / Unconfirmed

bilyx

Unregistered / Unconfirmed

hhzxf

Unregistered / Unconfirmed

awl

Unregistered / Unconfirmed

bilyx

Unregistered / Unconfirmed

cxz9

Unregistered / Unconfirmed

巡城浪子

Unregistered / Unconfirmed

tulpar

Unregistered / Unconfirmed

edren

Unregistered / Unconfirmed

山泉

Unregistered / Unconfirmed

bq.xu

Unregistered / Unconfirmed

mllee

Unregistered / Unconfirmed

talent002

Unregistered / Unconfirmed

fxrm411

Unregistered / Unconfirmed

carolson2

Unregistered / Unconfirmed

Similar threads