请问如何从网页代码中提取出文本和链接啊? ( 积分: 50 )

  • 主题发起人 主题发起人 wtzwtz
  • 开始时间 开始时间
W

wtzwtz

Unregistered / Unconfirmed
GUEST, unregistred user!
请问如何从网页代码中提取出以下文本和链接啊?
无锡新闻综合
mms://v.thmz.com/live
无锡新闻综合
mms://v.thmz.com/tv1
----------------------------------------------------------------------
网页代码:
<a onclick='javascript:mplayer("mms://v.thmz.com/live")' href="#0" class="none">无锡新闻综合</a><br> 
<a onclick='javascript:mplayer("mms://v.thmz.com/tv1")' href="#0" class="none">无锡都市咨讯</a><br> 
 
请问如何从网页代码中提取出以下文本和链接啊?
无锡新闻综合
mms://v.thmz.com/live
无锡新闻综合
mms://v.thmz.com/tv1
----------------------------------------------------------------------
网页代码:
<a onclick='javascript:mplayer("mms://v.thmz.com/live")' href="#0" class="none">无锡新闻综合</a><br> 
<a onclick='javascript:mplayer("mms://v.thmz.com/tv1")' href="#0" class="none">无锡都市咨讯</a><br> 
 
使用WebBrowser打开该html页面,用下面的程序得到所有连接
procedure TForm1.listlink;
var
i: integer;
doc: Variant;
v: Variant;
begin
//***********使用WebBrowser的Document.All对象得到全部链接
form1.ListBox1.Clear; //清空list
doc:=webbrowser1.Document;
for i:=0 to doc.links.length-1 do
begin
v := doc.links.item(i,0);
listbox1.Items.Add (v.HREF);
end;
//************使用WebBrowser的Document.All对象得到全部链接
CommandID := 0;
end;
用下面的程序复制全部文字
procedure TForm1.copyweb;
var
a,b: OleVariant;
eQuery:integer;
begin
//**********使用WebBrowser的ExecWB方法
a:=0;
b:=0;
//选择全部内容
eQuery := WebBrowser1.QueryStatusWB(OLECMDID_SELECTALL);
if eQuery>0 then
WebBrowser1.ExecWB(OLECMDID_SELECTALL,OLECMDEXECOPT_PROMPTUSER, a, b);
//复制全部内容
eQuery := WebBrowser1.QueryStatusWB(OLECMDID_COPY);
if eQuery>0 then
WebBrowser1.ExecWB(OLECMDID_COPY,OLECMDEXECOPT_PROMPTUSER, a, b);
//***********使用WebBrowser的ExecWB方法
end;
 
unjiang兄的方法不行啊!
请再看一下我的网页代码
 
去微软的网站查一查IE的DOM接口的文档资料,你就知道怎么弄了。。。。。。。
 
http://www.delphipages.cn/index.asp?boardid=8
看看对你有无帮助。

致所有Delphi爱好者,程序员,专业人士:

我的Delphi中文技术论坛刚刚"开业",麻烦您百忙之中上来看一看,您的一点支持会给我莫大的鼓励!
网址:http://www.delphipages.cn
论坛专用群组号:2244008

论坛每天一期擂台赛,敬请关注,欢迎踊跃参与!

谢谢支持!

_______________________________
Delphi Pages BBS
http://www.delphipages.cn
不以物喜,不以已悲
 
后退
顶部