用webbrowser访问html 文件后能否直接提取其文本内容?谢谢。(100分)

  • 主题发起人 主题发起人 xjlqs
  • 开始时间 开始时间
X

xjlqs

Unregistered / Unconfirmed
GUEST, unregistred user!
用webbrowser访问html 文件后能否直接提取其文本内容?谢谢。
 
uses ........mshtml;

procedure TForm1.Button3Click(Sender: TObject);
var
doc:IHTMLDocument2;
begin
doc:=IHTMLDocument2(webbrowser1.document);
showmessage(doc.body.outerhtml);
end;

procedure TForm1.Button4Click(Sender: TObject);
var
doc:IHTMLDocument2;
begin
doc:=IHTMLDocument2(webbrowser1.document);
doc.location.replace('view-source:'+doc.location.href)
end;
 
showmessage(doc.body.outerhtml);
doc.location.replace('view-source:'+doc.location.href)

不行啊,这两句提示有错啊?应该怎么办!!!?????
 
先要装载页面:

procedure TForm1.FormCreate(Sender: TObject);
begin
webbrowser1.Navigate('D:/temp/aaaa.htm');
end;
 
我将outerhtml改为outertext后得到纯文本文件,但每行中间的空格都没有了
 
为什么不试试用http控件?
 
可以从
http://www.hbdadao.com/web/下载偶的“网页浏览王"源码
 
接受答案了.
 
后退
顶部