如何提取html中的文本内容???(100分)

  • 主题发起人 主题发起人 Jeny
  • 开始时间 开始时间
J

Jeny

Unregistered / Unconfirmed
GUEST, unregistred user!
如何将html中的内容转换到excel中??
关于excel的插入操作我会,但不知道如何得到html中的文本数据。
dfw的查询不能用,只能请会的人再帮帮忙了。谢谢了。
 
分析<table></table>、<tr></tr>、<td></td>,与excel对照。不算复杂!
 
我想我是否可以删除源文件中所以<>内的东东?好像文字都在括号外面。
另外,页面上还有很多其它东西怎么办,比如广告等。
 
html的标记都是以<>括起来的,你只要成对的删除即可,剩下的就是你要的东西
 
不好意思,怎么得到源文件?不会用TWebBrowser?
 
WB.Navigate('e:/aaa.htm');
wb.Document;
if wb.Document <> nil then
aaa := IHTMLDocument2(wb.Document).body.outerHTML;
Memo1.Lines.Add(aaa);

这样写为什么wb.document=nil呢?

 
OPEN了么?
 
IHTMLDocument2是怎么定义?
 
to jeny:
IHTMLDocument2是怎么定义?我试了怎么有问题?
 
自己解决了.
 
多人接受答案了。
 
后退
顶部