何方神圣懂得Html->txt的转换(100分)

  • 主题发起人 主题发起人 的士
  • 开始时间 开始时间
用Word不就完了吗!
 
其实很简单,你分析一下HTML的格式,提取其中的文本文件就行啦
 
呵呵…!这我知道,你用配对的方法把所有尖括号里的字符删除了(包括尖括号)就全OK了!
当然也没有这么简单啦,还有一些其它的字符就要自已去查啦
 
function Html2Text(Str : String):String;
var
StrL, i : Integer;
NewStr : String;
begin
StrL := StrLen(PChar(Str));
i := 0;
While i < StrL do
begin
Inc(i);
if Str='>' then
begin
While Str[i+1]<>'<' do
begin
Inc(i);
if i > StrL Then Break;
NewStr := NewStr + Str;
end;//End While
end;//End if
end;//end While
Result := NewStr;
end;
或者用TWebBrowser读入Html文件,至于得到文本以前的讨论太多了就不废话了。
 
大家好象没有考虑script的问题,我有一个朋友做过类似的程序,他说最难搞的是去掉
script.具体怎样我也不清楚,提出来让大家参考
 
我也觉得script最难搞!
 
我搞定了。
用IE的解码引擎,解析出来的text绝对干净。
不过有个小问题,IE解码的时候会尝试连接
网络,所以最好在有网络连接的时候用。还
有,如果脚本有错误,还会弹出错误框。
到这里http://www.intelligo.net/iedelphi/
找IEParser或者UILess即可。如果有不明白的
可以来信。
 
接受答案了.
 
后退
顶部