Z
zfh
Unregistered / Unconfirmed
GUEST, unregistred user!
达到的效果也就是用浏览器将网页另存为文本格式后的结果。只不过由于文件太多,不能一一另存,
只得用编程来解决。
问题的难点在于:
如果用WebBrowser控件载入Html文件后转换保存为文本格式,一是速度不够快,二是如果网页文件
中有弹出窗口等,则在处理过程中将频繁弹出,即使设置为离线方式也不能解决。
我的代码如下:
content:=tstringlist.Create;
ToFile := TStringList.Create;
RetVal := FindFirst(c:/ + '*.html',faAnyFile,SearchRec);
vv := VarArrayCreate([0,0],varVariant);
try
while RetVal = 0 do
begin
content.LoadFromFile(strDirFrm + SearchRec.Name);
vv[0] := content.Text;
HTMLDocument := IE.Document as IHTMLDocument2;
HTMLDocument.write(PSafeArray(TVarData(vv).VArray));
Tofile.Text := HTMLDocument.body.outerText;
HTMLDocument.close;
Tofile.SaveToFile(strDirTo + ChangeFileExt(SearchRec.Name,'.txt'));
RetVal := FindNext(SearchRec);
end;
finally
FindClose(SearchRec);
end;
不知哪位高手有办法。
只得用编程来解决。
问题的难点在于:
如果用WebBrowser控件载入Html文件后转换保存为文本格式,一是速度不够快,二是如果网页文件
中有弹出窗口等,则在处理过程中将频繁弹出,即使设置为离线方式也不能解决。
我的代码如下:
content:=tstringlist.Create;
ToFile := TStringList.Create;
RetVal := FindFirst(c:/ + '*.html',faAnyFile,SearchRec);
vv := VarArrayCreate([0,0],varVariant);
try
while RetVal = 0 do
begin
content.LoadFromFile(strDirFrm + SearchRec.Name);
vv[0] := content.Text;
HTMLDocument := IE.Document as IHTMLDocument2;
HTMLDocument.write(PSafeArray(TVarData(vv).VArray));
Tofile.Text := HTMLDocument.body.outerText;
HTMLDocument.close;
Tofile.SaveToFile(strDirTo + ChangeFileExt(SearchRec.Name,'.txt'));
RetVal := FindNext(SearchRec);
end;
finally
FindClose(SearchRec);
end;
不知哪位高手有办法。