网页采集文件处理问题 ( 积分: 20 )

  • 主题发起人 主题发起人 allceo
  • 开始时间 开始时间
A

allceo

Unregistered / Unconfirmed
GUEST, unregistred user!
我用IdHTTP获取一个网站页面的源代码之后,
pro:= Tidhttp.Create(nil);
pro.ReadTimeout:=30000;
MyStr:=pro.Get('http://www.xxx.com');

使用
function CenterStr(Src:String;Before,After:String):array [1..10000] of char;
var
Pos1,Pos2:WORD;

begin
Pos1:=Pos(Before,Src)+Length(Before);
Pos2:=Pos(After,Src);
Result:=Copy(Src,Pos1,Pos2-Pos1);
end;
对其进行截取,但是怎么截取,老是缺一部分,研究了半天,才发现,获取的网站页面源代码,有100多k,可能是文件太大,处理不了了,不知道有没有人知道,像这种大型文件,我应该怎么处理,谢谢。
 
获取淘宝首页(156K)的最后几个字符串“广告经营许可证号”



procedure TForm1.Button1Click(Sender: TObject);
var
response:TstringStream;
begin
response:=TStringStream.Create('');
idhttp1.Get('http://www.taobao.com',response);
if Pos('广告经营许可证号',response.DataString)>0 then
begin
ShowMessage('ok');
end;
end;
 
后退
顶部