网页采集文件处理问题 ( 积分: 20 )

allceo · 2007-05-30

我用IdHTTP获取一个网站页面的源代码之后，
pro:= Tidhttp.Create(nil);
pro.ReadTimeout:=30000;
MyStr:=pro.Get('http://www.xxx.com');

使用
function CenterStr(Src:String;Before,After:String):array [1..10000] of char;
var
Pos1,Pos2:WORD;

begin
Pos1:=Pos(Before,Src)+Length(Before);
Pos2:=Pos(After,Src);
Result:=Copy(Src,Pos1,Pos2-Pos1);
end;
对其进行截取，但是怎么截取，老是缺一部分，研究了半天，才发现，获取的网站页面源代码，有100多k，可能是文件太大，处理不了了，不知道有没有人知道，像这种大型文件，我应该怎么处理，谢谢。

DingP · 2007-09-01

帮顶[

]

linchhero · 2007-09-02

获取淘宝首页(156K)的最后几个字符串“广告经营许可证号”

procedure TForm1.Button1Click(Sender: TObject);
var
response:TstringStream;
begin
response:=TStringStream.Create('');
idhttp1.Get('http://www.taobao.com',response);
if Pos('广告经营许可证号',response.DataString)>0 then
begin
ShowMessage('ok');
end;
end;

网页采集文件处理问题 ( 积分: 20 )

allceo

Unregistered / Unconfirmed

DingP

Unregistered / Unconfirmed

linchhero

Unregistered / Unconfirmed

Similar threads