如何流利地抓网页 ( 积分: 100 )

  • 主题发起人 主题发起人 photohawk
  • 开始时间 开始时间
P

photohawk

Unregistered / Unconfirmed
GUEST, unregistred user!
最近在做一个抓网页的小程序,现在已经能够单独分开来实现抓网页的每一个步骤了
但是不知道怎么把这些步骤合起来
比如,具体过程是这样,每一条注释是一个单独的过程,这些过程全部测试通过
但是按照下文连起来后,第二步会报错说找不到链接,因为此时页面根本没有跳转
请教!


//进入某页面
for 查询关键字变化 do
begin
//1.输入查询关键字,提交
//2.出现查询结果后,点击结果链接,跳转到信息页面
//3.分析抓取信息,存入数据库
end;

步骤1源码
procedure TForm_GrabSFDA.SendRequest(i: Integer);
var
ovDoc, ovForms, ovForm, ovInput: OleVariant;
MNo: String;
begin
ovDoc := WebBrowser1.Document;
ovForms := ovDoc.all.tags('FORM');
ovForm := ovForms.item(1);
ovInput:= ovForm.tags('INPUT').item(3);
MNo:= IntToStr(i);
ovInput.value:=MNo;
{提交查询请求,并显示查询结果}
ovInput:= ovForm.tags('INPUT').item(4);
ovInput.Click;
end;

步骤二源码
procedure TForm_GrabSFDA.GetMPage;
var
ovDoc, ovTables, ovTable: OleVariant;
begin
{打开商品页面}
ovDoc := WebBrowser1.Document;
ovTables := ovDoc.all.tags('Table');
ovTable := ovTables.item(16);
WebBrowser1.Navigate(ovTable.all.tags('A').Item(0).href);
end;
 
后退
顶部