郁闷,谁来拿分?! ( 积分: 100 )

  • 主题发起人 主题发起人 Xylitol
  • 开始时间 开始时间
X

Xylitol

Unregistered / Unconfirmed
GUEST, unregistred user!
1、WebBrowser怎么判断GoBack和GoForward到头?
2、网页中的表格数据怎么提取?用IHMTLDocument2接口;或者别的也行,总之能成功的就行。因为要存储到数据库,表中的每一行对应数据库中的一条记录。
郁闷了很久了,谁能提供解决方法或者源码,厚分送上!
 
1、WebBrowser怎么判断GoBack和GoForward到头?
2、网页中的表格数据怎么提取?用IHMTLDocument2接口;或者别的也行,总之能成功的就行。因为要存储到数据库,表中的每一行对应数据库中的一条记录。
郁闷了很久了,谁能提供解决方法或者源码,厚分送上!
 
关于这个曾经也看过一篇文章:
-------------------------------------------------------------------------------
关键词:TWebBrowser
1、初始化和终止化(Initialization & inalization)

  大家在执行TWebBrowser的某个方法以进行期望的操作,如ExecWB等的时候可能
都碰到过“试图激活未注册的丢失目标”或“OLE对象未注册”等错误,或者并没有
出错但是得不到希望的结果,比如不能将选中的网页内容复制到剪贴板等。以前用它
编程的时候,我发现ExecWB有时侯起作用但有时侯又不行,在Delphi生成的缺省工程
主窗口上加入TWebBrowser,运行时并不会出现“OLE对象未注册”的错误。同样是一
个偶然的机会,我才知道OLE对象需要初始化和终止化(懂得的东东实在太少了)。
  我用我的前一篇文章《Delphi程序窗口动画&正常排列平铺的解决》所说的方法
编程,运行时出了上面所说的错误,我便猜想应该有OleInitialize之类的语句,于
是,找到并加上了下面几句话,终于搞定!究其原因,我想大概是由于TWebBrowser
是一个嵌入的OLE对象而不算是用Delphi编写的VCL吧。

  initialization
   OleInitialize(nil);
  finalization
   try
    OleUninitialize;
   except
   end;

  这几句话放在主窗口所有语句之后,“end.”之前。

--------------------------------------------------------------------------
------------------------------

2、EmptyParam

  在Delphi 5中TWebBrowser的Navigate方法被多次重载:

  procedure Navigate(const URL: WideString); overload;
  procedure Navigate(const URL: WideString; var Flags: OleVariant);
overload;
  procedure Navigate(const URL: WideString; var Flags: OleVariant; var
TargetFrameName:     OleVariant); overload;
  procedure Navigate(const URL: WideString; var Flags: OleVariant; var
TargetFrameName:     OleVariant; var PostData: OleVariant); overload;
  procedure Navigate(const URL: WideString; var Flags: OleVariant; var
TargetFrameName:     OleVariant; var PostData: OleVariant; var
Headers: OleVariant); overload;

  而在实际应用中,使用后几种方法调用时,由于我们很少用到后面几个参数,但
函数声明又要求是变量参数,一般的做法如下:

  var
   t:OleVariant;
  begin
   webbrowser1.Navigate(edit1.text,t,t,t,t);
  end;

  需要定义变量t(还有很多地方要用到它),很麻烦。其实我们可以用
EmptyParam来代替(EmptyParam是一个公用的Variant空变量,不要对它赋值),只
需一句话就可以了:

  
webbrowser1.Navigate(edit1.text,EmptyParam,EmptyParam,EmptyParam,EmptyPara
m);

  虽然长一点,但比每次都定义变量方便得多。当然,也可以使用第一种方式。

  webbrowser1.Navigate(edit1.text)

--------------------------------------------------------------------------
------------------------------

3、命令操作

  常用的命令操作用ExecWB方法即可完成,ExecWB同样多次被重载:

  procedure ExecWB(cmdID: OLECMDID; cmdexecopt: OLECMDEXECOPT);
overload;
  procedure ExecWB(cmdID: OLECMDID; cmdexecopt: OLECMDEXECOPT; var
pvaIn:
    OleVariant); overload;
  procedure ExecWB(cmdID: rOLECMDID; cmdexecopt: OLECMDEXECOPT; var
pvaIn:
    OleVariant; var pvaOut: OleVariant); overload;

  打开: 弹出“打开Internet地址”对话框,CommandID为OLECMDID_OPEN(若浏
览器版本为IE5.0,
      则此命令不可用)。
  另存为:调用“另存为”对话框。
      ExecWB(OLECMDID_SAVEAS,OLECMDEXECOPT_DODEFAULT, EmptyParam,
           EmptyParam);


  打印、打印预览和页面设置: 调用“打印”、“打印预览”和“页面设置”对
话框(IE5.5及以上版本才支持打
                印预览,故实现应该检查此命令是否可用)。
      ExecWB(OLECMDID_PRINT, OLECMDEXECOPT_DODEFAULT, EmptyParam,
           EmptyParam);
      if QueryStatusWB(OLECMDID_PRINTPREVIEW)=3 then
       ExecWB(OLECMDID_PRINTPREVIEW, OLECMDEXECOPT_DODEFAULT,
           EmptyParam,EmptyParam);
      ExecWB(OLECMDID_PAGESETUP, OLECMDEXECOPT_DODEFAULT,
EmptyParam,
           EmptyParam);


  剪切、复制、粘贴、全选: 功能无须多说,需要注意的是:剪切和粘贴不仅对
编辑框文字,而且对网页上的非编
               辑框文字同样有效,用得好的话,也许可以做出功
能特殊的东东。获得其命令使能状
               态和执行命令的方法有两种(以复制为例,剪切、
粘贴和全选分别将各自的关键字替
               换即可,分别为CUT,PASTE和SELECTALL):
   A、用TWebBrowser的QueryStatusWB方法。
     if(QueryStatusWB(OLECMDID_COPY)=OLECMDF_ENABLED) or
      OLECMDF_SUPPORTED) then
      ExecWB(OLECMDID_COPY, OLECMDEXECOPT_DODEFAULT, EmptyParam,
           EmptyParam);
   B、用IHTMLDocument2的QueryCommandEnabled方法。
     var
      Doc: IHTMLDocument2;
     begin
      Doc :=WebBrowser1.Document as IHTMLDocument2;
      if Doc.QueryCommandEnabled('Copy') then
       Doc.ExecCommand('Copy',false,EmptyParam);
     end;

  查找: 参考第九条“查找”功能。

--------------------------------------------------------------------------
------------------------------

4、字体大小

  类似“字体”菜单上的从“最大”到“最小”五项(对应整数0~4,Largest等
假设为五个菜单项的名字,Tag 属性分别设为0~4)。
   A、读取当前页面字体大小。
     var
      t: OleVariant;
     Begin
      WebBrowser1.ExecWB(OLECMDID_ZOOM,
OLECMDEXECOPT_DONTPROMPTUSER,
       EmptyParam,t);
      case t of
      4: Largest.Checked :=true;
      3: Larger.Checked :=true;
      2: Middle.Checked :=true;
      1: Small.Checked :=true;
      0: Smallest.Checked :=true;
      end;
     end;
   B、设置页面字体大小。
     Largest.Checked :=false;
     Larger.Checked :=false;
     Middle.Checked :=false;
     Small.Checked :=false;
     Smallest.Checked :=false;
     TMenuItem(Sender).Checked :=true;
     t :=TMenuItem(Sender).Tag;
     WebBrowser1.ExecWB(OLECMDID_ZOOM, OLECMDEXECOPT_DONTPROMPTUSER,
      t,t);

--------------------------------------------------------------------------
------------------------------

5、添加到收藏夹和整理收藏夹

    const
     CLSID_ShellUIHelper: TGUID =
'{64AB4BB7-111E-11D1-8F79-00C04FC2FBE1}';

    var
     p:procedure(Handle: THandle; Path: PChar); stdcall;

    procedure TForm1.OrganizeFavorite(Sender: Tobject);
    var
     H: HWnd;
    begin
     H := LoadLibrary(PChar('shdocvw.dll'));
     if H <> 0 then
     begin
    p := GetProcAddress(H, PChar('DoOrganizeFavDlg'));
      if Assigned(p) then p(Application.Handle, PChar(FavFolder));
     end;
     FreeLibrary(h);
    end;
    
    procedure TForm1.AddFavorite(Sender: TObject);
    var
     ShellUIHelper: ISHellUIHelper;
     url, title: Olevariant;
    begin
     Title := Webbrowser1.LocationName;
     Url := Webbrowser1.LocationUrl;
     if Url <> '' then
     begin
      ShellUIHelper := CreateComObject(CLSID_SHELLUIHELPER) as
IShellUIHelper;
      ShellUIHelper.AddFavorite(url, title);
     end;
    end;

--------------------------------------------------------------------------
------------------------------

6、使WebBrowser获得焦点

  TWebBrowser非常特殊,它从TWinControl继承来的SetFocus方法并不能使得它所
包含的文档获得焦点,从而不能立即使用Internet Explorer本身具有得快捷键,解
决方法如下:<

  procedure TForm1.SetFocusToDoc;
  begin
   if WebBrowser1.Document <> nil then
    with WebBrowser1.Application as IOleobject do
     DoVerb(OLEIVERB_UIACTIVATE, nil, WebBrowser1, 0, Handle,
GetClientRect);
  end;

  除此之外,我还找到一种更简单的方法,这里一并列出:

  if WebBrowser1.Document <> nil then
   
IHTMLWindow2(IHTMLDocument2(WebBrowser1.Document).ParentWindow).focus

  刚找到了更简单的方法,也许是最简单的:

  if WebBrowser1.Document <> nil then
   IHTMLWindow4(WebBrowser1.Document).focus

  还有,需要判断文档是否获得焦点这样来做:

  if IHTMLWindow4(WebBrowser1.Document).hasfocus then

--------------------------------------------------------------------------
------------------------------

7、点击“提交”按钮

  如同程序里每个窗体上有一个“缺省”按钮一样,Web页面上的每个Form也有一
个“缺省”按钮——即属性为“Submit”的按钮,当用户按下回车键时就相当于鼠标
单击了“Submit”。但是TWebBrowser似乎并不响应回车键,并且,即使把包含
TWebBrowser的窗体的KeyPreview设为True,在窗体的KeyPress事件里还是不能截获
用户向TWebBrowser发出的按键。
  我的解决办法是用ApplicatinEvents构件或者自己编写TApplication对象的
OnMessage事件,在其中判断消息类型,对键盘消息做出响应。至于点击“提交”按
钮,可以通过分析网页源代码的方法来实现,不过我找到了更为简单快捷的方法,有
两种,第一种是我自己想出来的,另一种是别人写的代码,这里都提供给大家,以做
参考。

  A、用SendKeys函数向WebBrowser发送回车键
    在Delphi 5光盘上的Info/Extras/SendKeys目录下有一个SndKey32.pas文
件,其中包含了两个函数SendKeys和AppActivate,我们可以用SendKeys函数来向
WebBrowser发送回车键,我现在用的就是这个方法,使用很简单,在WebBrowser获得
焦点的情况下(不要求WebBrowser所包含的文档获得焦点),用一条语句即可:

   Sendkeys('~',true);// press RETURN key

   SendKeys函数的详细参数说明等,均包含在SndKey32.pas文件中。

  B、在OnMessage事件中将接受到的键盘消息传递给WebBrowser。

   procedure TForm1.ApplicationEvents1Message(var Msg: TMsg; var
Handled: Boolean);
   {fixes the malfunction of some keys within webbrowser control}
   const
    StdKeys = [VK_TAB, VK_RETURN]; { standard keys }
    ExtKeys = [VK_DELETE, VK_BACK, VK_LEFT, VK_RIGHT]; { extended
keys }
    fExtended = $01000000; { extended key flag }
   begin
    Handled := False;
    with Msg do
    if ((Message >= WM_KEYFIRST) and (Message <= WM_KEYLAST)) and
     ((wParam in StdKeys) or
     {$IFDEF VER120}(GetKeyState(VK_CONTROL) < 0) or {$ENDIF}
     (wParam in ExtKeys) and
     ((lParam and fExtended) = fExtended)) then
    try
     if IsChild(Handle, hWnd) then { handles all browser related
messages }
     begin
      with {$IFDEF VER120}Application_{$ELSE}Application{$ENDIF} as
        IOleInPlaceActiveObject do
       Handled := TranslateAccelerator(Msg) = S_OK;
       if not Handled then
       begin
        Handled := True;
        TranslateMessage(Msg);
        DispatchMessage(Msg);
       end;
       end;
    except
    end;
   end; // MessageHandler

  (此方法来自EmbeddedWB.pas)

--------------------------------------------------------------------------
------------------------------

8、直接从TWebBrowser得到网页源码及Html

  下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般
方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实
现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得
IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,
再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不
再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获
取网页源码也是一样。下面的代码将网页源码显示在Memo1中。

   
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);

  同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单
了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:

   
Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);

--------------------------------------------------------------------------
------------------------------

9、“查找”功能

  查找对话框可以在文档获得焦点的时候通过按键Ctrl-F来调出,程序中则调用
IOleCommandTarget对象的成员函数Exec执行OLECMDID_FIND操作来调用,下面给出的
方法是如何在程序中用代码来做出文字选择,即你可以自己设计查找对话框。

   var
    Doc: IHtmlDocument2;
    TxtRange: IHtmlTxtRange;
   begin
    Doc :=WebBrowser1.Document as IHtmlDocument2;
    Doc.SelectAll;    //此处为简写,选择全部文档的方法请参见第三条
命令操作
                //这句话尤为重要,因为IHtmlTxtRange对象的
方法能够操作的前提是
                //Document已经有一个文字选择区域。由于接着
执行下面的语句,所以不会
                //看到文档全选的过程。
    TxtRange :=Doc.Selection.CreateRange as IHtmlTxtRange;
    TxtRange.FindText('Text to be searched',0.0);
    TxtRange.Select;
   end;

  还有,从Txt.Get_text可以得到当前选中的文字内容,某些时候是有用的。

--------------------------------------------------------------------------
------------------------------

10、提取网页中所有链接

  这个方法来自大富翁论坛hopfield朋友的对一个问题的回答,我本想自己试验,
但总是没成功。

  var
   doc:IHTMLDocument2;
   all:IHTMLElementCollection;
   len,i:integer;
   item:OleVariant;
  begin
   doc:=WebBrowser1 .Document as IHTMLDocument2;
   all:=doc.Get_links;             //doc.Links亦可
   len:=all.length;
   for i:=0 to len-1 do begin
    item:=all.item(i,varempty);        //EmpryParam亦可
    memo1.lines.add(item.href);
   end;
  end;

--------------------------------------------------------------------------
------------------------------

11、设置TWebBrowser的编码

  为什么我总是错过很多机会?其实早就该想到的,但是一念之差,便即天壤之
别。当时我要是肯再多考虑一下,多试验一下,这就不会排到第11条了。下面给出
一个函数,搞定,难以想象的简单。

  procedure SetCharSet(AWebBrowser: TWebBrowser; ACharSet: String);
  var
   RefreshLevel: OleVariant;
  Begin
   IHTMLDocument2(AWebBrowser.Document).Set_CharSet(ACharSet);
   RefreshLevel :=7;              //这个7应该从注册表来,
帮助有Bug。
   AWebBrowser.Refresh2(RefreshLevel);
 
这样写试试看,你得有WebBrowser控件,另外在Uses里加上MsHtml。
procedure TForm1.Button1Click(Sender: TObject);
var
i,j:integer;
ovTable:OleVariant;
str:string;
begin
RichEdit1.Clear;
try
ovTable:=WebBrowser1.OleObject.Document.all.tags('TABLE').item(0);
for i:=0 to (ovTable.Rows.Length-1) do
begin
for j:=0 to (ovTable.Rows.item(i).cells.length-1) do
begin
str:=ovTable.Rows.item(i).Cells.item(j).innerText;
RichEdit1.Lines.Add(str);
end;
end;
except
end;
这样能获得简单网页表格的数据,但是对于不同的网页表格,有不同的风格和排版,比如有嵌套的表格等等,那就要根据具体的来分析了!
 
首先是GoBack
try
WebBrowser1.GoBack;
WebBrowser1.GoBack;
WebBrowser1.GoForward;
except
//到头后的处理;
end;

类似的是GoForword

try
WebBrowser1.GoForward;
WebBrowser1.GoForward;
WebBrowser1.GoBack;
except
//到尾后的处理;
end;
 
谢谢阿狗兄了!
 
后退
顶部