Internet Explorer 编程简述(十)响应来自HTML Element的事件通知——几个好用的类

——谨以怀念研究Internet Explorer编程的青春岁月

Posted by eagleboost on March 11, 2006

本文转载自我2006年在csdn发布的博客(原链接已失效)

1. 概述

实现了对Webbrowserresue之后我们便会发现有时候我们还需要处理浏览器中的元素(HTML Element)。这种处理包括主动和被动两个方面,像《FAQ:如何访问Webbrowser的滚动条》、《FAQ:操纵下拉列表》、《FAQ:两种方法访问多层嵌套的frame》等 文章所演示的就是主动的处理。通常我们从Webbrowser获得一个Web文档接口(IHTMLDocumentx),从它出发便可访问到浏览器所包含 的一切HTML元素。而被动的处理则是在COM技术中称为Sink的技术,我更喜欢的说法是事件通知。当文档的下载进度发生变化时,我们可以获得ProgressChange通知,当Webbrowser下载完HTML文档时,我们可以获得DocumentComplete的通知,而当链接被点 击,或图片被拖动时,我们如何获得通知呢?本文希望能够给出部分的答案。

2. HtmlObj Template

如何Sink一个HTML Element并不是本文的重点,其理论我不是太了解,也懒得去搞透彻,所以使用现成的库来实现。CodeProject上的一篇文章《HtmlObj Template》给出的一个模板类CHtmlObj就非常好用。下面的例子是针对Html Anchor Element的一个实例化。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include "HtmlObj.h"
 
class CHtmlAnchorElement : public CHtmlObj<IHTMLAnchorElement, &DIID_HTMLAnchorEvents> 
{
public:
  CHtmlAnchorElement(CHtmlDocument2* pParentDoc2);
  virtual ~CHtmlAnchorElement();
  virtual HRESULT OnInvoke(DISPID dispidMember, REFIID riid, LCID lcid, WORD wFlags,DISPPARAMS * pdispparams, VARIANT * pvarResult, EXCEPINFO * pexcepinfo, UINT * puArgErr);
};

HRESULT CHtmlAnchorElement::OnInvoke(DISPID dispidMember, REFIID riid, LCID lcid, WORD wFlags,DISPPARAMS * pdispparams, VARIANT * pvarResult, EXCEPINFO * pexcepinfo, UINT * puArgErr)
{
  HRESULT hr = E_NOTIMPL;
  switch(dispidMember)
  {
  case DISPID_HTMLELEMENTEVENTS_ONMOUSEOVER :
  { //当鼠标经过链接时,我们在这里获得通知
    hr = S_OK;
    // TODO: add code to handle on mouse over events
    break;
  }
  case DISPID_HTMLELEMENTEVENTS_ONMOUSEOUT :
  { //当鼠标从链接上移开时,我们在这里获得通知,其它的Dispatch ID可根据需要添加
    hr = S_OK;
    // TODO: add code to handle on mouse out events
    break;
  }
  default:
    break;
  }
  
  return hr;
}

当我们得到某个链接的HTML接口指针,便可调用CHtmlAnchorElement继承自CHtmlObjSetSite(IUnknown *pUnkSite)成员函数传入该接口指针。在CHtmlObj类内部用一个智能指针m_spHtmlObj来保存相应的HTML Element接口指针,所以当上面的ONMOUSEHOVERONMOUSEOUT两个事件通知到达时,从m_spHtmlObj就可以访问IHTMLAnchorElement的所有成员,如从href获得链接的Url等,此处不再赘述。

3. CHtmlElements类

有 了CHtmlObj之后我们又会发现实践中常常会需要多个相同类型的CHtmlObj。比如包含Frame的网页中每个FrameHTML Document都需要一个CHtmlObj来Sink其事件。所以我们还需要有效地管理这些相同类型的CHtmlObj。下面是我写的一个简单的模板类CHtmlElements,它通过CMap来管理多个CHtmlObj对象。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
template<class THtmlElement> class CHtmlElements
{
  typedef CMap<LPDISPATCH, LPDISPATCH, THtmlElement*, THtmlElement*> CMapDispToHtmlElement;
CMapDispToHtmlElement m_htmlElements;
  BOOL IsSiteConnected( LPDISPATCH pDisp )
  {
    THtmlElement *pElement;
    return m_htmlElements.Lookup( pDisp, pElement );
  }
public :
  CHtmlElements( void )
  {
  }
  ~CHtmlElements( void )
  {
  }
public :
  void SetSite( LPDISPATCH pDisp )
  {
    if ( IsSiteConnected( pDisp ) ) //检查以避免多余的Sink
    {
      return ;
    }
    THtmlElement *pElement = new THtmlElement; //通过模板类型创建相应的类的实例进行连接
    pElement->SetSite( pDisp );
    m_htmlElements.SetAt( pDisp, pElement );
  }
 
  //在合适的地方调用Clear释放所管理的内存

  void Clear(void)
  {
    POSITION pos = m_htmlElements.GetStartPosition();

    THtmlElement *pElement = NULL;
    LPDISPATCH pDisp = NULL;
    while (pos != NULL)
    {
      m_htmlElements.GetNextAssoc( pos, pDisp, pElement );
      m_htmlElements.RemoveKey( pDisp );
      delete pElement;
    }
  }
};

假设我们有一个象CHtmlAnchorElement那样派生自CHtmlObj的类CHtmlDocument2,使用CHtmlElements时这样声明:

1
2
3
4
5
6
7
8
9
typedef CHtmlElements<CHtmlDocument2> CHtmlDocuments;
typedef CHtmlElements<CHtmlAnchorElement> CHtmlAnchors;
 
class CMyView : public CHtmlView
{
  private :
  CHtmlDocuments m_htmlDocs;
  CHtmlAnchors m_htmlAnchors;
}

DocumentComplete时就可以这样连接到浏览器的文档对象:

1
2
3
4
void CMyView ::OnDocumentComplete(LPDISPATCH pDisp, LPCTSTR lpszURL)
{
  m_htmlDocs.SetSite(pDisp);
}

如果想一次性连接上文档中所有的Anchor Element,可以通过IHTMLDocument2::get_anchors获得包含所有IHTMLAnchorElement接口指针的IHTMLElementCollection,再遍历其中的每个元素,分别调用m_htmlAnchors.SetSite即可。当然,一次性的Sink全部链接可能并不是个好注意,我更愿意在CHtmlDocument2中响应事件再通过其它手段来访问当前位置的HTML Element

4. 结论

响应HTML Element的事件通知对于浏览器编程来说是一个非常强大的手段,它可以更深入细化地控制浏览器中的文档及其HTML元素,实现更为高级的功能,比如所谓的“超级拖放”(许多多窗口浏览器都提供了该功能,但实际上没有哪个浏览器完美地实现了对URL、文字及图片的拖放)。

5. 参考资料

Codeproject:《HtmlObj Template