L LeeQme Unregistered / Unconfirmed GUEST, unregistred user! 2006-11-16 #1 RT.仅针对知URL可以得到源码的网站.最好是多线程对整站进行分析.
E eonzhang Unregistered / Unconfirmed GUEST, unregistred user! 2006-11-17 #3 使用TWebBrowser控件的HTMLDocument2接口可以获得网页的body,link等,但是要自动的分析完整个网站的所有网页的话,我建议你先分析一下这个网站的网页是怎么安排的,网页与网页之间有没有什么规律,这样,可以通过链接的变换,每次给控件提供一个URL,那么就可以分析完整个网站了。至于网页信息提取,不妨你可以看一下中科院的一个中文信息处理平台,上面有一些论文和一些例子。
使用TWebBrowser控件的HTMLDocument2接口可以获得网页的body,link等,但是要自动的分析完整个网站的所有网页的话,我建议你先分析一下这个网站的网页是怎么安排的,网页与网页之间有没有什么规律,这样,可以通过链接的变换,每次给控件提供一个URL,那么就可以分析完整个网站了。至于网页信息提取,不妨你可以看一下中科院的一个中文信息处理平台,上面有一些论文和一些例子。
0 0桁骀 Unregistered / Unconfirmed GUEST, unregistred user! 2006-11-18 #4 网中戏兄弟:请你自重 to 楼主 2ccc上面有个例子,是多线程获得网页数据的,可以参考一下 http://www.2ccc.com/article.asp?articleid=3786,代码作者已经建立了一个qq群,可以区交流
网中戏兄弟:请你自重 to 楼主 2ccc上面有个例子,是多线程获得网页数据的,可以参考一下 http://www.2ccc.com/article.asp?articleid=3786,代码作者已经建立了一个qq群,可以区交流