如何分析网站,并从中提取出有用的信息?(100分)

LeeQme · 2006-11-16

RT.仅针对知URL可以得到源码的网站.最好是多线程对整站进行分析.

网中戏 · 2006-11-17

eonzhang · 2006-11-17

使用TWebBrowser控件的HTMLDocument2接口可以获得网页的body，link等，但是要自动的分析完整个网站的所有网页的话，我建议你先分析一下这个网站的网页是怎么安排的，网页与网页之间有没有什么规律，这样，可以通过链接的变换，每次给控件提供一个URL，那么就可以分析完整个网站了。至于网页信息提取，不妨你可以看一下中科院的一个中文信息处理平台，上面有一些论文和一些例子。

0桁骀 · 2006-11-18

网中戏兄弟：请你自重

to 楼主

2ccc上面有个例子，是多线程获得网页数据的，可以参考一下
http://www.2ccc.com/article.asp?articleid=3786，代码作者已经建立了一个qq群，可以区交流

LeeQme · 2006-11-28

自己解决了。

LeeQme · 2006-11-28

已自决，谢谢大家！

LeeQme · 2006-11-28

多人接受答案了。

如何分析网站,并从中提取出有用的信息?(100分)

LeeQme

Unregistered / Unconfirmed

网中戏

Unregistered / Unconfirmed

eonzhang

Unregistered / Unconfirmed

0桁骀

Unregistered / Unconfirmed

LeeQme

Unregistered / Unconfirmed

LeeQme

Unregistered / Unconfirmed

LeeQme

Unregistered / Unconfirmed

Similar threads