T
ts007
Unregistered / Unconfirmed
GUEST, unregistred user!
最近有些网站上有了破坏民族团结,反对祖国统一和色情内容的网页
这些内容严重的影响了民族团结和社会文化。
为了找出这类内容的网页,我准备开发一个程序检索某一个网站的内容!
但我不太肯定我的思路,希望大家多多帮助
////////////////////////////////////////////
form 上有一个edit和一个memo控件
edit上输入网址后按回车,先把网页的html内容下在到memo上,然后从memo里查询敏感词
(有一个敏感词数据库)
然后分析html内容,判断网页连接。如果有和首页连接的网页,那么它的内容也下载到memo上
又进行查询。。。。。。。。。。。。。。。。。。。。。。。
这样下去可以能检索整个网站的内容
/////////////////////////////////////////////
上面的是我的初步想法,希望各位提出好的建议和意见
希望大家提供参考资料!!
怎样能最快速的下载网页内容?
能不能判断网页中的连接?
/////////////////////////////
我们不是管理员,我们的目的就是检索某些检索网页内容!!!!!!!!!
这些内容严重的影响了民族团结和社会文化。
为了找出这类内容的网页,我准备开发一个程序检索某一个网站的内容!
但我不太肯定我的思路,希望大家多多帮助
////////////////////////////////////////////
form 上有一个edit和一个memo控件
edit上输入网址后按回车,先把网页的html内容下在到memo上,然后从memo里查询敏感词
(有一个敏感词数据库)
然后分析html内容,判断网页连接。如果有和首页连接的网页,那么它的内容也下载到memo上
又进行查询。。。。。。。。。。。。。。。。。。。。。。。
这样下去可以能检索整个网站的内容
/////////////////////////////////////////////
上面的是我的初步想法,希望各位提出好的建议和意见
希望大家提供参考资料!!
怎样能最快速的下载网页内容?
能不能判断网页中的连接?
/////////////////////////////
我们不是管理员,我们的目的就是检索某些检索网页内容!!!!!!!!!