做过互联网上的新闻搜索引擎的高手,请进来帮我指点指点! ( 积分: 100 )

  • 主题发起人 主题发起人 ChenXian
  • 开始时间 开始时间
C

ChenXian

Unregistered / Unconfirmed
GUEST, unregistred user!
我从已知道的网站上下载它的一些网页文件,
现在让我困惑的或者说没有头绪的事情是:
问题一:我怎么认为这个网页是一个新闻的网页,新闻的网页有哪些特征呢?

问题二:我解析出这个网页的内容(全是html的脚本),也可以提取网页真正的内容,又怎么确定哪些是新闻标题,哪些是新闻正文开始了,哪些是这个新闻的来源通讯社呢?

问题还有不少,真诚期盼高手为我指点思路。。。。。。。。。。
 
我从已知道的网站上下载它的一些网页文件,
现在让我困惑的或者说没有头绪的事情是:
问题一:我怎么认为这个网页是一个新闻的网页,新闻的网页有哪些特征呢?

问题二:我解析出这个网页的内容(全是html的脚本),也可以提取网页真正的内容,又怎么确定哪些是新闻标题,哪些是新闻正文开始了,哪些是这个新闻的来源通讯社呢?

问题还有不少,真诚期盼高手为我指点思路。。。。。。。。。。
 
呵呵,判断新闻网页?news,好难啊
 
我用google和baidu的新闻搜索,它们搜出来的几乎都是新闻条目,
难度他们有什么人工再处理,我想想不可能吧,新闻网页这么海量,忙的过来吗?
 
过滤关键字
 
楼上,能否说详细点,比如什么关键词啊,我看过不少网站的新闻页,好像都有所不同呢
 
网页快照
 

Similar threads

S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
1K
DelphiTeacher的专栏
D
后退
顶部