C
ChenXian
Unregistered / Unconfirmed
GUEST, unregistred user!
我从已知道的网站上下载它的一些网页文件,
现在让我困惑的或者说没有头绪的事情是:
问题一:我怎么认为这个网页是一个新闻的网页,新闻的网页有哪些特征呢?
问题二:我解析出这个网页的内容(全是html的脚本),也可以提取网页真正的内容,又怎么确定哪些是新闻标题,哪些是新闻正文开始了,哪些是这个新闻的来源通讯社呢?
问题还有不少,真诚期盼高手为我指点思路。。。。。。。。。。
现在让我困惑的或者说没有头绪的事情是:
问题一:我怎么认为这个网页是一个新闻的网页,新闻的网页有哪些特征呢?
问题二:我解析出这个网页的内容(全是html的脚本),也可以提取网页真正的内容,又怎么确定哪些是新闻标题,哪些是新闻正文开始了,哪些是这个新闻的来源通讯社呢?
问题还有不少,真诚期盼高手为我指点思路。。。。。。。。。。