请教~如何获取任一个网页中包含的全部URL地址 ( 积分: 100 )

  • 主题发起人 主题发起人 studyhust
  • 开始时间 开始时间
S

studyhust

Unregistered / Unconfirmed
GUEST, unregistred user!
如题,本人用http.get,可获取网页的内容,然后用字符串处理函数从里面截取要的URL,但是网页不同又要重新改写,所以请教各位有没有什么办法,把一个网页里面的全部URL地址获取下来~而且去大多的网站都通用
 
可以借助HTML分析工具或IHtmlDocument分析Html
 
可以用正则表达式去对文本分析

同时要处理好html文件编码,
如 utf-8, unicode gb2312,有些 utf-8 还没有efbbbf 前缀,

还要注意 charset 编码
 
用正则表达式
 
后退
顶部