怎么在HTML中提取特定字符串? ( 积分: 100 )

  • 主题发起人 主题发起人 hhsj
  • 开始时间 开始时间
H

hhsj

Unregistered / Unconfirmed
GUEST, unregistred user!
从浏览器得到HTML文件后,想在里面提取字符串,请问各位大虾怎么做?谢谢。
 
http://sourceforge.net/index.php中有Spider示例
 
没有人回答?
 
有什么专门的方法吗?针对网页源代码?
 
自己写一个符合自己需要的函数不就专门的方法了.:)
 
如果提取的是HTML中特殊的、有规律的字符串(如链接等),可以定义你自己的正则表达式,然后提取,方便快捷。[:)]
 
同意楼上,可以用三方类regexpr操作
 
应该是读取好HTML的代码后,转换为正常的&quot;文字&quot;,因为比如&quot;<>&quot;等在HTML源代码中是进行转义了的,所以需要转换,转换好后,就简单了,一个循环POS就能找到所有的特定字符串了.
 
要看具体的东东咯 有时候 必须自己写一很复杂的函数 有时候有很多现成的函数 HTML提取说复杂就复杂 说简单就简单 但是 绝对没有万能提取函数
 
后退
顶部