H hhsj Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-13 #1 从浏览器得到HTML文件后,想在里面提取字符串,请问各位大虾怎么做?谢谢。
S Supermay Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-13 #2 http://sourceforge.net/index.php中有Spider示例
J jrq Unregistered / Unconfirmed GUEST, unregistred user! 2007-09-15 #7 如果提取的是HTML中特殊的、有规律的字符串(如链接等),可以定义你自己的正则表达式,然后提取,方便快捷。[]
X xnetec Unregistered / Unconfirmed GUEST, unregistred user! 2007-10-18 #9 应该是读取好HTML的代码后,转换为正常的"文字",因为比如"<>"等在HTML源代码中是进行转义了的,所以需要转换,转换好后,就简单了,一个循环POS就能找到所有的特定字符串了.
应该是读取好HTML的代码后,转换为正常的"文字",因为比如"<>"等在HTML源代码中是进行转义了的,所以需要转换,转换好后,就简单了,一个循环POS就能找到所有的特定字符串了.
冰 冰力不足 Unregistered / Unconfirmed GUEST, unregistred user! 2007-10-18 #10 要看具体的东东咯 有时候 必须自己写一很复杂的函数 有时候有很多现成的函数 HTML提取说复杂就复杂 说简单就简单 但是 绝对没有万能提取函数