如何提取网页中的文本(16分)

  • 主题发起人 主题发起人 gdjyxsx
  • 开始时间 开始时间
G

gdjyxsx

Unregistered / Unconfirmed
GUEST, unregistred user!
小弟拜求:提取网页中的正文文本的正则表达式,或方法
 
关注,我现在也遇到同样的问题!
 
正则表达式只适应有规律的文本,如提取电话号码,邮件地址等。
 
我的方法是:如果是提取某一块特定的内容则用查找关键字的方法,设定好首尾关键字,提取中间的内容;如果是提取某一些具有特定规则的内容(例如Email)则用正则,盒子论坛有一个俄国人写的正则控件TRegExp还不错,我一直用他这个
 
多人接受答案了。
 

Similar threads

后退
顶部