这里有一个<a href="http://vcl.vclxx.com/DELPHI/D32FREE/HTMLPRSR.ZIP">HTML语法解析的控件</a>,可以将HTML文件中任意文本取出。
以下是我翻的简单说明,将就着看吧;-)
使用本单元须按一下步骤进行:
1、建立一个THtmlParser对象,将其Text属性设为你想解析的HTML文本;
2、使用以下两个方法在文本中自由移动:
NextTag --- 移动到下一个HTML标签(当Text属性被设置时,当前位置为文本起始处;
PrevTag --- 移动到上一个HTML标签
当前标签可由Tag属性获得。
TextBetween属性的内容为两个标签之间的文本。
3、其他有用的方法:
LoadFromFile --- 从磁盘中指定文件调入文本。
SaveToFile --- 将文本存盘。
GotoBeginning --- 设置文本起始处为当前位置(Tag和TextBetween两个属性置空)。
GotoEnd --- 设置文本结尾处为当前位置(Tag和TextBetween两个属性置空)。
RemoveTag --- 删除当前的标签
InsertTag --- 在当前标签之前插入一个新标签。
InsertText --- 在当前位置插入一些文本。
4、使用TTag对象存取<>之间的任何文本。
Name --- 标签名(如:'TABLE','IMG' 和'/BODY'),总是以大写形式返回。
Params --- 包括所有参数的TStringList。
(每一行的形式,如'width=100' 或 'ALT="my image"')
提示:可以使用TStringList的Names,Values属性