如何用正则表达式删除字符串里的日文字符? ( 积分: 100 )

  • 主题发起人 主题发起人 eaglepsm
  • 开始时间 开始时间
E

eaglepsm

Unregistered / Unconfirmed
GUEST, unregistred user!
在网上找到一段VB代码,也许有用,但不知怎么做
来自://http://www.yongfa365.com/Item/2383e36c2dbcd075.html
'把所有日文删除
'柳永法修正版
Function filteJapanese(sStr)
Dim oRegExp
Set oRegExp = New RegExp
oRegExp.Global = True
oRegExp.Pattern = "[/u3040-/u309F/u30A0-/u30FF]"
filteJapanese = oRegExp.Replace(sStr, "")
Set oRegExp = Nothing
End Function

这个函数其实在网上是有的,并且被疯狂的转载,所有我找到了,但发现一个问题就是:

他原来的正则里面是这么写的 "[/u3040-/u309F|/u30A0-/u30FF]" 比我现在的多了一个“|”然而,他的是错的,我的是对的,大家可以试一下他的那个函数,他会把文章内的所有“|”也替换成空。
 
推荐一本书<<正则表达式>>,解决你的问题就是小菜!
 
正在学习TRegExpr,不知道不同的控件正则表达式的语法是不是一样的
 
不知道不用正则表达式可不可以,听说日文就只有26个字母,如果是这样的话,写26个StringReplace就行了,可惜没学过日文
 
理论上 降级到 gb2312 就可以了。。
 
还是没解决,我用TRegExpr,Expression设为/x{A4B3},找これはのテキストです,明明就是第一个,但怎么找不到呢?难道是我的TRegExpr版本太低?我用的是0.94版本的,它的help说可以支持unicode(条件编译{$DEFINE UniCode}已经加上),只是速度慢一点而已。
 
后退
顶部