java 中汉字字符长度的问题 ( 积分: 100 )

  • 主题发起人 主题发起人 飘叶
  • 开始时间 开始时间
转一篇文章:
====================================
以前我用VB,很快得出了这个想要的结果:
Dim ascStr as string = ASC(TextBox.Text(0))
可是我用C#了,对这个看似简单的,也费尽了脑。
string ascStr = (int)textBox1.Text[0];
能对付abcd.....及+_(),但对“我,你、他”就没办法了,不信你试试:
比较VB的ASC——C#的int值:
VB(ASC)的我:-12590
C#(INT)的我:25105,减(2^16=65536)为:-40431
哭了......

我看书,找不到,看帮助。但C#确实麻烦,一大堆不知道的东西,
什么ASCIIEncoding,结果得到的是63,解释为不能识别的编码,这倒好,以后只要是中文,全是63,
试了UTF8的,Unicode,真是不知所云,平常对编码太不熟悉了。
最后用Encoding类,可是还是得不到结果。找啊找......,结果发现中文支持,要支持中文,它的编码名称为GB18030,代码页54936,
用C#语句:
Encoding ecode = Encoding.GetEncoding("GB18030");
开始写代码:
Encoding ecode = Encoding.GetEncoding("GB18030");
Byte[] codeBytes = ecode.GetBytes(chr.ToString());
MessageBox.Show( codeBytes[0].ToString() );
结果得到了个百位数的值,又不行。
忽然想到了中文字都是双字节的,就用一个函数判断一下,该字符是否为双字节
/// <summary>
/// 是否为双字节字符。
/// </summary>
public static bool IsTwoBytesChar(char chr)
{
string str =chr.ToString();
// 使用中文支持编码
Encoding ecode = Encoding.GetEncoding(&quot;GB18030&quot;);
if (ecode.GetByteCount(str) == 2)
{
return true;
}
else
{
return false;
}
}
好了,就来得到这个ASCII码:
/// <summary>
/// 得到字符的ASCII码
/// </summary>
public static int ASCII(char chr)
{
Encoding ecode = Encoding.GetEncoding(&quot;GB18030&quot;);
Byte[] codeBytes = ecode.GetBytes(chr.ToString());
if ( IsTwoBytesChar(chr) )
{
// 双字节码为高位乘256,再加低位
// 该为无符号码,再减65536
return (int)codeBytes[0] * 256 + (int)codeBytes[1] - 65536;
}
else
{
return (int)codeBytes[0];
}
}
测试:输入“我”
终于得到了想要的:-12590

我不知在做什么,为了这个简单的功能,就好象到黄山去旅游,结果坐船先到美洲,再到欧洲,再到三峡,再到黄山。
就因为,我找不到直接去黄山的专车,如果谁知道了,来告诉一下。
不过没关系,我风景看够了。
 
“中” 的ASCII码是214、208 ,其实这是机内码,即 D6 D0
UniCode码是4E2D
http://www.delphibbs.com/keylife/iblog_show.asp?xid=13397
 
那JAVA中如何实现取机内码?不能用getBytes,手机中getBytes识别不了汉字
 
以“中”为例(ASCII码是214、208;UniCode码是4E2D)
在手机上用getBytes取出来的结果是什么?
 
任何中文在手机上用getBytes取出来的结果都是63
但取UniCode码可以得到4E2D
 
多人接受答案了。
 
后退
顶部