java 中汉字字符长度的问题 ( 积分: 100 )

飘叶 · 2005-09-21

如 s='汉字' 在DELPHI中 length(s) 为 4,而在eclipse中 s.length() 为 2
如何设置,才能使 s.length() 为 4

飘叶 · 2005-09-21

如 s='汉字' 在DELPHI中 length(s) 为 4,而在eclipse中 s.length() 为 2
如何设置,才能使 s.length() 为 4

ak_2005 · 2005-09-21

Java 用的是Unicode编码，正常的撒，你想怎么设置？！
不是2才不对了，S='AB'你再看看是多少？

xianguo · 2005-09-21

public class Test{
public static void main(String[] args){
String s1 = new String("abc汉字&quot

;
System.out.println("Len(s1) = "
+ s1.getBytes().length);
}
}

dreamisx · 2005-09-21

1楼对，Java用的是Unicode编码，中文与英文字符是一样的。

zbird · 2005-09-21

toByte
后再计算长度。

飘叶 · 2005-09-21

xianguo,如果String s1 = new String("abc汉字&quot

;那么上次的那个程序
http://www.delphibbs.com/delphibbs/dispq.asp?lid=3211744
如何修改才能与DELPHI中一样的结果？

xianguo · 2005-09-21

//java中的Byte范围是 -128～127，不知道怎么转成无符号型
//所以绕了弯路 ( 即这一段： if (x<0) x = 256+x )
public class Test{
public static void main(String[] args){
/*
String s1 = new String("abc汉字123&quot

;
System.out.println("Len(s1) = "
+ s1.getBytes().length);
*/
int x =0;
int n2 = 1 ;
int n1 = 8892636;
String s1 = new String("AB测试00500100291C&quot

;
String s2 = new String("QW汉字TYUIO7&quot

;
String s4 = new String("&quot

;
String s5 = new String("&quot

;
String s6 = new String("&quot

;
String zjs = new String("052&quot

;
System.out.println("s1 = "
+ s1);
System.out.println("s2 = "
+ s2);
for (int i=1;i<=s1.getBytes().length;i++){
x = s1.getBytes()[i-1];
if (x<0) x = 256 + x;
System.out.println("s1.getBytes()["
+ (i-1) + "] = "
+ x);

n2 = Math.abs((x * n2 + 0xf48)) % 1000000;
}
System.out.println("n2 = "
+ n2);

for (int i=2;
i<=s2.getBytes().length;
i++){
x = s2.getBytes()[i-1];
if (x<0) x = 256 + x;
System.out.println("s2.getBytes()["
+ (i-1) + "] = "
+ x);

n2 = Math.abs((x* n2 + 0x0F83)) % 1000000;
}
System.out.println("n2 = "
+ n2);

n2 = 10705672 + Math.abs((n2+n1) *(s1.getBytes().length + s2.getBytes().length));
System.out.println("n2 = "
+ n2);
s5 = zjs + String.format("%d", n2).substring(0, 6);
System.out.println("s5 = "
+ s5);
n2 = Integer.parseInt(s5);
System.out.println("n2 = "
+ n2);
n2 = 137964276 + Math.abs(((n2 / 181) * 196) ^ 39694322);
System.out.println("n2 = "
+ n2);
s1 = String.format("%d", n2).substring(0, 8);
s2 = "73461852";
System.out.println("s1 = "
+ s1);
System.out.println("s2 = "
+ s2);
for (int i=1;
i<=8;
i++){
x = s2.getBytes()[i-1];
if (x<0) x = 256 + x;
s4 = s4 + s1.charAt(x- (int)('1'));
}
System.out.println("s4 = "
+ s4);
s6 = s4 + '-' + s5;
System.out.println("s6 = "
+ s6);
//答案 28741985-052297382
}
}

飘叶 · 2005-09-21

奇怪！eclipse竟然不支持任意截字符串substring(4, 2);只能从头开始截substring(0, 2);
各位有什么高招？

xianguo · 2005-09-21

substring(int begin
Index, int endIndex)
Returns a new string that is a substring of this string.

xianguo · 2005-09-21

注意从0开始

xianguo · 2005-09-21

到 http://java.sun.com/ 上下载一份API说明

飘叶 · 2005-09-21

用getBytes()处理汉字还是解决不了,因为这在电脑上运行正常,但程序在手机上运行时,任一个汉字getBytes()后只得到一个63,而charAt(i)则可以得到与电脑一样的一个汉字为五位数的值

飘叶 · 2005-09-21

有点思路了,JAVA中charAt()的反函数是什么?(哪里有JAVA的函数中文说明?)
我在Motorola SDK v5.2 for J2ME中用模拟器中执行时,输入汉字显示为乱码时,getBytes()竟然可以取得正常值,因此是否可以这样:
中文--->charAt()---->charAt()的反函数---->getBytes()

xianguo · 2005-09-21

chatAt取字符串中指定位置的字符
getBytes取ASCII码（如果为汉字，则分别取高8位或低8位<合并起来就是UniCode>）

飘叶 · 2005-09-21

Form v = new Form("Test&quot

;
String s1 = new String("中&quot

;
int x =0;
x = (s1.getBytes()[0]);
f.append(String.valueOf(x));//电脑中显示为 -42 手机中显示为 63
x =s1.charAt(0);
f.append(String.valueOf(x));
//电脑、手机都显示为 20013
=========因此我想把20013变换回汉字,再getBytes,会不会手机中也显示为 -42

xianguo · 2005-09-21

//☆、取汉字的Unicode码
public static String Chinese2Unicode(char ch){
int i;
i = (int)ch;
return Integer.toHexString(i).toUpperCase();
}
//☆、取Unicode码对应的字符
public static String Unicode2Chinese(String str){
int i=0;
i = Integer.parseInt(str, 16);
return Character.toString(((char)i));
}

飘叶 · 2005-09-21

Character.toString(((char)i));编译不了

飘叶 · 2005-09-21

//☆、取Unicode码对应的字符
public static String Unicode2Chinese(String str){
int i=0;
i = Integer.parseInt(str, 16);
return String.valueOf((char)i);
}
这样可以编译了,但始终解决不了手机上的汉字getBytes()问题

飘叶 · 2005-09-22

ASCII码与UniCode码是什么关系?能否用数学的方法计算出来?
如果是英文数学,UniCode码是十六进制,ASCII码是十进制,它们是相等的,
如 A 的ASCII码是65；UniCode码是41
Z 的ASCII码是90；UniCode码是5A
0 的ASCII码是48；UniCode码是30
9 的ASCII码是57；UniCode码是39
但中文就不知是什么关系了
如 “中” 的ASCII码是214、208；UniCode码是4E2D
“文” 的ASCII码是206、196；UniCode码是6587
“字” 的ASCII码是215、214；UniCode码是5B57
“闭” 的ASCII码是177、213；UniCode码是95ED
“问” 的ASCII码是206、202；UniCode码是95EE

java 中汉字字符长度的问题 ( 积分: 100 )

飘叶

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

ak_2005

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

dreamisx

Unregistered / Unconfirmed

zbird

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

xianguo

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

飘叶

Unregistered / Unconfirmed

Similar threads