月 月冷无痕 Unregistered / Unconfirmed GUEST, unregistred user! 2008-08-14 #1 书上说Unicode16位,能表示世界上所有语言, 难道世界上所有文字会小于65535种,小弟一直迷惑中! 拜请各位大侠指点迷津。 《windows核心编程》《windows程序设计》
A andu Unregistered / Unconfirmed GUEST, unregistred user! 2008-08-15 #6 8个字节的,2的31次方,理论上可以表示所有的符号,还有一大半是空的,留给以后各个语言符号的。
U ufo Unregistered / Unconfirmed GUEST, unregistred user! 2008-08-15 #7 unicode有多种编码方法,比如常见的UTF-8,就是unicode的一种 它是1-3个字节可变编码的,比如abc在uft-8里面还是一个字节,但中文或者其他文字就可能是2个字节或者3个字节
4 41426277 Unregistered / Unconfirmed GUEST, unregistred user! 2008-08-15 #9 书上说Unicode16位,能表示世界上所有语言,难道世界上所有文字会小于65535个 回答:YES 中文=1万多 繁体=不到1万 日文=不到1万 英文=100多个 ... 加起来是不到65535
U ufo Unregistered / Unconfirmed GUEST, unregistred user! 2008-08-17 #10 中国的汉字标准有好几个,其中标准GB13000.2-2002 汉字字符集收汉字约7.1万个(另有EX-C在继续扩充中)。 仅中国的这个字符集就超出了7万了,全世界的字符有多少,可想而知了。
月 月冷无痕 Unregistered / Unconfirmed GUEST, unregistred user! 2008-09-22 #12 widestring只有2个字节, 如果所有语言字符超出65535,那么混合在一起的多国语言字符肯定有显示不正确的,不知道我理解的对不对?
K kaida Unregistered / Unconfirmed GUEST, unregistred user! 2008-09-22 #13 Unicode 的编码方式与 ISO 10646 的通用字元集(亦称[通用字符集])(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 65,536(2的16次方) 个字符。[red]基本满足[/red]各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。 未来版本会扩充到32位,即每个字符占用4个字节。理论上最多能表示 2,147,483,648(2的31次方)个字符,完全可以涵盖一切语言所用的符号。
Unicode 的编码方式与 ISO 10646 的通用字元集(亦称[通用字符集])(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 65,536(2的16次方) 个字符。[red]基本满足[/red]各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。 未来版本会扩充到32位,即每个字符占用4个字节。理论上最多能表示 2,147,483,648(2的31次方)个字符,完全可以涵盖一切语言所用的符号。