书上说Unicode16位,能表示世界上所有语言, 难道世界上所有文字会小于65535种,小弟一直迷惑中!(100分)

  • 主题发起人 主题发起人 月冷无痕
  • 开始时间 开始时间

月冷无痕

Unregistered / Unconfirmed
GUEST, unregistred user!
书上说Unicode16位,能表示世界上所有语言, 难道世界上所有文字会小于65535种,小弟一直迷惑中! 拜请各位大侠指点迷津。
《windows核心编程》《windows程序设计》
 
只是一个相对真理
 
unicode里的汉字比康熙字典里的少多了。
 
unicode 应该是4个节的。能表示2^32个状态!
 
的确不够的。
 
8个字节的,2的31次方,理论上可以表示所有的符号,还有一大半是空的,留给以后各个语言符号的。
 
unicode有多种编码方法,比如常见的UTF-8,就是unicode的一种
它是1-3个字节可变编码的,比如abc在uft-8里面还是一个字节,但中文或者其他文字就可能是2个字节或者3个字节
 
ufo!说的完全正确
 
书上说Unicode16位,能表示世界上所有语言,难道世界上所有文字会小于65535个
回答:YES
中文=1万多
繁体=不到1万
日文=不到1万
英文=100多个
...
加起来是不到65535
 
中国的汉字标准有好几个,其中标准GB13000.2-2002 汉字字符集收汉字约7.1万个(另有EX-C在继续扩充中)。
仅中国的这个字符集就超出了7万了,全世界的字符有多少,可想而知了。
 
1、 标准字符集收集的已经超出7万了
 
widestring只有2个字节, 如果所有语言字符超出65535,那么混合在一起的多国语言字符肯定有显示不正确的,不知道我理解的对不对?
 
Unicode 的编码方式与 ISO 10646 的通用字元集(亦称[通用字符集])(Universal Character Set,UCS)概念相对应,目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。这样理论上一共最多可以表示 65,536(2的16次方) 个字符。[red]基本满足[/red]各种语言的使用。实际上目前版本的 Unicode 尚未填充满这16位编码,保留了大量空间作为特殊使用或将来扩展。
未来版本会扩充到32位,即每个字符占用4个字节。理论上最多能表示 2,147,483,648(2的31次方)个字符,完全可以涵盖一切语言所用的符号。
 
感谢各位大侠热情讨论,!
 

Similar threads

S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
后退
顶部