文件中,如何识别汉字、半角数字、全角数字、半角字母、全角字母、换行符、回车符?(50分)

  • 主题发起人 主题发起人 zouming
  • 开始时间 开始时间
换行是 #10,回车是 #13,其它的只能根据汉字内码的连续性进行判断了,不过,不知道对
于 GBK 好不好使。
 
汉字、全角数字和全角字母都是双字节码,第一个字节的值减去160表示该字在字库中的区
码,第二个字节的值减去160为位码,如‘啊’的16进制编码为B0 A1,换算成十进制数就是
176和161,分别减去160后就是16和1,即‘啊’字的区位码是1601,同样数字和字母的区位
码也是如此,如‘0’是0316,‘1’是0317等,因此判断汉字及全角字符基本上只要看其连
续的两个字节是否大于160,至于半角字符和数字则更简单了,只要到ASCII码表中查一查就
知道了。换行和回车上面已讲了。
 
半角数字、半角字母的ASCII码小于127,汉字、全角数字、全角字母有两个字符,每个字符
的ASCII码都大于127
 
多人接受答案了。
 
后退
顶部