求一能在D2009下使用的简繁体字符串转换函数(50)

siaosa · 2009-07-15

用Delphi2009将以下代码如果在简体下编译好,然后在繁体下运行肯定会乱码procedure TForm1.Button1Click(Sender: TObject);begin showmessage('请在简体下编译后,然后将程序在繁体下运行');end;UNICODE还是支持的不行啊,谁能提供一个D2009下的简繁体转换函数.谢谢

de410 · 2009-07-15

摘自CSDN上的~~供参考~ 简繁转换简单说可以有3种方法：API法、码表法、对照表法，扩展一下又可以及拆分，码表发可以分为文件码表和对照码表2种方式，还可以增加MLANG方法，当然这种方法用的相对很少，可能很多人根本就没有听说，下面可以一一列举。 1、API方法，这是Windows下开发最常用最简单的方法，利用Windows系统自带的API函数，寥寥数行代码即可完成，典型的例子就是 Windows2000自带的例子，核心代码可以简单列一个 function GB2312ToBIG5(GB2312Str: string): AnsiString; var iLen: Integer; PGBCHSStr: PChar; //GB编码的简体字符 PGBCHTStr: PChar; //GB编码的繁体字符 PUnicodeChar: PWideChar; //Unicode编码的字符 PBIG5Str: PChar; //BIG5编码的字符 begin PGBCHSStr:=PChar(GB2312Str); iLen:=MultiByteToWideChar(936,0,PGBCHSStr,-1,nil,0); //计算转换的字符数 GetMem(PGBCHTStr,iLen*2+1); //分配内存 LCMapString($0804,LCMAP_TRADITIONAL_CHINESE,PGBCHSStr,-1,PGBCHTStr,iLen*2); //转换GB码简体到GB码繁体 GetMem(PUnicodeChar,iLen*2); //分配内存 MultiByteToWideChar(936,0,PGBCHTStr,-1,PUnicodeChar,iLen); //转换GB码到Unicode码 iLen:=WideCharToMultiByte(950,0,PUnicodeChar,-1,nil,0,nil,nil); GetMem(PBIG5Str,iLen); WideCharToMultiByte(950,0,PUnicodeChar,-1,PBIG5Str,iLen,nil,nil); Result:=string(PBIG5Str); FreeMem(PBIG5Str); FreeMem(PUnicodeChar); FreeMem(PGBCHTStr); end; 这是Delphi的方式，根据变量定义模式及开发工具不同，代码量会不同，但核心的就那几行 2、码表法有2种，一种是文件模式，一种是对照码表模式文件模式如果十年前你接触过软件开发，通过C语言调用UCDOS的字库显示汉字这招应该玩过，那么这个原理是一样的，条件是找一个合适的字库。该方法主要利用了gb-big5.tab或big5-gb.tab等码表文件进行，这种方式在网络开发及JAVA开发中用的特别多，核心代码也很简单 #define TABLE "gb-big5.tab" extern void usage(void); extern void convert(FILE *fp); void main(int argc,char **argv) { char *source; FILE *fp; if (argc!=2) usage(); source=argv[1]; setbuf(stdout,NULL); if (access(TABLE,4)!=0) usage(); if (source==NULL) usage(); if (strlen(source)==0) usage(); fp=fopen(source,"r"); if (fp==NULL) usage(); convert(fp); fclose(fp); fflush(stdout); fclose(stdout); } void convert(FILE *fp) { FILE *table; int c,x; long address; table=fopen(TABLE,"r"); do { c=fgetc(fp); if (c>=0xA0) { x=fgetc(fp); address=((c-0xA0)*510)+(x-1)*2; fseek(table,address,SEEK_SET); c=fgetc(table); x=fgetc(table); if (c!=0&&x!=0) fprintf(stdout,"%c%c",c,x); } else if (c!=EOF) fputc(c,stdout); } while (c!=EOF); fclose(table); } 对照码表这种方法的原理是，把所有的汉字的内码通过变量或者一定的规则仔细定义好，然后据表查询即可，譬如“国”的简体内码是$B9FA，繁体内码是$B0EA，建立一个变脸表，一个存储所有简体汉字，一个存储所有繁体汉字，一一对应，马上就出来了 3、对照表法对照表法应该是最实用最简单的简繁转换方式了，这个方法和对照码表方式差不多，区别在于对照码表法用内码，此方法直接用汉字显示，同一个文件或不同文件里面存储简体和繁体的对照表，这个方法的最大好处是照顾行文习惯，这是所有国家化软件必须的方法，譬如服务器 - 伺服器文件 - 檔案 ...... 这种方式最大的麻烦是找一个好的对照表，很多公开代码的浏览器包括了这些，Linux下也包括了，当然一些好的对照表可以自己去维护 4、mlang方法这种方法其实就是利用IE的API函数ConvertString，只是要自己定义而已，函数定义为 HRESULT ConvertString( DWORD *pdwMode, DWORD dwSrcEncoding, DWORD dwDstEncoding, BYTE *pSrcStr, UINT *pcSrcSize, BYTE *pDstStr, UINT *pcDstSize ); 具体可以去查MSDN 以上一共介绍了4种方法，细分来总共是5种方法。还有一种方法就是利用标准Unicode码表去查，这个码表是MS制作的，也就形成了标准。这个是根据MS的GBK字库制作的譬如“國”在简体码表库中的编码是$87F8，那么根据码表查出其Unicode码是$570B，然后根据Unicode码$570B到繁体码表库中查到繁体内码是 $B0EA，问题就解决了，这个码表库可以到ftp://ftp.unicode.org/Public/MAPPINGS/去下载。936是简体，950是繁体

siaosa · 2009-07-15

To:de410 你粘贴过来的代码,你在D2009下试了再说吧.我都试过了

草原骏马 · 2009-07-16

其实， de410 的方法是正确的。只是，因为D2009是unicode编码的，所以，转换不成功。因为de410给出的方法要求传入的参数，都是MultiByte格式的。但是D2009中的编码方式都是unicode（WideChar）格式的。楼主把Unicode格式的参数当作MultiByte格式的参数传入，当然转换不成功了。你只要看看里面的函数，做一下改动就好了。例如：把其中MultiByte转换为WideChar格式的步骤去掉，因为你传入的参数已经是WideChar的。

kabeiroy · 2009-07-16

灌水来了

siaosa · 2009-07-16

To:草原骏马试着改过,改了半天都改不过来

求一能在D2009下使用的简繁体字符串转换函数(50)

siaosa

Unregistered / Unconfirmed

de410

Unregistered / Unconfirmed

siaosa

Unregistered / Unconfirmed

草原骏马

Unregistered / Unconfirmed

kabeiroy

Unregistered / Unconfirmed

siaosa

Unregistered / Unconfirmed

Similar threads