在用拼音进行汉字检索中,怎样处理中英混合内容?(200分)

  • 主题发起人 主题发起人 lyloyal
  • 开始时间 开始时间
L

lyloyal

Unregistered / Unconfirmed
GUEST, unregistred user!
在用拼音进行汉字检索中,怎样处理中英混合内容?
看了许多帖子讨论用拼音首字符序列来实现检索功能, 试了以后,感觉对基本字库是够用的
,但对包括英文字符或数字的字符串,却检索不到,应该怎样修改下列程序,以实现混合检索
功能?
//-----------------------------------------//
function GetPYIndexChar( hzchar:string):char;
begin
case WORD(hzchar[1]) shl 8 + WORD(hzchar[2]) of
$B0A1..$B0C4 : result := 'A';
$B0C5..$B2C0 : result := 'B';
$B2C1..$B4ED : result := 'C';
$B4EE..$B6E9 : result := 'D';
$B6EA..$B7A1 : result := 'E';
$B7A2..$B8C0 : result := 'F';
$B8C1..$B9FD : result := 'G';
$B9FE..$BBF6 : result := 'H';
$BBF7..$BFA5 : result := 'J';
$BFA6..$C0AB : result := 'K';
$C0AC..$C2E7 : result := 'L';
$C2E8..$C4C2 : result := 'M';
$C4C3..$C5B5 : result := 'N';
$C5B6..$C5BD : result := 'O';
$C5BE..$C6D9 : result := 'P';
$C6DA..$C8BA : result := 'Q';
$C8BB..$C8F5 : result := 'R';
$C8F6..$CBF9 : result := 'S';
$CBFA..$CDD9 : result := 'T';
$CDDA..$CEF3 : result := 'W';
$CEF4..$D188 : result := 'X';
$D1B9..$D4D0 : result := 'Y';
$D4D1..$D7F9 : result := 'Z';
else
result := char(0);
end;
end;

// 在指定的字符串列表SourceStrs中检索符合拼音索引字符串
PYIndexStr的所有字符串,并返回。
function SearchByPYIndexStr
( SourceStrs:TStrings;
PYIndexStr:string):string;
label NotFound;
var
i, j :integer;
hzchar :string;
begin
for i:=0 to SourceStrs.Count-1 do
begin
for j:=1 to Length(PYIndexStr) do
begin
hzchar:=SourceStrs[2*j-1]
+ SourceStrs[2*j];
if (PYIndexStr[j]<>'?') and
(UpperCase(PYIndexStr[j]) <>
GetPYIndexChar(hzchar)) then goto NotFound;
end;
if result='' then result := SourceStrs
else result := result + Char
(13) + SourceStrs;
NotFound:
end;
end;

//----------------------------------------------------//
 
这是我根据以前帖子修改的,可以实现你的要求,注意注释的地方就是修改的地方!!
function ChineseZjmChar(const s: String): string;
var
SW: WideString;
C,D: String;
k:char;
i : integer;
begin
try
SW := S;
D:='';
for i :=1 to Length(SW) do
begin
C := SW;
k:= c[1];
if (k in ['0'..'9','a'..'z','A'..'Z', #8]) then D:=D+C //加个判断就可以了,判断字符是否是数字或字母
else
if Length(C) > 1 then D:=D+GetPYIndexChar(C);
end;
result := D;
except
Result := '';
end;
end;
 
我写过一个提取汉字拼音的单元代码,可处理各种情况,而且支持二级字库,如果
需要可到我的主页上下载。lkpc.126.com
 
多人接受答案了。
 

Similar threads

I
回复
0
查看
579
import
I
S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
后退
顶部