如何才能实现“同音”查询?(100分)

  • 主题发起人 主题发起人 renren
  • 开始时间 开始时间
R

renren

Unregistered / Unconfirmed
GUEST, unregistred user!
大家帮助我想想,如果实现“同音”字的模糊查询,最好有例子!谢谢大家!
 
汉字编码就是按照拼音排序的。判断两个汉字是不是同音字很简单——用一个查找表就可以了。但是如要
用于大量数据的模糊查询,临时性的查表-匹配肯定效率极其低下。可以事先对待查数据进行处理——将
它们按照拼音对照表进行归并处理,每个拼音对应于一个256-65536之间的值——如所有ai都用$a1a2表示
等等。查找的时候只要查找归并处理后的数据,搜索到了以后,再将原始数据显示出来。
 
在表中增加一个汉语拼音字段,设为关键字段。输入汉字时,利用汉语拼音对照表转换为对应的
;汉语拼音编码,再利用 FindNearest([编码]) 进行查找。
 
我这里有个DLL,可以把汉字转成拼音的,比如你输入“中国",它可以输出为"zhongguo"
这样的话,你在建库的时候,多设个拼音字段,添加时顺便把拼音也加到库中,这样
不就搞定啦?
 
to lww:
大不大?可以给我一个?,给分!casbrank@sina.com
 
to lww
也给我发一个dll好吗,也给分fenghuajun@163.net
 
to lww
我也想要一个,skysea@wocall.com,thanks
 
to lww me to :
micony@sina.com
thank you
 
to lww 我也要
mrzwin@21cn.com
 
还有我 VeryCoolBoy@etang.com
 
可以用windows的输入法生成器反编译过来即可。
 
lww说的DLL只能处理一级字库,因为一级字库是按拼音顺序排列的,而二级库就不行了
,因为它是按部首排列的,比如用那个DLL就不能查出象“岚”“岖”“咛”“咚”
这样的字
 
还有我: devecom@sohu.com
 
lww:能不能把那个dll给我啊!马上给分!谢谢
 
[转载]Delphi中用拼音首字符序列来实现检索功能
夏昆
; ; 在日常工作和生活中我们经常使用电子记事本查找个人通讯录信息,或在单位的应用程序中查询客户档案或业务资料,这个过程中往往需要输入大量的汉字信息,对于熟悉计算机的人这已经是一件头疼的事,那些不太熟悉计算机或根本不懂汉字输入的用户简直就望而生畏。作为对数据检索技术的一种新的尝试,作者探索使用汉字拼音的首字符序列作为检索关键字,这样,用户不必使用汉字,只须简单地键入要查询信息的每个汉字的拼音首字符即可。比如你想查找关键字“中国人民银行”,你只需要输入“zgrmyh”。作者希望通过下面的例子,为广大计算机同行起一个抛砖引玉的作用,让我们开发的程序更加便捷、好用。
---- 原理很简单,找出汉字表中拼音首字符分别为“A”至“Z”的汉字内码范围,这样,对于要检索的汉字只需要检查它的内码位于哪一个首字符的范围内,就可以判断出它的拼音首字符。
---- 程序更简单,包括3个控件:一个列表存放着所有待检索的信息;一个列表用于存放检索后的信息;一个编辑框用于输入检索关键字(即拼音首字符序列)。详细如下:
---- 1.进入Delphi创建一个新工程:Project1
---- 2.在Form1上创建以下控件并填写属性:
控件类型 属性名称 属性值
Edit Name Search
ListBox Name SourceList
Items 输入一些字符串,如姓名等,用于提供检索数据
ListBox Name ResultList
---- 3.键入以下两个函数
// 获取指定汉字的拼音索引字母,如:“汉”的索引字母是“H”
function GetPYIndexChar( hzchar:string):char;
begin
case WORD(hzchar[1]) shl 8 + WORD(hzchar[2]) of
$B0A1..$B0C4 : result := 'A';
$B0C5..$B2C0 : result := 'B';
$B2C1..$B4ED : result := 'C';
$B4EE..$B6E9 : result := 'D';
$B6EA..$B7A1 : result := 'E';
$B7A2..$B8C0 : result := 'F';
$B8C1..$B9FD : result := 'G';
$B9FE..$BBF6 : result := 'H';
$BBF7..$BFA5 : result := 'J';
$BFA6..$C0AB : result := 'K';
$C0AC..$C2E7 : result := 'L';
$C2E8..$C4C2 : result := 'M';
$C4C3..$C5B5 : result := 'N';
$C5B6..$C5BD : result := 'O';
$C5BE..$C6D9 : result := 'P';
$C6DA..$C8BA : result := 'Q';
$C8BB..$C8F5 : result := 'R';
$C8F6..$CBF9 : result := 'S';
$CBFA..$CDD9 : result := 'T';
$CDDA..$CEF3 : result := 'W';
$CEF4..$D188 : result := 'X';
$D1B9..$D4D0 : result := 'Y';
$D4D1..$D7F9 : result := 'Z';
else
result := char(0);
end;
end;
// 在指定的字符串列表SourceStrs中检索符合拼音索引字符串
PYIndexStr的所有字符串,并返回。
function SearchByPYIndexStr
( SourceStrs:TStrings;
PYIndexStr:string):string;
label NotFound;
var
i, j :integer;
hzchar :string;
begin
for i:=0 to SourceStrs.Count-1 do
begin
for j:=1 to Length(PYIndexStr) do
begin
hzchar:=SourceStrs[2*j-1]
+ SourceStrs[2*j];
if (PYIndexStr[j]<>'?') and
(UpperCase(PYIndexStr[j]) <>
GetPYIndexChar(hzchar)) then goto NotFound;
end;
if result='' then result := SourceStrs
else result := result + Char
(13) + SourceStrs;
NotFound:
end;
end;
4.增加编辑框Search的OnChange事件:
procedure TForm1.SearchChange(Sender: TObject);
var ResultStr:string;
begin
ResultStr:='';
ResultList.Items.Text := SearchByPYIndexStr
(Sourcelist.Items, Search.Text);
end;
---- 5.编译运行后,在编辑框Search中输入要查询字符串的拼音首字符序列,检索结果列表ResultList就会列出检索到的信息,检索中还支持“?”通配符,对于难以确定的的文字使用“?”替代位置,可以实现更复杂的检索。
---- 本程序在Delphi4.0中编译运行通过。
 
To Renren:
; 你又不告诉我Email,怎么发啊?这样吧,你发封信给我
Lww@263.net,我回信给你
 
接受答案了.
 
后退
顶部