谁能提供一个将姓名按笔划排序的算法(100分)

  • 主题发起人 主题发起人 joboy
  • 开始时间 开始时间
J

joboy

Unregistered / Unconfirmed
GUEST, unregistred user!
谁能提供一个将姓名按笔划排序的算法,最好能提供源程序
 
遇到过这个问题,当时想了一个丑陋的办法,不值不提,
还是听听大伙的意见吧 :)
 
怎么解决的说来听听,反正大家是讨论嘛!
 
我就说说:
按“笔划”,不大可能吧。
 
没什么不可能,微软在word中都能做到,我相信一定能做到.
 
to htw: 说说你的想法吧,大家研究下,没准哪天我们都会用到
 
大家有什么想法都说说!!!!
 
>>没什么不可能,微软在word中都能做到,我相信一定能做到.
微软的东西多得很,没有道理它能做的你也能做。

本来就没有“算法”可以做到,只有使用对应表。
 
在大富翁论坛上就有,但是是big5的,对gb不是很正确!!我想一定有办法的!!
 
废话不想再说二遍,没有“算法”,只能对应。难道你去分析字体图形的结构?
GB 编码方案基于汉语拼音的英文字母顺序。BIG5 是台湾五家公司没事儿撑的搞
出来的编码,什么顺序不知道。目前只有 Windows 2000 提供了对于姓氏笔划的
排序,如果仅仅一个算法就可以搞定,那么 Windows 3.1 就该有这个功能了。
正是因为好几万个汉字要逐个分析然后构建对应表,所以最近才出现。

有在这里钻牛角尖的功夫不如干些别的工作。
 
既然五笔输入法可以把笔划给拆出来,那为啥不能将汉字的笔划全部拆出来??
再说字库里的汉字也没有你说的那么多,我把字库里的汉字全部给弄出来了总共只有7000多个
有效汉字只有6835个!!
 
我还是说说我那个丑陋的办法吧:
1.先把待排序的人名按一人一行读入到文本文件;
2.再用Excel读入此文本文件;
3.再用Excel的按笔划排序功能对上述人名排序;
4.将excel文件另存为dbf文件。
5.用已经排好序的dbf文件,与系统的输出结果通过SQL语句,
建立一一对应关系。order by就搞定了。


现在我想了一个办法,没有实施,供大家参考:
1.用win98的输入法生成器从中从全拼和五笔Ime文件
取出输入法编码文件(GB2312的6363个汉字,反正6000多个吧)。
2.去掉其中的词组和编码方案,只保留单个汉字,一个汉字一行
2.再用Excel读入此编码文件;
3.再用Excel的按笔划排序功能对上述所有汉字排序;
4.将excel文件另存为dbf文件code.dbf
5.在程序中先读入code.dbf,读入到一个数组,数组序即为该汉字的笔划序。
6.以此数组为基础,做一个procedure,在内存中实现对已经存在的姓名的排序,
最后生成一个人的姓名按笔划排序dbf文件(含姓名和笔或序两个字段);
7.与系统的输出结果通过SQL语句join在起,order by 笔划序后输出。

sorry, 第6步我没有做,应该是可行的,说出来仅供大家参考。
我抛了一块砖,请大家接着抛。:)
 
既然EXCEL可以
那么它一定有个排序对应表
找出来!!!!!
实在没折,就做一个;
咱汉人的东西为啥一定要 ‘美人’ 做呢?

借此:对美国鬼子轰炸我驻南大使馆 表示强烈抗议;
对美国鬼子在我南海将我战机撞落 表示强烈抗议;
 
---- 在日常工作和生活中我们经常使用电子记事本查找个人通讯录信息,或在单位的应用程序中查询客户档案或业务资料,这个过程中往往需要输入大量的汉字信息,对于熟悉计算机的人这已经是一件头疼的事,那些不太熟悉计算机或根本不懂汉字输入的用户简直就望而生畏。作为对数据检索技术的一种新的尝试,作者探索使用汉字拼音的首字符序列作为检索关键字,这样,用户不必使用汉字,只须简单地键入要查询信息的每个汉字的拼音首字符即可。比如你想查找关键字“中国人民银行”,你只需要输入“zgrmyh”。作者希望通过下面的例子,为广大计算机同行起一个抛砖引玉的作用,让我们开发的程序更加便捷、好用。

---- 原理很简单,找出汉字表中拼音首字符分别为“A”至“Z”的汉字内码范围,这样,对于要检索的汉字只需要检查它的内码位于哪一个首字符的范围内,就可以判断出它的拼音首字符。

---- 程序更简单,包括3个控件:一个列表存放着所有待检索的信息;一个列表用于存放检索后的信息;一个编辑框用于输入检索关键字(即拼音首字符序列)。详细如下:

---- 1.进入Delphi创建一个新工程:Project1

---- 2.在Form1上创建以下控件并填写属性:

控件类型 属性名称 属性值
Edit Name Search
ListBox Name SourceList
Items 输入一些字符串,如姓名等,用于提供检索数据
ListBox Name ResultList
 

---- 3.键入以下两个函数

// 获取指定汉字的拼音索引字母,如:“汉”的索引字母是“H”
function GetPYIndexChar( hzchar:string):char;
begin
case WORD(hzchar[1]) shl 8 + WORD(hzchar[2]) of
$B0A1..$B0C4 : result := 'A';
$B0C5..$B2C0 : result := 'B';
$B2C1..$B4ED : result := 'C';
$B4EE..$B6E9 : result := 'D';
$B6EA..$B7A1 : result := 'E';
$B7A2..$B8C0 : result := 'F';
$B8C1..$B9FD : result := 'G';
$B9FE..$BBF6 : result := 'H';
$BBF7..$BFA5 : result := 'J';
$BFA6..$C0AB : result := 'K';
$C0AC..$C2E7 : result := 'L';
$C2E8..$C4C2 : result := 'M';
$C4C3..$C5B5 : result := 'N';
$C5B6..$C5BD : result := 'O';
$C5BE..$C6D9 : result := 'P';
$C6DA..$C8BA : result := 'Q';
$C8BB..$C8F5 : result := 'R';
$C8F6..$CBF9 : result := 'S';
$CBFA..$CDD9 : result := 'T';
$CDDA..$CEF3 : result := 'W';
$CEF4..$D188 : result := 'X';
$D1B9..$D4D0 : result := 'Y';
$D4D1..$D7F9 : result := 'Z';
else
result := char(0);
end;
end;

// 在指定的字符串列表SourceStrs中检索符合拼音索引字符串
PYIndexStr的所有字符串,并返回。
function SearchByPYIndexStr
( SourceStrs:TStrings;
PYIndexStr:string):string;
label NotFound;
var
i, j :integer;
hzchar :string;
begin
for i:=0 to SourceStrs.Count-1 do
begin
for j:=1 to Length(PYIndexStr) do
begin
hzchar:=SourceStrs[2*j-1]
+ SourceStrs[2*j];
if (PYIndexStr[j]<>'?') and
(UpperCase(PYIndexStr[j]) <>
GetPYIndexChar(hzchar)) then goto NotFound;
end;
if result='' then result := SourceStrs
else result := result + Char
(13) + SourceStrs;
NotFound:
end;
end;

4.增加编辑框Search的OnChange事件:
procedure TForm1.SearchChange(Sender: TObject);
var ResultStr:string;
begin
ResultStr:='';
ResultList.Items.Text := SearchByPYIndexStr
(Sourcelist.Items, Search.Text);
end;
 

---- 5.编译运行后,在编辑框Search中输入要查询字符串的拼音首字符序列,检索结果列表ResultList就会列出检索到的信息,检索中还支持“?”通配符,对于难以确定的的文字使用“?”替代位置,可以实现更复杂的检索。

 
liunsh:我们这里讨论的是按笔划排序,我是要将数据库里的名单按笔划生成编号不是讨论的
按拼音进行检索.不过你的思路不错,等接受答案后我会给你分的.
希望大家踊跃参加讨论..
 
最新消息:
国内已经有软件支持笔划排序了 ,就是大家都熟悉的"管家婆"但是不知道它是怎么
实现的,鉴于此,我想肯定有好的算法可以实现按,笔划排序,并不象mikedeakins说的那样
高不可攀!!
 
其实我也做过这样的排序,但用的是非常非常土的办法,
类似HTW的办法,分别给6000多个汉字编码
 
把要计算的汉字放在画布上,在汉字区域内进行循环判断,如果点的颜色为字体颜色就将数值+1,
笔划越多值肯定越大。
 
金山词霸也有汉字的各种信息呀:如

郑码:J/JIVV,U:4E2D,GBK:D6D0
笔画数:4,部首:丨,笔顺编号:2512
 
后退
顶部