高难度问题求解!!急用!救命。1000分(300分)

T

topboy

Unregistered / Unconfirmed
GUEST, unregistred user!
如何实现:

<<简易中文词法分析,将任意一篇文章中所有的词抽取出来>>
例如:
输入:"将中文字符串中所有的词抽取出来"
可能输出:"将”、“中文”、“字符串”、“中”、“所有”、“的”、“词”、“抽取”、“出来"
输入:“中国进入WTO将对中国企业带来机遇与考验”
可能输出:“中国”、“进入”、“WTO”、“将”、“对”、“中国”、“企业”、“带来”、“机遇”、“与”、“考验”
 
Word有自动选择词的功能,但它有个词库,你有没有?
 
找个词库可解决这个问题,以前我把中文变成汉语拼音,也是找个词库的。
 
你可以从输入法中倒出一个词库,然后对每篇文章依次进行分段,断句,然后保存到TStrings
中,再对每个句子与词库中的词进行从大到小的比对,我想应该可以解决的。关键是解决速度
的问题。
 
同意YoungSun的观点,最好支持BIG5,呵呵,做好了拿到DFW,我们帮你测试
 
昨天也有人提,是同一人吗?
这应该是一个大课题。
 
其实这是一个很普通的算法,学学数据结构中的树结构,对你铁定有帮助!
如果你还给分的话。我或者可以所得具体一点。
 
铁定需要词库!可哪有?怎么用?
 
我写个demo email给你!
 
接受答案了.
 
顶部