高分求用哈希表实现词频统计?(30分)

  • 主题发起人 主题发起人 jinmen
  • 开始时间 开始时间
J

jinmen

Unregistered / Unconfirmed
GUEST, unregistred user!
用什么好的方法可以通过单词得到数组索引(哈希表)来加快词频统计啊,哪位老大实现过啊,分不够我可以加。
 
可以根据单词的每个字母顺序建索引
 
感觉你这样数组会设的很大,能不能详细说明?
 
每个单词都存放在hash表里面,并且只存放一次,规则是首先根据单词的首字母建立26个索引,然后再根据第二个字母建立向后的链接
 
感觉数组很大,比如一个单词index有五个字母,需要的空间就有26×26×26×26×26,太大了。
 
字母树?
 
后退
顶部