请教句库检索问题(200)

  • 主题发起人 主题发起人 yzxcsw
  • 开始时间 开始时间
Y

yzxcsw

Unregistered / Unconfirmed
GUEST, unregistred user!
请教各位兄弟,我现在有这样一个需求:1、句库里有50多万条英文句子;2、由用户给出一个任意句 S1,需要程序返回和 S1 有相同的单词最多的前100个句子。比如,用户的 S1 是:This is a book and that is an apple.程序可能返回:This is an apple that is a book.That is a cup and that is an apple.……注意,有相同的单词数最多的句子要排在前面。现在我的问题是,按我以前的建库方法,当句库在几十万条以上时(以后可能更大),速度太慢(十几秒才能返回)。请各位兄弟给点如何建库、优化的建议,如何能进一步提高速度。谢谢啦!如哪位兄弟建议被采纳,再敬送200分聊表心意。
 
我顶!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
 
友情 帮顶。。。。。
 
顶成2009年最受欢迎的问题!
 
我也顶了
 
[:D]想知道,继续顶[8D]
 
帮顶,接分。
 
关键是你的查询语句,按我的想法,应该不会慢啊。办法1: 先将用户输入的句字分成词,再一个一个的查询,将结果合并,求最大的几条。办法2: 如果句库变动不大,可以将句库生成明细表,将每一个词都分开,再根据用户查询的内容查询。
 
做人工智能啊 难哦
 
百度、GOOGLE 应该会这种算法。
 
后退
顶部