划
划风而逝
Unregistered / Unconfirmed
GUEST, unregistred user!
各位大虾,你们好
我想做一个软件(微软已经做成了,在TTS5.1 SDK的bin目录中的SAPI51SampleApp.exe,感觉识别率很高,但我很想自己学习写一个),就是利用TTS的文本阅读功能,通过对比mic输入的wav声音和TTS生成的wave文件,执行文本叙述的功能
比如:我在软件中写“打开浏览器”等多条命令,然后我对着麦克风说“打开浏览器”,这时软件自动把这个声音片断和我的所有命令的声音对比,直到找到符合度最高的从而执行相应的功能。
目前我遇到的难题有,声音对比的识别率的算法,软件自动判断发布的命令起止等等
哪位大虾有相关资料,有劳给点建议或发到我的邮箱coldflyxp@163.com,如果您有更好的想法实现以上的功能,欢迎讨论
如果谁做过相关研究并有源代码,万分感谢,我另开贴送分
谢谢大家
我想做一个软件(微软已经做成了,在TTS5.1 SDK的bin目录中的SAPI51SampleApp.exe,感觉识别率很高,但我很想自己学习写一个),就是利用TTS的文本阅读功能,通过对比mic输入的wav声音和TTS生成的wave文件,执行文本叙述的功能
比如:我在软件中写“打开浏览器”等多条命令,然后我对着麦克风说“打开浏览器”,这时软件自动把这个声音片断和我的所有命令的声音对比,直到找到符合度最高的从而执行相应的功能。
目前我遇到的难题有,声音对比的识别率的算法,软件自动判断发布的命令起止等等
哪位大虾有相关资料,有劳给点建议或发到我的邮箱coldflyxp@163.com,如果您有更好的想法实现以上的功能,欢迎讨论
如果谁做过相关研究并有源代码,万分感谢,我另开贴送分
谢谢大家