怎样根据声音文件,自动找出声音中每句话的起始时间点和终止时间点? (200分)

我以经解决了,哈哈,按LuJuhe说的没错,只是8位波形用SHORTINT整数,
负最小值是127,负最大值是0,正最小值是-128,正最大值是-1
 
to gni
怎么解决的,请告诉我好吗,愿意给你加分!有源代码最好!
我的mail: aijunlu@elong.com
 
这个问题对于做模式识别的 高人或许比较简单,基本原理应该是“远帆”所说的。
连续的语音文件中,正常的语句阅读和语句之间的停顿有着不同的声音波形特征。用语音分析软件
分析你所说的声音文件,可以很清楚的看到着一点,本人很早前做过语音芯片编程,经常用类似的软件
做语音的分析和修饰调整。这里应该涉及到一些具体的算法。
 
to watter:
你好,请问你说的软件是什么样的?能否给点详细的说明?非常感谢!
在声音处理方面我很菜,还望前辈赐教!
 
虽然自己没写过,但是我觉得不难吧。
读取Wave文件到内存后,分析他的数据,如果有波形连续(这个范围你自己定,最好做成软件的时候可调)小于某一很小的值时候,可以认为没有语音,这样就可以断定一句话的起点和终点了。
 
按LuJuhe说的没错,我用8BIT,8MHZ的格式检查值等于76H~83h的10~30个字节分开每个字,基本可行
 
在delphi中通过函数
table.fieldbyname('starttime').asiteger:=i*round(mediaplayer.length/10)
获取开始时间!结束时间同理可得
 
首先要取出音频的一些特征,如能量、过零率等,然后分析。
 
在机械工业出版社的《delphi编程技巧-多媒体与系统篇》里有原程序,可以实现歌词与声音同步播放,居然只有两页纸的代码!看来不难!
你借着看一下!
 
我剛好想寫這方面的小工具給公司的一個項目用, 有人能給我說說思路嘛, 或者介紹些
相關資料也可以, 謝謝大家了.
 
这是相当复杂的技术,见过这样的论文的
 
利用音量的判断实现http://listenfree.3322.org/forum/topic.asp?TOPIC_ID=18&FORUM_ID=13&CAT_ID=6
 
我也正在找这方面的资料,
强烈关注
 
另外一种解决方法,这正常播放文件,通过按键响应事件,取得各句的结尾position,记录在一个文件中
通过读取各POSITION的值。。。。1、先设定2、播放
OICQ:23366711 验证时请输入 DELPHIBBS 复读问题
 
所谓的“电平”,是指声音文件的音量吧?
另外,pascal!,LuJuhe,gni, laj001,远帆,watter这些人讲的方法,是否适用于所有声音文件的操作???
望各路豪杰赐教一二!
小生感激不尽!
 
华旗的产品-爱国者MP3很烂,才用20天,耳机就脱胶,还说是外伤,不给任何维修等,哪个龟儿子再买爱国者MP3,甚至华旗的东西

如果不属实,天洙地灭
 
可能楼上的用的时间太长的缘故
我邮购了一个mp3,现在还是好好的,而且当时最便宜,599,128M内存呢
只是用的时间短,
呵呵,开个玩笑^_^
 
如果是MP3或其它压缩格式的数据怎么弄?
 
估计楼主需要这样的控件
http://delphi.freemai.com/list.asp?id=528
 

Similar threads

S
回复
0
查看
1K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
969
SUNSTONE的Delphi笔记
S
S
回复
0
查看
3K
SUNSTONE的Delphi笔记
S
S
回复
0
查看
2K
SUNSTONE的Delphi笔记
S
D
回复
0
查看
2K
DelphiTeacher的专栏
D
顶部