语音压缩的算法!欢迎大家来讨论!(200分)

  • 主题发起人 主题发起人 hapcoer
  • 开始时间 开始时间
H

hapcoer

Unregistered / Unconfirmed
GUEST, unregistred user!
语音压缩的算法!有没有好的解决方法!

别人写的一些东西:

“语音压缩模块首先对输入的语音帧进行高通滤波,去除信号中的直流分量和50Hz的成分,
同时进行增益控制。再进行线性预测分析,提取线谱对参数,对线谱对进行预测和量化,
利用线谱对参数构造共振峰感觉加权滤波器,对高通信号进行开环基音估计,
在开环基音估计的基础上进行闭环基音估计,在已经取得的参数的基础上代入语音生成
模型对激励码本进行搜索,提取激励参数。对各参数进行量化,编帧。
压缩率达到了1/20的效果,即压缩后每秒的语音数据为0.8K字节。”
 
我用ACM组件后再用Zip压缩。
 
还有别的吗?
 
silicon:
你的程序中ACM是选用PCM格式吧,我把他改成别的形式,为什么编译不通过!
 
关键是保证压缩后的语音流可以直接播放.

用zip压缩过后,语音流可以保证正常播放么?(不解压的前提下)

语音压缩还是采用有损压缩.
 
See "H.263"
 
我只知道用DSP芯片进行硬件压缩,最大可去到1K/S,人耳感觉不到失真
 
hapcoer你说的是melp混合激励语音压缩,实现起来比较复杂,如果用LPC-10算法实现,
要简单一些.我简单的介绍一下:现对语音分帧处理,一般20-30ms一帧,然后对每帧信号
进行清、浊音判决,对清音基音周期估计,浊音不必,然后提取LPC参数,能量参数,
将这些参数编码传递到接收方进行解码还原语音即可。码率大概可达到300字节每秒。
但是声音效果不是很好,不如melp。我做了一个语音聊天的程序,在局域网内没问题,
但是在internet上会突然退出,好像是因为soket设置为nonblock的缘故,

block模式主要用在什么场合呢?
 
感兴趣!!!
 
感兴趣!!!
too
 
不错,hapcoer,你那算法能不能给我一份看看。
 
这么久都有玩过了
 
ACM API M$Speech
 
用WMF控件吧!网上实时音频转播没问题!
 
用ACM后应该不要压了啊
即使是拔号上网也很流畅啊
 
压缩和解压缩,可能有两点你没有想到:
一:ACM等已经是压缩的了,再压也压不了什么了。比如说你试试压缩一个ZIP文件看看?
二:压缩和解压缩是要花费一定时间的,有时侯反而更加延迟

相信我,我以前做过的,当然不是我主页上面那个破DEMO。 主页上我只放些过时的东西而已
真东西还是藏着啊,呵呵。
 
我用acm做了个局域网聊天工具,就是声音特小,不知道事不是集成声卡的问题,
郁蒙中。。。
 
接受答案了。
 
后退
顶部