摘要 本文主要讨论多路声音实时混叠的实现 方法 ,以及实现过程中对一些特殊情况的处理。关键词 ave 混音 混音器
1.引言
将多个ave文件或多路ave数据同时在ave设备上输出,就可同时听到多个不同的声音,达到混音的效果。如果是将多个不同端点的话音数据经局域 网络 传输到达某一个端点再经该端点的ave设备输出,就能同时听到多个人的话音,从而实现局域网络中多方的话音交谈。
在网络上实现话音交谈,特别强调实时性,要尽量保证话音的平滑、连续,因此为了保证话音数据连续,减少话音数据存储带来的延时,在具体实现中,话音的录制和播放都不采用文件的形式,录制和播放的话音数据都存在缓冲区中。在inds系统中,一般情况下,高层ave接口函数无法直接播放缓冲区中的话音数据,而必须用底层函数来实现,常用的是inds API中的ave函数。将ave数据在ave设备上输出使用的是aveutrite函数,但是该函数不支持多路ave数据的同时播放,为了能达到多路ave数据同时播放的效果,对缓冲区中多路ave数据进行必要的预处理后,再提交给ave输出设备播放。实现原理如图1所示。
图1 多路ave混音的实现原理
2.实现原理
实时地混音,就是将多路ave数据进行相互叠加处理到另一个目的缓冲区,最终将该目的的缓冲区提交给ave输出设备。
将每一路ave数据作为一个单独通道,分别从每个通道取一数据片段,把取得的几个数据片段相互叠加,然后存进另外一个目的缓冲区中。为了便于处理,缓冲区通常采用数组的形式存放ave数据。
如果话音数据,采用采样频率1025Hz,8位单声道的数据格式,那么一秒的话音数据量为11025个字节。
为了达到实时的效果,目的缓冲区通常都设置比较小,大约可存放1/8秒的话音数据量,对于前述的话音格式,目的缓冲区的大小为11025/8=1375个字节。
下面具体看一下ave数据以数组形式存放时的混音过程。如图2所示。
图2 多路ave数据的叠加过程
假设有4路ave数据,目的缓冲区的大小为1378,混音子函数调用为 ixer(lpDest,rgpDdata,4,1378)。
下面给出混音子函数的实现。其中lpDest为目的缓冲区,rgaveSr为多路ave数据源,iNuaves为ave数据源的通道数,Len为目的缓冲区长度。
转贴于论文联盟 .ll.
Vid ixit(LPSAPLE lpDest,LPSAPLE rgaveSr[],intiNuaves,RDLen)
{int,,iSu;
RD tr;
tr=0
hile(Len)
{
iSu=128;/*静音时数值为128*/
fr(I=0;I<iNuaves;I++)
iSu=iSu+*(rgaveSr[]+tr)-128;
PEG(int)0,iSu,(int)225);/*对转换结果处理*/
*lpDest++=iSu;
tr++;
Len--;
}
}
注意一点的是对于单声道数据一个字节表示一个采样值,采样值在0-255之间,各个通道的对应ave数据相加后,就会溢出,还需要将相加结果转换成0-255之间的数值。
将该目的缓冲区中的ave数据经aveutrite函数输出,就能同时听到四个不同的声音,当ave输出设备播放完目的缓冲区中的数据便返回,请求用户提供更多的ave输出数据,因为ave输出设备只能输出提交给它的ave数据;另外,对ave数据进行混音还需要一定的时间,因此当提交一个目的缓冲区中的数据给ave输出设备后,就必须马上混叠另一段ave数据来提交给ave输出设备,作为下一个输出的数据缓冲区,避免声音输出的中断,后一个目的缓冲区提交后被输出设备放入输出队列中,当第一个目的缓冲区中输出完毕后再输出它的数据,当输出设备在输出第二个目的缓冲区的数据时,又能将第三段数据混合进第一个目的缓冲区中,然后重新提交,直到提交完所有的ave数据,那时就将停止输出。在实际 应用 中目的缓冲区的数要多个,一般为3至4个,图3给出了混音、提交的完整过程。
未完...点击下方链接下载完整文档