標籤:

ANDROID音頻系統散記之三:resample

ANDROID音頻系統散記之三:resample-2 2012-01-13 18:01 104人閱讀 評論(0) 收藏 舉報

這篇是承接上一篇提到的底層resample處理,以Samsung的mini alsa-lib為例說明。

mini alsa-lib

這個mini alsa-lib位於android2.3.1-gingerbread/device/samsung/crespo/libaudio中。如之前所說alsa-lib實現了太多plugin的功能,顯得複雜臃腫。因此我建議如果想了解alsa在上層調用過程,最好從這個mini alsa-lib入手,就兩個源文件:alsa_pcm.c和alsa_mixer.c,前者是pcm回放錄音介面,後者是mixer controls的控制介面。

alsa-lib其實也是通過操作/dev目錄的設備節點來調用內核空間的音頻驅動介面,這點跟平常的字元設備的調用方法一樣的。如open:

[cpp] view plaincopy

  1. structpcm*pcm_open(unsignedflags)
  2. {
  3. constchar*dname;
  4. structpcm*pcm;
  5. structsnd_pcm_infoinfo;
  6. structsnd_pcm_hw_paramsparams;
  7. structsnd_pcm_sw_paramssparams;
  8. unsignedperiod_sz;
  9. unsignedperiod_cnt;
  10. LOGV("pcm_open(0x%08x)",flags);
  11. pcm=calloc(1,sizeof(structpcm));
  12. if(!pcm)
  13. return&bad_pcm;
  14. if(flags&PCM_IN){
  15. dname="/dev/snd/pcmC0D0c";//capture設備節點
  16. }else{
  17. dname="/dev/snd/pcmC0D0p";//playback設備節點
  18. }
  19. ...
  20. pcm->flags=flags;
  21. pcm->fd=open(dname,O_RDWR);
  22. if(pcm->fd<0){
  23. oops(pcm,errno,"cannotopendevice"%s"");
  24. returnpcm;
  25. }
  26. if(ioctl(pcm->fd,SNDRV_PCM_IOCTL_INFO,&info)){
  27. oops(pcm,errno,"cannotgetinfo-%s");
  28. gotofail;
  29. }
  30. ...
  31. }

這裡不多考究這些介面實現。alsa_pcm.c中有個函數挺有趣的:[cpp] view plaincopy

  1. staticvoidparam_set_mask(structsnd_pcm_hw_params*p,intn,unsignedbit)
  2. {
  3. if(bit>=SNDRV_MASK_MAX)
  4. return;
  5. if(param_is_mask(n)){
  6. structsnd_mask*m=param_to_mask(p,n);
  7. m->bits[0]=0;
  8. m->bits[1]=0;
  9. m->bits[bit>>5]|=(1<<(bit&31));
  10. }
  11. }

其中SNDRV_MASK_MAX和snd_mask的定義分別如下:

[cpp] view plaincopy

  1. #defineSNDRV_MASK_MAX256
  2. structsnd_mask{
  3. __u32bits[(SNDRV_MASK_MAX+31)/32];
  4. };

結合SNDRV_MASK_MAX和snd_mask來理解:可以mask的位數高達256,但是我們計算機字長是32位,因此用8個32位的數組來構成一個256位的掩碼,param_set_mask函數就是這個掩碼進行設置。

其中m->bits[bit >> 5] |= (1 << (bit & 31));為核心語句,bit>>5其實就是bit除以32(即數組元素長度)取得數組下標,1 << (bit & 31)是掩碼位在數組元素中的偏移量。如bit=255時,則數組下標是7,即數組bits最後一個元素,偏移量是1<<31,這時整個bits數據就是這樣:bits[7:0] = 0x80000000:0x00000000:0x00000000:0x00000000:0x00000000:0x00000000:0x00000000:0x00000000,這個256位的掩碼的最高位就置1了。當然在實際應用中並不會用到那麼高位的掩碼,這裡應該是為了方便以後擴展使用的,因此也只需要m->bits[0] = 0;m->bits[1] = 0,看來僅僅最多用到64位掩碼。

ADCLRC約束條件

在pcm_open中,有

[cpp] view plaincopy

  1. param_set_int(?ms,SNDRV_PCM_HW_PARAM_RATE,44100);
  2. if(ioctl(pcm->fd,SNDRV_PCM_IOCTL_HW_PARAMS,?ms)){
  3. oops(pcm,errno,"cannotsethwparams");
  4. gotofail;
  5. }

可見,無論放音還是錄音,都是設置44.1khz的採樣率的。在我們的底層I2S驅動中,放音錄音也是固定一個採樣率44.1khz。為什麼這樣做?放音就罷了,Android由於需要混合各個track的數據,故把放音採樣率固定在44.1khz,而錄音為什麼也固定用44.1khz?註:這裡的採樣率直接對應硬體信號ADCLRC/DACLRC頻率。

首先需要了解一下I2S協議方面的知識。放音採樣率DACLRC,錄音採樣率ADCLRC都是通過同一個主時鐘MCLK分頻出來的。在底層音頻驅動中,一般有如下的結構體:

[cpp] view plaincopy

  1. struct_coeff_div{
  2. u32mclk;
  3. u32rate;
  4. u16fs;
  5. u8sr;
  6. u8bclk_div;
  7. };
  8. /*codechifimclkclockdividercoefficients*/
  9. staticconststruct_coeff_divcoeff_div[]={
  10. /*8k*/
  11. {12288000,8000,1536,0x4,0x0},
  12. /*11.025k*/
  13. {11289600,11025,1024,0x8,0x0},
  14. /*16k*/
  15. {12288000,16000,768,0x5,0x0},
  16. /*22.05k*/
  17. {11289600,22050,512,0x9,0x0},
  18. /*32k*/
  19. {12288000,32000,384,0x7,0x0},
  20. /*44.1k*/
  21. {11289600,44100,256,0x6,0x07},
  22. /*48k*/
  23. {12288000,48000,256,0x0,0x07},
  24. /*96k*/
  25. {12288000,96000,128,0x1,0x04},
  26. };

其中MCLK有兩個可配頻率,分別是12288000和11289600,前者用於8k、16k、32k、48k、96khz的分頻,後者用於11.025k、22.05k、44.1khz的分頻。具體算式是rate=mclk/fs,如44100=11289600/256。

看出問題了沒有?如果錄音採樣率設置為8khz,則MCLK必須轉變為12288000,此時DACLRC就會被改變(放音聲音會變得尖銳),不利於同時放音錄音。因此錄音採樣率是受其約束的,其實也不是一定是44.1khz,是11.025khz的倍數即可,能保證是可以從同一個MCLK分頻。

DownSampler

在android2.3.1-gingerbread/device/samsung/crespo/libaudio中,除了mini alsa-lib外,就是Samsung為Android寫的AudioHAL了,如AudioHardware.cpp,這相當於alsa_sound中的文件。這個HAL有很大的通用性,移植到無通話功能的MID上都可以正常工作的,當然也保留Samsung的一些專用性,主要是通話語音通道處理。這裡不詳述這個音頻HAL文件,如果對AudioFlinger和alsa_sound比較熟悉的話,會很快上手掌握。

如上個章節所說,底層錄音採樣率ADCLRC固定是44.1khz,那麼上層如果想要其他的採樣率如8khz,怎麼辦?resample無疑。由於這裡支持的錄音採樣率有:8000, 11025, 16000, 22050, 44100,都低於或等於44.1khz,則只需要downsample(同理從低採樣率轉換到高採樣率叫upsample)。如下是簡單的分析:

[cpp] view plaincopy

  1. status_tAudioHardware::AudioStreamInALSA::set(
  2. AudioHardware*hw,uint32_tdevices,int*pFormat,
  3. uint32_t*pChannels,uint32_t*pRate,AudioSystem::audio_in_acousticsacoustics)
  4. {
  5. if(pFormat==0||*pFormat!=AUDIO_HW_IN_FORMAT){
  6. *pFormat=AUDIO_HW_IN_FORMAT;//AudioSystem::PCM_16_BIT
  7. returnBAD_VALUE;
  8. }
  9. if(pRate==0){
  10. returnBAD_VALUE;
  11. }
  12. //getInputSampleRate:取得與參數sampleRate最接近的且被支持的採樣率
  13. //支持的採樣率有:8000,11025,16000,22050,44100
  14. //事實上,這裡傳入來的sampleRate必須是被支持的,否則返回BAD_VALUE
  15. uint32_trate=AudioHardware::getInputSampleRate(*pRate);
  16. if(rate!=*pRate){
  17. *pRate=rate;
  18. returnBAD_VALUE;
  19. }
  20. if(pChannels==0||(*pChannels!=AudioSystem::CHANNEL_IN_MONO&&
  21. *pChannels!=AudioSystem::CHANNEL_IN_STEREO)){
  22. *pChannels=AUDIO_HW_IN_CHANNELS;//AudioSystem::CHANNEL_IN_MONO
  23. returnBAD_VALUE;
  24. }
  25. mHardware=hw;
  26. LOGV("AudioStreamInALSA::set(%d,%d,%u)",*pFormat,*pChannels,*pRate);
  27. //getBufferSize:根據採樣率和聲道數確定buffer的大小
  28. //popCount:計算參數u有多少個非0位,其實現很有趣,大家可以研究下它的演算法
  29. mBufferSize=getBufferSize(*pRate,AudioSystem::popCount(*pChannels));
  30. mDevices=devices;
  31. mChannels=*pChannels;
  32. mChannelCount=AudioSystem::popCount(mChannels);
  33. mSampleRate=rate;
  34. //檢查mSampleRate是否與AUDIO_HW_OUT_SAMPLERATE(44.1khz)一致,否則需要downresample
  35. if(mSampleRate!=AUDIO_HW_OUT_SAMPLERATE){
  36. mDownSampler=newAudioHardware::DownSampler(mSampleRate,
  37. mChannelCount,
  38. AUDIO_HW_IN_PERIOD_SZ,
  39. this);
  40. status_tstatus=mDownSampler->initCheck();
  41. if(status!=NO_ERROR){
  42. deletemDownSampler;
  43. LOGW("AudioStreamInALSA::set()downsamplerinitfailed:%d",status);
  44. returnstatus;
  45. }
  46. mPcmIn=newint16_t[AUDIO_HW_IN_PERIOD_SZ*mChannelCount];
  47. }
  48. returnNO_ERROR;
  49. }

以上是set方法,檢查參數format、samplerate和channelcount的合法性,檢查samplerate是否與ADCLRC一致,如果不一致,則創建一個DownSampler。

我們再看看read方法代碼片段:

[cpp] view plaincopy

  1. ssize_tAudioHardware::AudioStreamInALSA::read(void*buffer,ssize_tbytes)
  2. {
  3. ......
  4. //檢查是否創建了DownSampler
  5. if(mDownSampler!=NULL){
  6. size_tframes=bytes/frameSize();
  7. size_tframesIn=0;
  8. mReadStatus=0;
  9. do{
  10. size_toutframes=frames-framesIn;
  11. //調用DownSampler的resample方法,該方法從音頻介面讀取pcm數據,然後對這些數據resample
  12. mDownSampler->resample(
  13. (int16_t*)buffer+(framesIn*mChannelCount),
  14. &outframes);
  15. framesIn+=outframes;
  16. }while((framesIn<frames)&&mReadStatus==0);
  17. ret=mReadStatus;
  18. bytes=framesIn*frameSize();
  19. }else{
  20. TRACE_DRIVER_IN(DRV_PCM_READ)
  21. //並未創建DownSampler,直接讀取pcm數據送到緩衝區
  22. ret=pcm_read(mPcm,buffer,bytes);
  23. TRACE_DRIVER_OUT
  24. }
  25. ......
  26. }

可知,當上層需要的samplerate與44.1khz不符時,會轉入DownSampler::resample處理:

1、調用AudioHardware::AudioStreamInALSA::getNextBuffer方法,獲取音頻pcm數據,存放到buffer,並計算下一次buffer的地址;

2、將buffer中的數據分解成各個聲道的數據並保存到mInLeft和mInRight;

3、由於原始的音頻pcm數據採樣率是44.1khz的,調用resample_2_1將數據轉為22.05khz採樣率;

4、1) 如果上層需要的samplerate=11.025khz,調用resample_2_1將數據採樣率從22.05khz轉換到11.025khz;

2) 如果上層需要的samplerate=8khz,調用resample_441_320將數據採樣率從11.025khz轉換到8khz;

5、如果上層需要的samplerate=16khz,調用resample_441_320將數據採樣率從22.05khz轉換到16khz。

可見真正的resample處理是在resample_2_1()和resample_441_320()這兩個函數中。前者是對倍數2的採樣率進行resample的,如44100->22050, 22050->11025, 16000->8000等;後者是對比率為441/320的採樣率進行resample的,如44100->32000, 22050->16000, 11025->8000等。

你的讚賞是我堅持原創的動力

讚賞共 0 人讚賞
推薦閱讀:

儒教的神靈系統
分散式緩存系統Memcached簡介與實踐
VRV空調系統,你了解嗎?
撥開免疫系統迷霧:增強免疫力強能使人健康嗎?
海龜股票交易系統(1)

TAG:音頻 | 系統 |