http://blog.csdn.net/ce123_zhouwei/article/details/6919862
IIS音頻總線學習(一)數字音頻技術
一、聲音的基本概念
聲音是通過一定介質傳播的連續的波。

重要指標:
- 振幅:音量的大小
- 周期:重復出現的時間間隔
- 頻率:指信號每秒鍾變化的次數
聲音按頻率分類:

聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。 聲音的三種類型:
- 波形聲音:包含了所有聲音形式
- 語音:不僅是波形聲音,而且還有豐富的語言內涵(抽象→提取特征→意義理解)
- 音樂:與語音相比,形式更規范。音樂是符號化的聲音。
二、聲音的數字化
1.聲音信號的類型
- 模擬信號(自然界、物理)
- 數字信號(計算機)
2.聲音數字化過程

3.聲音數字化過程示意圖

4.聲音數字化三要素
采樣頻率 |
量化位數 |
聲道數 |
每秒鍾抽取聲波幅度樣本的次數 |
每個采樣點用多少二進制位表示數據范圍 |
使用聲音通道的個數 |
采樣頻率越高 聲音質量越好 數據量也越大 |
量化位數越多 音質越好 數據量也越大 |
立體聲比單聲道的表現力豐富,但數據量翻倍 |
11.025kHz 22.05 kHz 44.1 kHz |
8位=256 16位=65536 |
單聲道 立體聲 |
5.聲音數字化的數據量
音頻數據量=采樣頻率×量化位數×聲道數/8(字節/秒)
采樣頻率 (kHz) |
量化位數 (bit) |
數據量(KB/s) |
|
單聲道 |
立體聲 |
||
11.025 |
8 |
10.77 |
21.35 |
16 |
21.53 |
43.07 |
|
22.05 |
8 |
21.53 |
43.07 |
16 |
43.07 |
86.13 |
|
44.1 |
8 |
43.07 |
86.13 |
16 |
86.13 |
172.27 |
三、音頻的文件格式
1.WAV文件
WAV是Microsoft/IBM共同開發的PC波形文件。因未經壓縮,文件數據量很大。
特點:聲音層次豐富,還原音質好
2.MP3文件
MP3(MPEG Audio layer3)是一種按MPEG標准的音頻壓縮技術制作的音頻文件。
特點:高壓縮比(11:1),優美音質
3.WMA文件
WMA(Windows Media Audio)是Windows Media格式中的一個子集(音頻格式)。
特點:壓縮到MP3一半
4.MIDI文件
MIDI(樂器數字接口)是由一組聲音或樂器符號的集合。
特點:數據量很小,缺乏重現自然音
四、數字音頻壓縮標准
1.音頻壓縮方法概述

壓縮編碼技術是指用某種方法使數字化信息的編碼率降低的技術
音頻信號能壓縮的基本依據:
①聲音信號中存在大量的冗余度;
②人的聽覺具有強音能抑制同時存在的弱音現象。
音頻信號壓縮編碼的分類:
①無損壓縮(熵編碼)
霍夫曼編碼、算術編碼、行程編碼
②有損壓縮
波形編碼--PCM、DPCM、ADPCM 、子帶編碼、矢量量化
參數編碼--LPC
混合編碼--MPLPC、CELP
2.音頻壓縮技術標准
分類 |
標准 |
說明 |
電話語 音質量 |
G.711 |
采樣8kHz,量化8bit,碼率64kbps |
G.721 |
采用ADPCM編碼,碼率32kbps |
|
G.723 |
采用ADPCM有損壓縮,碼率24kbps |
|
G.728 |
采用LD-CELP壓縮技術,碼率16kbps |
|
調幅廣 播質量 |
G.722 |
采樣16kHz,量化14bit,碼率224(64)kbps |
高保真 立體聲 |
MPEG 音頻 |
采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個壓縮層次,384-64kbps) |
五、聲卡
1.聲卡的主要功能
聲卡是負責錄音、播音和聲音合成的一種多媒體板卡。其功能包括:
①錄制、編輯和回放數字音頻文件
②控制和混合各聲源的音量
③記錄和回放時進行壓縮和解壓縮
④語音合成技術(朗讀文本)
⑤具有MIDI接口(樂器數字接口)
2.芯片類型
- CODEC芯片(依賴CPU,價格便宜)
- 數字信號處理器DSP(不依賴CPU)
-
I2S音頻總線學習(二)I2S總線協議
一、I2S總線概述
音響數據的采集、處理和傳輸是多媒體技術的重要組成部分。眾多的數字音頻系統已經進入消費市場,例如數字音頻錄音帶、數字聲音處理器。對於設備和生產廠家來說,標准化的信息傳輸結構可以提高系統的適應性。I2S(Inter—IC Sound)總線是飛利浦公司為數字音頻設備之間的音頻數據傳輸而制定的一種總線標准,該總線專責於音頻設備之間的數據傳輸,廣泛應用於各種多媒體系統。
二、I2S總線規范
I2S總線擁有三條數據信號線:
1、SCK: (continuous serial clock) 串行時鍾
對應數字音頻的每一位數據,SCK都有1個脈沖。SCK的頻率=2×采樣頻率×采樣位數。
2、WS: (word select) 字段(聲道)選擇
用於切換左右聲道的數據。WS的頻率=采樣頻率。命令選擇線表明了正在被傳輸的聲道。
WS為“1”表示正在傳輸的是左聲道的數據。
WS為“0”表示正在傳輸的是右聲道的數據。
WS可以在串行時鍾的上升沿或者下降沿發生改變,並且WS信號不需要一定是對稱的。在從屬裝置端,WS在時鍾信號的上升沿發生改變。WS總是在最高位傳輸前的一個時鍾周期發生改變,這樣可以使從屬裝置得到與被傳輸的串行數據同步的時間,並且使接收端存儲當前的命令以及為下次的命令清除空間。
3、SD: (serial data) 串行數據
用二進制補碼表示的音頻數據。 I2S格式的信號無論有多少位有效數據,數據的最高位總是被最先傳輸(在WS變化(也就是一幀開始)后的第2個SCK脈沖處),因此最高位擁有固定的位置,而最低位的位置則是依賴於數據的有效位數。也就使得接收端與發送端的有效位數可以不同。如果接收端能處理的有效位數少於發送端,可以放棄數據幀中多余的低位數據;如果接收端能處理的有效位數多於發送端,可以自行補足剩余的位(常補足為零)。這種同步機制使得數字音頻設備的互連更加方便,而且不會造成數據錯位。為了保證數字音頻信號的正確傳輸,發送端和接收端應該采用相同的數據格式和長度。當然,對I2S格式來說數據長度可以不同。對於系統而言,產生SCK和WS的信號端就是主設備,用MASTER表示,簡單系統示意圖如圖1所示:圖1 簡單系統配置和基本接口時序
另一個基本的接口時序圖可以參看圖2所示:圖2 I2S典型的接口時序4、時序要求
在IIS總線中,任何設備都可以通過提供必需的時鍾信號成為系統的主設備置,而從屬設備通過外部時鍾信號來得到它的內部時鍾信號,這就意味着必須重視主設備和數據以及命令選擇信號之間的傳播延遲,總的延遲主要由兩部分組成:
1.外部時鍾和從設備的內部時鍾之間的延遲
2.內部時鍾和數據信號以及命令選擇信號之間的延遲
對於數據和命令信號的輸入,外部時鍾和內部時的延遲不占據主導的地位,它只是延長了有效的建立時間(set-up time)。延遲的主要部分是發送端的傳輸延遲和設置接收端所需的時間。見圖3和圖4:圖3 Timing for IIS Transmitter圖4 Timing for IIS Receiver其中: