從兩聲道立體聲、多聲道環繞聲再到三維沉浸式音效,接近真實世界和創作者意圖的觀影體驗逐漸呈現在觀眾的面前。當我們談論三維音效時,我們往往驚嘆于音箱數量之多,聚焦于精確的音箱擺位,熱衷于探究杜比全景聲、DTS:X和AURO-3D等主流沉浸式音頻格式的同與異。但你是否想過,作為三維音效的核心,高度聲道究竟從何而來?高度揚聲器的數量和布局如何演變?這當中,又涉及哪些有趣的建筑聲學和心理聲學知識呢?
從建筑聲學開始說起
在新近出版的《沉浸式聲音:雙耳聲和多聲道音頻的藝術與科學》一書中,作者Paul Geluso嘗試從建筑聲學的角度,來探究高度聲像/聲場的起源。他提到,即使史前時期的音樂家和神職人員也知道,洞穴中輻射的聲音會增加感知響度,從而提升人們對于神明的敬畏感。在音樂的發展歷程中,音樂家和觀眾逐漸意識到聲學環境能夠顯著改變人們欣賞音樂表演的體驗,甚至“一個特定的聲學環境可以被視作樂器來處理”。
位于馬薩諸塞州的 Koussevitzky Music Shed 音樂廳
很多建筑設計師們也早將目光緊緊投注在房頂樣式和空間高度上。Paul Geluso舉了兩個例子,一個是位于馬薩諸塞州的Koussevitzky Music Shed音樂廳,另一個是日本的Yamaha Ginza音樂廳。前者為了解決音樂聽感渾濁的情況,在樂隊和前排觀眾的頭頂上搭了一個類似“天棚”的結構。這個天棚由一系列大尺寸的三角形構成,其中有50%的表面積是開孔的,看上去像許多巨大的蝙蝠翅膀連接在一起(見圖1)。書中提到,這樣設計的目的在于“一半聲音從開孔的位置穿過,到達上方空間,保證混響時間不變,另一半聲音通過反射回到觀眾區,增加聲音的清晰度和親切感。”
Yamaha Ginza 音樂廳位于東京,特點是內部空間寬度較窄,但是房頂很高
Yamaha Ginza音樂廳位于東京,特點是內部空間寬度較窄,但是房頂很高。設計師為了塑造更強烈的空間感,在音樂廳的頂部增設了一個拱形表面和若干可移動的反射體(見圖2)。可別小看這幾塊反射體,它們一方面可以增強樂器的直達聲,另一方面能調整正面和側方的聲學能量,塑造更適宜的空間感。通過控制反射體的高度,甚至可以調整聲像的感知尺寸(或范圍)。
ITU-R BS.2051-0 標準建議書提議以“X/Y/Z.LFE”格式進一步明確了各層前/側/后(加LFE)揚聲器的數量
高度聲道的感知和方向性頻段
上期,我們已經在《神秘的“幻象聲像/聲場”從何而來?》中為各位簡單介紹了基于雙耳時間差(ITD,intramural time difference)和雙耳電平差(ILD,interaural level difference)的定位機制。需要注意的是,這些雙耳間的信息差異對于感知高度聲源的方向和空間信息并沒有那么重要,相反,肩膀、頭部和耳廓反射塑造出的頻率變化影響更大,尤其是聲源位于正中平面的時候。阿強家庭影院
1996年,Jens Blauert在對相關現象進行深入研究之后,發現了聲源位置與特定頻段的增減之間有特別的關系,并將這些頻段命名為“方向性頻段”,比如8kHz為中心的頻段就與頭頂位置相關。在他之后,相關研究也沒有停止。雖然得出的數據和結果略顯不同,但無一不證明“方向性頻段”的存在。“以8kHz為中心頻率的1/3倍頻程頻段與正中平面上的頭頂位置聽覺密切相關。”
簡單來說,當高度信號被輻射時,方向性頻段會影響感知高度。舉個例子,如果將Hi-Hat踩镲聲(主要集中在8kHz)定位在前上方揚聲器中,由于高度方向性頻段在信號頻譜中占據主導,實際聽感方位可能比預期更高。因此在實際應用中,一方面要考慮頻率內容對聲音信號的合理分布產生的影響;另一方面,可以通過調整方向性頻段的頻率,在不使用高度揚聲器的情況下提高感知聲像的位置。
虛擬的高度聲像
這就相當于,獲得一個虛擬的高度聲像 。Tomlinson Holman在《多聲道環繞聲技術(第二版)》 書中談到幻象聲場/聲像的來源時,說道“當反射聲電平增高到某一水平時,‘綜合定位效應’開始起作用,使兩個聲源之間的方位被聽音者判斷為聲源的方位,從而產生了幻象聲源,在揚聲器之間形成幻象聲像。”發燒友們對這一概念最真切的體會應該是在聆聽兩聲道Hi-Fi音樂時,感覺歌手就站在自己的面前唱歌。很多時候,我們對虛擬聲像的討論也多是集中在水平方向的揚聲器之間,那么,水平揚聲器和高度揚聲器之間也能獲得一個穩定的虛擬聲像嗎?針對這個問題,研究人員進行了多項心理聲學實驗,并得出以下結論:
當ICTD(Inter-Channel Time Difference通道間時間差)小于10ms時,小于6-7dB的ICLD(Inter-Channel Level Difference通道間強度差/電平差)僅對高度聲道的信號產生水平方向的定位。而當高度揚聲器相較水平揚聲器的ICLD高于7dB時,就會提升虛擬聲像的高度。
10dB的ICLD可以將聲像從一個水平面提升到另一個水平面。
值得注意的是,多個研究結果都表明,雖然兩只揚聲器可以對高度聲像的定位進行渲染,但高度聲像定位無法像水平的前置聲像定位那么準確。
AuroMax 格式最高支持 26.1 聲道系統
高度揚聲器的數量演變
基于此,多家機構開始陸續提出了包含高度聲道在內的三維揚聲器布局。ITU-R BS.2051-0標準建議書(ITU,2014)中對此有著非常詳細的闡述,并建議用用“上方揚聲器數量+中部揚聲器數量+下方揚聲器數量”的形式來表示三維揚聲器布局。其中上方指的是高度平面,中部表示的是靠近人耳的水平平面,下方指的是地平面。按照這個說法,傳統的5.1聲道系統可以被標記為0+5+0布局。在此基礎上,建議書甚至提議以“X/Y/Z.LFE”格式進一步明確了各層前/側/后(加LFE)揚聲器的數量,如圖3所示。
Tomlinson Holman 曾提出在 2+8+0 的布局基礎上增加兩只低音炮,從而得到我們熟悉的 THX10.2 系統
THX10.2
按照中層揚聲器成雙成對的邏輯,高度揚聲器的布局演變從兩只上層揚聲器開始。它們的位置通常是在左前和右前揚聲器的上方,與中層的揚聲器配合使用,讓聽眾能獲得自然的縱深感。Tomlinson Holman曾提出在2+8+0的布局基礎上增加兩只低音炮,從而得到我們熟悉的THX10.2系統。
2010年,Kim、Lee和Pulkki為確定所需高度揚聲器的數量做了一項研究,讓聽音者們對0、2、3、4和9只上層揚聲器布局的定位和空間感進行評價。就整體效果而言,聽音者們均認為9只揚聲器的布局更加出色,而3-4只揚聲器能提供可信的方向性特征。
AURO-3D
AURO Technologies也對揚聲器的數量和位置進行了許多探索,包括使用4只或更多數量的高度揚聲器、將上層揚聲器直接放置在中層揚聲器的正上方、增加一個頭頂正上方的揚聲器(也被稱為VOG:Voice-of-the-God上帝之聲)。
2006年,AURO -3D的概念被正式提出。專利的AURO -MATIC技術甚至能將傳統立體聲或環繞聲音源渲染出適用于AURO -3D揚聲器布局的AURO -3D聲場。2015年,AURO Technologies宣布推出新一代的三維沉浸式音效格式——AuroMax,最高支持26.1聲道系統。
NHK22.2
可能很多人不知道的是,早在2003年,日本廣播公司NHK就提出了一套22.2(9+10+3)的多聲道系統。在屏幕范圍內使用了5只中層揚聲器、3只上層揚聲器和3只下層揚聲器。除此之外,還有11只揚聲器對屏幕外的沉浸式體驗進行擴展。
后來,Hamasaki等人進行了兩聲道、5.1聲道和22.2聲道系統主觀特點的比較研究。參加實驗的聽音者們都認為22.2聲道在所有測試項目(響度除外)上均超過兩聲道系統,并且在以下六個方面超過5.1聲道系統:前/后區分度、上/下區分度、運動、方向、混響和包圍感。
《沉浸式聲音:雙耳聲和多聲道音頻的藝術與科學》一書中對這個實驗進行了詳細的描述,并特別指出“22.2系統能夠為更多聽音者提供相似的聽音體驗”,即“擴展了有效聽音區”。
2011年,Hamasaki在后續論文中進一步總結了9+10+3揚聲器布局需要做到的五個特征:
完整性:能夠在屏幕上的任何位置對聲像進行定位;
全向性:以聽音者為中心,能重播任何方向上的聲音;
臨場感:能夠呈現自然、高品質的三維空間;
兼容性:能夠與現有多聲道格式兼容;
可用性:能夠支持實況錄音和實況播出。
DTS:X 誕生之初還僅支持 7.1.4 聲道
杜比全景聲是目前應用最廣泛的三維音頻格式之一
借助杜比反射式音箱模塊來增強上方聲場的表現力
最新的 DTS:X Pro 格式已經能在 7.1.6、13.2.9 及更多聲道的布局中配置多達32只揚聲器,實現 5 層架構
杜比全景聲和DTS:X
時間來到2012年前后,杜比全景聲(Dolby Atmos)和DTS:X格式相繼登場。這兩個基于對象的音頻格式在商用和家用領域都發展迅猛,以后來者居上的姿態,成為與AURO-3D并駕齊驅的主流三維音頻格式。目前杜比全景聲格式最高支持24.1.10揚聲器布局。
DTS:X也不遑多讓,誕生之初還僅支持7.1.4聲道,最新的DTS:X Pro格式已經能在7.1.6、13.2.9及更多聲道的布局中配置多達32只揚聲器,實現5層架構。阿強家庭影院
高度揚聲器的布局影響
數量是最直觀的,但高度揚聲器的布局和擺位也不容忽視。2015年,Kim、King和Kamekawa對4+5+0揚聲器布局中的高度揚聲器布局進行了比較。研究人員將12只高度揚聲器放置在水平方位角不同,而高度角相同(+30°)的位置,每次選擇4只揚聲器來重播高度聲道的信息,共有8種不同的組合方式。
結果顯示,高度揚聲器的位置比信號內容(如混響類型/音樂選擇)所帶來的影響更大。聽音者在進行布局選擇時,會更傾向于選擇那些“前額的”“狹窄的”聲像,能提供強烈的臨場感而非更好的整體空間感。另外,揚聲器布局也會影響聽眾對聲場的感知,從而影響對整體音質的評判。
參考資料
1《沉浸式聲音:雙耳聲和多聲道音頻的藝術與科學》Paul Geluso著,翼翔譯,人民郵電出版社,2021年
2《多聲道環繞聲技術(第二版)》 Tomlinson Holman著,王玨譯,人民郵電出版社,2011年
3《ITU-R BS.2051-0建議書(02/2014)》,國際電信聯盟發布,2014