作者:杜奕寧
今天布置了這學(xué)期信號(hào)與系統(tǒng)的小論文作業(yè)。有參加了上海中學(xué)生的科技節(jié)作品評(píng)選。他們的一篇關(guān)于聲音與年齡的論文讓我很感興趣。不知道這學(xué)期我的信號(hào)與系統(tǒng)班上的同學(xué)提交的小論文能否趕上這位中學(xué)生研究論文的內(nèi)容。
01 引 言
1.1 項(xiàng)目由來(lái)
我對(duì)音樂(lè)很感興趣,所以,我在尋找課題時(shí),最初的想法也落在了“聲音”上。我了解到諧波分析可以提取聲音特征,于是在經(jīng)過(guò)幾次嘗試、調(diào)整后,我選擇以年齡為變量分析人的聲音。
對(duì)于“諧波”的好奇,源于一個(gè)聲音的實(shí)驗(yàn):用濕潤(rùn)手指摩擦裝水高腳杯發(fā)出的440 Hz以及國(guó)際基準(zhǔn)音中央A(440 Hz),它們的聲音是完全不一樣的。前者聲音刺耳且古怪,但后者卻完全處于我們的舒適的認(rèn)知范圍內(nèi)。這個(gè)例子也說(shuō)明諧波對(duì)人聽(tīng)覺(jué)所帶來(lái)的影響不可忽視,是很值得去探究的。
所以最后的題目就定為:“基于頻譜分析探究人的聲音隨年齡的變化”。
1.2 文獻(xiàn)綜述
通過(guò)對(duì)于“聲帶”、“年齡”等關(guān)鍵詞的內(nèi)容模糊搜索,我在許多生物學(xué)、醫(yī)學(xué)的期刊或論文里進(jìn)一步了解了人的發(fā)聲機(jī)制。通過(guò)對(duì)于“諧波”、“頻譜”等關(guān)鍵詞的搜索,我看到了較多有關(guān)于聲音的特征提取以及諧波對(duì)于聲音的影響。這兩部分各自的檢索結(jié)果都比較多。相對(duì)而言,二者相結(jié)合的研究就非常少了。
尹基德的漢語(yǔ)韻律嗓音發(fā)聲研究便是一例,他將聲帶發(fā)聲機(jī)制以及聲音的基音、諧波結(jié)合在一起考慮,重點(diǎn)把不同的漢語(yǔ)發(fā)音作為變量。雖然此研究與漢語(yǔ)發(fā)音并無(wú)關(guān)系,但是是為數(shù)不多的涉及到發(fā)聲機(jī)制以及諧波特征的綜合研究。
1.2.1 聲帶發(fā)聲原理
聲帶位于人類的喉部,是一個(gè)發(fā)聲器官,主要是由甲狀軟骨、杓狀軟骨、環(huán)狀軟骨、環(huán)甲肌、真聲帶(聲襞)、假聲帶(前庭襞)等部分組成。
覃折波等人利用超聲成像,解析正常人聲帶區(qū)的發(fā)聲原理。在研究中他們提到:“聲襞本身構(gòu)成了聲門的一部分,其游離的內(nèi)側(cè)緣所形成的開(kāi)口即為聲門裂,聲門裂是喉腔最狹窄的部位。在喉內(nèi)肌協(xié)調(diào)作用的支配下,聲襞運(yùn)動(dòng)使聲門裂有規(guī)律的開(kāi)放和閉合,從氣管和肺沖出的氣流不斷沖擊聲帶,引起振動(dòng)而發(fā)聲。”同時(shí)他們?cè)诜治鰯?shù)據(jù)時(shí)也指出了隨著年齡增長(zhǎng)發(fā)聲器官的老化現(xiàn)象:“這與甲狀軟骨隨著年齡增加鈣化逐漸嚴(yán)重的生理特點(diǎn)相符,而聲像圖上顯示因甲狀軟骨嚴(yán)重鈣化致影遮擋也證實(shí)了這點(diǎn)。”
▲ 圖1.2.1 聲帶結(jié)構(gòu)示意圖
在尹基德漢語(yǔ)韻律的嗓音發(fā)聲的研究中,他從三個(gè)調(diào)節(jié)方面來(lái)論述了漢語(yǔ)韻律的發(fā)音方式:音調(diào)調(diào)節(jié)、時(shí)長(zhǎng)調(diào)節(jié)以及強(qiáng)度調(diào)節(jié)。在音調(diào)調(diào)節(jié)方面,作者提出,最重要的便是環(huán)甲肌與聲帶肌。如上圖1所示,環(huán)甲肌通過(guò)拉扯甲狀軟骨來(lái)調(diào)節(jié)真聲帶的張力,從而改變聲帶肌的硬度與有效質(zhì)量以調(diào)節(jié)音調(diào)。另外,文中提到真聲與假聲的發(fā)聲原理是不同的,“從正常嗓音發(fā)聲轉(zhuǎn)變?yōu)榧俾晻r(shí),環(huán)甲肌的變化不明顯而聲帶肌的電信號(hào)明顯下降。”1注意到這一點(diǎn),本項(xiàng)目的聲音樣本全部采用的是真聲。
另外,日本耳科會(huì)報(bào)的一篇文章提出:聲帶肌截面積變化、聲帶肌纖維數(shù)的變化、肌纖維類型的變化、脂褐質(zhì)沉積率四個(gè)方面是聲帶老化的重要指標(biāo)。
通過(guò)這些文獻(xiàn)的查閱,我認(rèn)為,人的聲音會(huì)隨著年齡的增加而有一定的變化,而如何對(duì)其進(jìn)行測(cè)量,并找到其中的關(guān)聯(lián)性,則是我的研究重點(diǎn)。
1.2.2 諧波的研究概述
“諧波”在許多有關(guān)聲音文章中都被作為了一個(gè)關(guān)鍵數(shù)據(jù)去看待,因?yàn)?ldquo;諧波”確實(shí)是與我們平時(shí)所說(shuō)的“音色”是分不開(kāi)的。
張雪源在其研究中提到,人在聽(tīng)到一個(gè)具有諧波結(jié)構(gòu)的聲音時(shí),不會(huì)依次感知到每一個(gè)單一泛音的頻率,而是將信號(hào)整體感知為基頻頻率,而將泛音的個(gè)數(shù)、能量大小、泛音能量衰減速率等感知為音色 。黃天乾等人通過(guò)分析鋼琴比較特殊的七次諧波、九次諧波來(lái)研究其音質(zhì)5;張雪源則分析得出:小提琴因其泛音多且能量衰減慢、黑管因其泛音少而能量衰減快,所以前者聲音明亮而后者較為低沉(張雪源)4;楊婧基于諧波的特征對(duì)于不同樂(lè)器進(jìn)行音色特征提取6……這些都反應(yīng)了諧波作為一個(gè)聲音特征的重要地位。所以,在對(duì)聲音進(jìn)行定量分析的過(guò)程中,諧波的研究有其重要的意義。
1.3 研究意義
在除了純粹的科學(xué)探究以外,本實(shí)驗(yàn)還可能為其它切實(shí)的領(lǐng)域提供幫助:
1. 在此基礎(chǔ)上進(jìn)一步了解聲音衰老的機(jī)制,幫助提出修復(fù)方法
2. 進(jìn)一步擴(kuò)大數(shù)據(jù),可以提取特定年齡的特定聲音特征,可用于身份識(shí)別等領(lǐng)域。
1.4 創(chuàng)新點(diǎn)
本人認(rèn)為,該研究的創(chuàng)新點(diǎn)主要有以下兩點(diǎn):
1. 通過(guò)對(duì)人的聲音的諧波分析,在前人定性聲帶衰老的基礎(chǔ)上,為定量研究人的聲帶衰老提供可能。
2. 通過(guò)對(duì)頻譜特征的提取讓聲音在數(shù)據(jù)層面上與年齡相關(guān)聯(lián),并輔助其推測(cè)。
02 原 理
▲ 圖2.1 諧波示意圖
如上圖2諧波原理圖所示:黑色直線是弦,藍(lán)線、黃線、綠線都是這根弦的振動(dòng)方式,分別代表著二次諧波、三次諧波、四次諧波……以此類推,但一般而言越往后的能量就越微弱??梢院苋菀字溃翰ㄩL(zhǎng)λ乘以諧波次數(shù)n就等于半條弦的長(zhǎng)度,同時(shí):一秒鐘速度u = 一秒內(nèi)波的頻數(shù)f每一段波的長(zhǎng)度λ。所以得到: 。把第二個(gè)式子帶入第一個(gè)式子, 。
如果假設(shè)弦長(zhǎng)一定,且弦各部分均勻,那么L與u皆為定值,則f與n成正比。這證明了倍頻的頻率在理論中應(yīng)為基頻的整數(shù)倍。
03 實(shí) 驗(yàn)
3.1 實(shí)驗(yàn)器材
【表-1 實(shí)驗(yàn)器材】
使用軟件 | 功能 | 使用版本 |
---|---|---|
Sigview | 音頻分析軟件 | Sigview v5.0 |
Adobe Audition CC | 音頻截取軟件 | Adobe Audition CC20 |
OriginPro | 圖表制作軟件 | OriginPro9.1 64-bit |
3.2 音頻采集
本文的研究方向在于一個(gè)人的聲音特征隨年齡變化的改變。因?yàn)楹茈y短時(shí)間做到跟蹤一個(gè)人幾十年的聲音,所以實(shí)驗(yàn)的音頻來(lái)源采用了李谷一幾乎每年春晚都演唱的《難忘今宵》。并且采用《難忘今宵》也有另一原因:歌唱與講話不同,歌唱可以確定一個(gè)相對(duì)穩(wěn)定的音高,有效地為實(shí)驗(yàn)控制了變量。如楊婧在其學(xué)術(shù)論文中所言,樂(lè)音信號(hào)與語(yǔ)音信號(hào)相比更具有明顯的諧波特征。
從第一次演唱的1984到最近期的2019,時(shí)間跨度為三十五年,除去一些并非李谷一演唱的部分,大概可以留下13份左右的樣本,數(shù)據(jù)較為充足。我兩次截取了所有不同年份音頻之中的“忘”字以及“宵”字。
伴奏音樂(lè)其實(shí)是一個(gè)實(shí)驗(yàn)中非常大的干擾。一開(kāi)始我粗糙截取了她演唱的整個(gè)音,但它們的伴奏往往在后半段掩蓋了人聲,導(dǎo)致音頻價(jià)值較低。所以我使用adobe audition較精細(xì)地裁剪掉了后邊樂(lè)聲掩蓋了人聲的部分。
3.3 頻譜分析
我將音頻導(dǎo)入sigview后,進(jìn)行了fft分析。如圖4所示,藍(lán)色是打開(kāi)音頻時(shí)的初始狀態(tài),是橫軸為時(shí)間的圖像;紅色則是傅里葉變換后輸出的頻譜。這一步操作完畢以后得到近三十份的頻譜便是我的“原始數(shù)據(jù)”了。
▲ 圖3.3.1 1990年“宵”字音頻分析
“數(shù)據(jù)收集”可以說(shuō)是本實(shí)驗(yàn)中遇到的一個(gè)挺大的困難,這是與我實(shí)驗(yàn)本身的特性相關(guān)的。經(jīng)過(guò)fft分析以后得到的數(shù)據(jù)是原始的、復(fù)雜的、凌亂的,所以我在抉擇到底采用那些數(shù)據(jù)作為有效數(shù)據(jù)時(shí)遇到了困難。為了避免混亂,得到一個(gè)固定的數(shù)據(jù)收集方式是非常重要的。下文將簡(jiǎn)單展示本人在確定數(shù)據(jù)收集方式時(shí),多方面的分析與考量。
3.3.1 基頻數(shù)據(jù)錄入方式
錄入基頻數(shù)據(jù)從三方面著手:
1. 假設(shè)其為基頻,是否能尋找到其對(duì)應(yīng)倍頻
2. 是否落在歌曲中該音的范圍內(nèi)(“忘”:392Hz-415Hz,“宵”:440-460Hz)
3. 以上二者任意答案為否的備選峰值直接排除,若仍有多選項(xiàng),取其y值明顯更高的。
若并不存在“明顯更大”,則改組數(shù)據(jù)不參與分析計(jì)算,僅作參考。
3.3.2 倍頻數(shù)據(jù)錄入方式
倍頻數(shù)據(jù)的錄入都是基于一個(gè)已經(jīng)確定的基頻之上的,要同時(shí)用到“set harmonic marker”、“show 5 highest points”兩個(gè)sigview的自帶功能。第一個(gè)是可以選定一個(gè)頻率以后自動(dòng)顯示出它所有理論倍頻的所在位置。“show 5 highest points”同字面意思,會(huì)顯示出你框定范圍內(nèi)的五個(gè)最高點(diǎn)并直接讀出此點(diǎn)坐標(biāo)。
左下圖的情況(紅圈為理論倍頻,藍(lán)色為實(shí)際峰值)是容易解決的,直接將理論倍頻往最近最高的峰值靠攏即可,但如果遇到右下圖這種情況,又該如何?左側(cè)不遠(yuǎn)處是最高峰,右側(cè)更近一點(diǎn)的地方是次高峰,那么取峰值更大的還是取更近的?實(shí)際操作一下就不難發(fā)現(xiàn),取最高峰非常好操作,答案也唯一。反之,如果把“取更近的”作為規(guī)則,那么在遇到圖5情況時(shí),就得不到答案了。
▲ 圖3.3.2 倍頻數(shù)據(jù)錄入案例-簡(jiǎn)單
▲ 圖3.3.3 倍頻數(shù)據(jù)錄入案例-復(fù)雜
圖5中,如果按照取最近峰值的原則,4號(hào)點(diǎn)應(yīng)該是首推,但4號(hào)點(diǎn)的縱軸數(shù)值極小。那在就近的原則下,再取了3號(hào)點(diǎn)作為最終數(shù)據(jù)。但一比對(duì),最高峰1號(hào)似乎只比三號(hào)點(diǎn)略遠(yuǎn)非常微弱的一點(diǎn)點(diǎn),卻在縱軸數(shù)值上大了一倍,二者便很難取舍了……這種混亂的取值方式是行不通的,因?yàn)樵谶x擇過(guò)程中,只要數(shù)據(jù)采集者隨意地心念一動(dòng),最終的取值就會(huì)發(fā)生翻天覆地的變化,數(shù)據(jù)也就失去了它應(yīng)有的價(jià)值。
故而,在所有倍頻數(shù)據(jù)的采集過(guò)程當(dāng)中,我都是直接取了候選名單中的最高峰。這樣子完全地杜絕了采集標(biāo)準(zhǔn)搖擺不定帶來(lái)的問(wèn)題,但這樣做同時(shí)也可能在實(shí)驗(yàn)中留下問(wèn)題——憑什么最大值就是真正應(yīng)該選擇的倍頻呢?理由有二:
第一,在這些候選峰值之中,橫坐標(biāo)的差值是非常小的,往往都在理論值的正負(fù)0.1-0.7%的區(qū)間內(nèi)。上圖是為了凸顯選擇數(shù)據(jù)的糾結(jié)所以把圖像放得很大,但實(shí)際上,往往橫坐標(biāo)只浮動(dòng)了幾赫茲就能讓縱坐標(biāo)翻一倍、甚至三四倍,那么取舍也很分明了。
第二,李谷一她自己唱出的聲音并不完美,有多個(gè)峰值是正?,F(xiàn)象。雖然我記錄的n次倍頻不能全然代表整段的n次諧波,但它是這一段諧波里最能代表這段諧波的峰值。
故而經(jīng)過(guò)仔細(xì)取舍,我最終選擇采取“取最高峰”的方式來(lái)記錄倍頻的值。
04 數(shù)據(jù)分析
我的基礎(chǔ)數(shù)據(jù)來(lái)源于兩波樣本——聲源為“忘”字的12份、聲源為“宵”字的12份。其中“宵”字樣本的質(zhì)量我觀察下來(lái)是更高的,所以在之后也會(huì)使用的略多一點(diǎn)。
在第二部分“原理”中,已經(jīng)解釋了基頻與倍頻的關(guān)系——倍頻頻率按理論來(lái)說(shuō)必然是基頻頻率的整數(shù)倍?;仡櫸覀兊玫嚼硐牍降闹T多假設(shè),其中兩點(diǎn)實(shí)際上并不能完全成立:一.振動(dòng)的弦長(zhǎng)度是一定的。二.弦是各處均勻的。人的聲帶在振動(dòng)時(shí)長(zhǎng)度是一定的嗎?人的聲帶是均勻的嗎?正是因?yàn)檫@些假設(shè)我們不能保證,所以說(shuō)會(huì)出現(xiàn)各種具有研究意義的誤差以及有意思的現(xiàn)象,也能觀察到一些規(guī)律。
4.1 峰值偏離與是年齡關(guān)系
4.1.1 峰值偏移與年齡觀察
在理想模型里面,倍頻應(yīng)該是嚴(yán)謹(jǐn)?shù)厥腔l的整數(shù)倍。所以我在最開(kāi)始時(shí),是非常嚴(yán)格地遵守這一條規(guī)則去采集數(shù)據(jù)的。但是我逐漸發(fā)現(xiàn),恰在x值=基頻整數(shù)倍的時(shí)候,y值并不在峰之上,甚至還有的恰好落在了谷底,那樣子的得到的y值數(shù)據(jù)十分不恰當(dāng)。所以在實(shí)驗(yàn)進(jìn)程初期個(gè)人就有猜測(cè):當(dāng)把理論體系搬運(yùn)到實(shí)際實(shí)驗(yàn)中時(shí),因?yàn)榉N種理想假設(shè)失效,會(huì)出現(xiàn)一些小誤差。得出這個(gè)結(jié)論以后,我轉(zhuǎn)變了數(shù)據(jù)的采集方法,也開(kāi)始深入研究真實(shí)峰值與理論峰值的偏離與年齡的關(guān)系。
在這個(gè)問(wèn)題中首先要把握住“偏離”這個(gè)詞匯,也由此延伸出兩條不同的道路——分析差值,分析比值。
基礎(chǔ)數(shù)據(jù)中不難發(fā)現(xiàn),在倍頻倍數(shù)增大的同時(shí),理論峰值與真實(shí)峰值橫坐標(biāo)上的差值也在增大??墒沁@個(gè)趨勢(shì)并不意為著什么,分析差值的大小我個(gè)人認(rèn)為不可取。第一、這個(gè)偏離的產(chǎn)生雖然原因不明,但偏離的大小是很可能與基頻取值相關(guān)的,表中可見(jiàn)每年的基頻都有變化,未經(jīng)過(guò)歸一化就去分析相當(dāng)于忽視了基頻取值這一變量,讓基頻不同的年份無(wú)法統(tǒng)一分析。第二、在倍頻被得出的過(guò)程中,牽涉到的變量?jī)H僅有“基頻”與“倍頻是乘以幾”這兩項(xiàng),所以在同一年中基頻固定時(shí),造成這個(gè)偏離的只能是來(lái)源于“真實(shí)乘上去的數(shù)”與“理論上應(yīng)乘上去的數(shù)”不一樣。倍頻是一個(gè)經(jīng)過(guò)乘法(而不是加減)得到的數(shù)據(jù),所以該分析是真實(shí)測(cè)出的倍頻與整數(shù)倍倍頻的比值(而不是差值)。
所以我放棄了對(duì)于數(shù)據(jù)散亂的差值的分析,轉(zhuǎn)入對(duì)于比值的分析。在此部分中,新的問(wèn)題又涌現(xiàn)出來(lái),這也是我至今并未給出確定答案的——如何用幾個(gè)已知的變量去定義這個(gè)偏離?我在嘗試中從三種思路提出了三種效果不同但各有道理的方案:
令基頻=b,諧波次數(shù)=n,真實(shí)頻率=t,abs()為取絕對(duì)值函數(shù),理論頻率=b · n
三個(gè)方案的數(shù)據(jù)意義是不同的。第一個(gè)反應(yīng)的是真實(shí)與理論的差值以真實(shí)頻率值為參考的偏離率;第二個(gè)反應(yīng)的是真實(shí)與理論的差值以理論值為參考的偏離率;第三個(gè)反應(yīng)的則是基頻與倍頻的直接運(yùn)算關(guān)系,即基頻*(h(x)+n)=倍頻。在三者都各自有其不可替代的意義的情況下,我把三種分析方式的結(jié)果都羅列了出來(lái)。另外,為了對(duì)于每一年的總體偏離狀況有一個(gè)總體的了解,我把2-8次諧波的偏離率全部相加,得到了total一欄。此處以“宵”字為例,計(jì)算得三張表格:
年份 | f(x) total | g(x) total | h(x) total |
---|---|---|---|
2019 | 0.037030 | 0.036831 | 0.153925 |
2018 | 0.040015 | 0.040001 | 0.187327 |
2017 | 0.014949 | 0.014903 | 0.061542 |
2016 | 0.035468 | 0.035663 | 0.120753 |
2015 | 0.040381 | 0.040372 | 0.172545 |
2014 | 0.045170 | 0.045437 | 0.204236 |
2013 | 0.051366 | 0.051117 | 0.247460 |
2011 | 0.045015 | 0.045084 | 0.265867 |
1996 | 0.025946 | 0.025933 | 0.108896 |
1992 | 0.019542 | 0.019492 | 0.091860 |
1990 | 0.032161 | 0.032152 | 0.145650 |
1984 | 0.032722 | 0.032963 | 0.132432 |
(注:在求和時(shí)考慮到有些年份觀察不到某些次數(shù)的諧波,所以在計(jì)算時(shí)引入變量k,表示有k個(gè)諧波是觀測(cè)不到的。因?yàn)橛^測(cè)不到諧波并不能夠證明偏離是沒(méi)有的,所以為公平起見(jiàn),total這個(gè)量在通加的基礎(chǔ)上進(jìn)行覆蓋:
total=total·7/(7-k)。)
三者雖然不盡相同,但三個(gè)公式得出的值的大趨勢(shì)是一樣的。根據(jù)數(shù)據(jù)制作的相應(yīng)變化趨勢(shì)圖如下圖所示:
▲ 圖4.1.1 年份與偏離率相關(guān)趨勢(shì)圖
1997-2010年間,因?yàn)槔罟纫徊⑽囱莩?,所以?shù)據(jù)缺失,這是本實(shí)驗(yàn)的一個(gè)遺憾。根據(jù)先前他人的研究,一個(gè)字的發(fā)音方式不同也會(huì)對(duì)于這個(gè)實(shí)驗(yàn)帶來(lái)影響1,并且也不好確定不同歌里面的音調(diào)是否一致,所以缺失年份數(shù)據(jù)很難補(bǔ)充。
回到這三張圖,可以看到他們大趨勢(shì)一致:其偏離率都隨著演唱者年齡的增大而增大。這個(gè)趨勢(shì)作為結(jié)論不夠嚴(yán)謹(jǐn),因?yàn)槿匀荒芸吹侥挲g增大、偏離卻減小的許多例子。本人認(rèn)為這與基音可能有關(guān),此問(wèn)題將在下一部分中解釋。
4.1.2 峰值偏移、基頻頻率與年齡關(guān)系
隨著李谷一年齡的增長(zhǎng),她歌唱的基音是在下降的。比如“忘”字:(為了讓這個(gè)下降表現(xiàn)得更加直觀,它的頻率的數(shù)值統(tǒng)一被減去了385 Hz)。又如“宵”字,仍然是明顯的下降趨勢(shì)。隨著演唱者年齡的增大,她有意或無(wú)意地降低了基音的高度??v觀1984-2019的35年,在兩個(gè)音的演唱中都大約下降了20-25 Hz,不過(guò)仍然還處在半音范圍內(nèi)。
▲ 圖4.1.2 忘與宵基頻下降趨勢(shì)
年紀(jì)增長(zhǎng)時(shí)基頻有所下降并不難理解,相比更有趣的事情是峰值微弱偏離與基頻的存在的一種互動(dòng)。我們把2011-2019年這一段數(shù)據(jù)密集的內(nèi)容單獨(dú)拿出,并把他們n次諧波的x值分別除以n來(lái)反應(yīng)偏移。
▲ 圖4.1.3 反映偏離程度的折線圖
可以看到在2011年時(shí)它的五種顏色的點(diǎn)都很接近,沒(méi)有較大的偏離且基頻教高;2013年,即年齡+2后,幾個(gè)點(diǎn)的偏移略微增大(這與我4.2.1對(duì)于偏離率增大的趨勢(shì)是吻合的),同時(shí)基音下降;2014年基音抬高,讓五個(gè)點(diǎn)的上下浮動(dòng)達(dá)到了一個(gè)峰值,偏離嚴(yán)重;2015年,基音重新降下來(lái)以后這個(gè)浮動(dòng)也有縮?。?016年基音再抬升,偏移達(dá)到最大值;2017基頻下降,偏移縮??;2018年基頻沒(méi)有下降,偏移增大;2019年基頻下降,偏移縮小。
就本圖中的三個(gè)變量:年齡、基音、偏移而言,年齡的增長(zhǎng)是客觀的,偏移來(lái)源于聲帶的條件,唯獨(dú)“基音”是一個(gè)可以隨著演唱者主觀意志而改變的。正是因?yàn)檫@種主觀意志的影響,所以對(duì)于“基音”我們僅把握住一個(gè)大趨勢(shì)即可。同時(shí)我們也發(fā)現(xiàn),在年齡增加的過(guò)程中,每一次基音的抬高都帶來(lái)了偏移程度的擴(kuò)大。做一個(gè)總結(jié),基音的升高與年齡的增長(zhǎng)都會(huì)導(dǎo)致偏移程度的增加,而基音降低可以導(dǎo)致偏移程度降低。
把樣本擴(kuò)大進(jìn)行進(jìn)一步分析。本圖的擴(kuò)大體現(xiàn)在兩方面:年份添加了1984、1990、1992、1996四份數(shù)據(jù),諧波最高次數(shù)從上一張的5次提升到了7次?;l為黑色,而2-7次諧波x值除以各自次數(shù)分別為紅色、綠色、藍(lán)色、淡紫色、黃色、深紫色。
▲ 圖4.1.4 反應(yīng)偏離的折線圖全圖
在這一張圖中,通過(guò)圖像與數(shù)據(jù)可以發(fā)現(xiàn),這組數(shù)據(jù)完全滿足結(jié)論:1.隨著年齡增長(zhǎng),每一次基音的抬高都會(huì)導(dǎo)致偏移程度的增大。2.每一次基音的降低都會(huì)導(dǎo)致偏移程度的縮小。
第一條結(jié)論與第一張小范圍的數(shù)據(jù)分析結(jié)論是一致的,而第二條個(gè)人認(rèn)為是屬于巧合——基音降低使偏移縮小、年齡增加使偏移增加,兩個(gè)作用相反的變化同時(shí)存在,最后恰巧前者的影響力更大一些。
分兩次來(lái)制圖分析是我認(rèn)為有必要的。第一,1984-2010年跨越了26年卻僅有4份數(shù)據(jù),要研究一個(gè)連貫的變化不如2011-2019年的數(shù)據(jù)有效。第二,諧波次數(shù)增加以后數(shù)據(jù)過(guò)于復(fù)雜,直接上手分析會(huì)造成困擾,不過(guò)最后發(fā)現(xiàn)的規(guī)律也得到了驗(yàn)證。
本章承接4.1.1峰值偏移與年齡的初步結(jié)論,觀察到偏移、基頻、年齡三者互動(dòng)關(guān)系的存在,為定量嘗試做了事實(shí)基礎(chǔ)。
4.2 基頻倍頻與峰值偏移與年齡相關(guān)分析
本部分旨在提出基于上文所觀察到明顯規(guī)律的進(jìn)一步探索的方法。
本部分將圍繞“關(guān)聯(lián)函數(shù)”(即兩個(gè)數(shù)組協(xié)方差比上各自標(biāo)準(zhǔn)差的值)展開(kāi)。一般而言,兩個(gè)數(shù)組的關(guān)聯(lián)度如果可以達(dá)到0.9以上,那么就可以認(rèn)為是具有較強(qiáng)關(guān)聯(lián)性的。在初步嘗試中,本人將各年齡的峰值偏移總和作為數(shù)組A,各年齡的基音頻率作為數(shù)組B,經(jīng)計(jì)算得關(guān)聯(lián)函數(shù)等于0.61545。這個(gè)數(shù)據(jù)表明,三個(gè)因素在計(jì)算關(guān)聯(lián)函數(shù)是是必須要同時(shí)考慮到的。
為把“年齡”融入到這個(gè)關(guān)聯(lián)系數(shù)的計(jì)算當(dāng)中,經(jīng)過(guò)思考,我把[峰值偏移+f(相對(duì)年齡)]作為數(shù)組A,各年齡的基音頻率作為數(shù)組B進(jìn)行嘗試。相對(duì)年齡是我在這里使用的年齡計(jì)算方式,即把最早的1984年作為0,1990作為6,1992作為8,以此類推。
現(xiàn)在待確定的是這個(gè)f(x)到底是何種關(guān)系。因?yàn)槊恳淮斡?jì)算關(guān)聯(lián)系數(shù)步驟很復(fù)雜,所以我手動(dòng)計(jì)算不是很切實(shí)際,因?yàn)槲乙幚淼臄?shù)據(jù)量是極大的。鑒此,我用python簡(jiǎn)單地編程了一個(gè)程序來(lái)進(jìn)行計(jì)算。我先假設(shè)它的影響方式是一次的,設(shè)斜率為k,以0.1為步長(zhǎng)從0開(kāi)始增大到100,又以0.1為步長(zhǎng)從0開(kāi)始減小到100。下圖是結(jié)果展示,k>0時(shí)最大值在k=100時(shí)取到0.89左右,并仍然具有緩慢上升的趨勢(shì),可能在0.90左右存在其漸近線。k<0時(shí),最大值在k=-2時(shí)取到,為0.91141。由此,最合理的猜測(cè)是數(shù)組(峰值偏移-2*相對(duì)年齡)與數(shù)組f有關(guān)。
▲ 圖4.2.1 程序輸出結(jié)果
這個(gè)嘗試是初步的,具有很大的發(fā)展空間。
首先,年齡以正比例形式影響偏離量是我的假設(shè),也有可能是有常數(shù)項(xiàng)的一次、二次、三次……在這個(gè)方案中,只需要略微改動(dòng)程序?yàn)殡p層嵌套、三層嵌套也能實(shí)現(xiàn)。其次,年齡是使用相對(duì)年齡還是李谷一本人的年齡有待考量。這兩種算法的結(jié)果是不一樣的,但這很可能牽涉到生物領(lǐng)域,要了解聲帶老化過(guò)程的起始點(diǎn)等等復(fù)雜因素。
希望本嘗試對(duì)于峰值偏移、年齡、基頻之間定量關(guān)系的探索有一定意義。
4.3 倍頻相對(duì)峰值偏移與年齡原因探索
先從基音隨年齡增長(zhǎng)而下降的趨勢(shì)說(shuō)起,因?yàn)樵诖颂幱?jì)算還不涉及到倍頻峰值偏移的問(wèn)題,所以用較理想的公式進(jìn)行計(jì)算。整理一下現(xiàn)有公式:u=λ•f;F=k•f;另外是波在弦中的速度u=根號(hào)下T/ρ,其中T 為張力,ρ為線密度。
最后得到的式子,拋開(kāi)定量L與ρ,本質(zhì)是基頻與k、Δx二者變化的關(guān)系。粗淺來(lái)講,隨著一個(gè)人年齡增長(zhǎng)的聲帶肌肉老化松弛,這個(gè)系數(shù)k會(huì)降低,從而也在Δ降不發(fā)生改變的情況下使基頻f0下降,這也就能成功解釋在4.1.2開(kāi)頭提到的現(xiàn)象了。
當(dāng)然,也很明顯這個(gè)下降是可以有意識(shí)地人為避免的,如果演唱者想要在年齡增大以后仍然保持基頻在同一高度,如果仍然對(duì)其施加一樣的力的話,T一定那么k下降則Δ降增大,結(jié)果是分子不變,分母變大,基音下降。想要使f0保持穩(wěn)定的關(guān)鍵是在于保持下式不變:
可見(jiàn)為使基頻穩(wěn)定,T隨k的減小應(yīng)當(dāng)減小,但這個(gè)減小的程度便涉及到這個(gè)復(fù)雜的函數(shù)了。所以本部分得出結(jié)論:由于肌肉的老化導(dǎo)致的松弛,使k減小從而導(dǎo)致基頻下降。演唱者通過(guò)有意識(shí)地抬高基頻可以緩解,并且在這個(gè)抬高的過(guò)程中肌肉拉力T會(huì)減小。
4.4 倍頻值歲年齡變化
上一部分是對(duì)于峰值x值的研究,而此板塊則是對(duì)于分析y值數(shù)據(jù)的嘗試。
初始數(shù)據(jù)因?yàn)橐粼错懚?、雜音等問(wèn)題雜亂無(wú)章,所以第一步要進(jìn)行歸一化。把每份音頻中基頻的y值定為1,那么其余峰值的y值也得相應(yīng)地縮小,匯入下表以后得到的便是比較有意義的數(shù)據(jù)(數(shù)據(jù)見(jiàn)附錄)。
把它們制圖后得到:
▲ 圖4.4.1 諧波值與基頻比值
▲ 圖4.4.2 歸一化后的y值
最明顯的現(xiàn)象是二次諧波、三次諧波的突出。如果把各年數(shù)據(jù)進(jìn)行累加則同時(shí)能在二次、三次諧波上面發(fā)現(xiàn)這一點(diǎn)。另外,把各個(gè)年份的同次諧波的y值進(jìn)行累加,也可以看到在其宵字中在七次諧波的一個(gè)略微上浮。
▲ / 各年份諧波折線圖
結(jié)合年齡來(lái)看,隨著李谷一年齡的增大,“宵”字同年各次諧波歸一化后y值之和隨著年齡增大而減小(如表所示),而“忘”字?jǐn)?shù)據(jù)則混亂不堪沒(méi)有規(guī)律,趨勢(shì)線為水平。結(jié)合上一章的分析,我認(rèn)為導(dǎo)致此結(jié)果的原因可能是李谷一隨著年齡上升,基頻各峰值趨于分散所致。正是這種分散,在我只采取最高峰值的數(shù)據(jù)收集方法下,很難觀察到隨年齡變化的結(jié)論。這一部分的分析是不成功的。
05 結(jié)論與展望
5.1 結(jié)論
這里我按照數(shù)據(jù)分析各板塊的順序來(lái)進(jìn)行結(jié)論的總結(jié)。
首先是在4.1.1中,通過(guò)不同的定量方式來(lái)考察“宵”字12份樣本中每一次峰值橫坐標(biāo)與理論的偏離程度,并發(fā)現(xiàn)隨著年齡上升,偏離率在三種定量方式中都處于上升的趨勢(shì)之中。隨后在4.1.2進(jìn)一步分析,加入基音頻率作為第三個(gè)變量分析,發(fā)現(xiàn)基音的上升和年齡的上升共同會(huì)導(dǎo)致偏離程度的加劇。此兩章論證了年齡增長(zhǎng)會(huì)導(dǎo)致這個(gè)偏離變大,但同時(shí)降低基頻可以一定程度上掩蓋此問(wèn)題。
4.1.3是一個(gè)對(duì)上文三變量定量情況的討論,目前得出最合理的說(shuō)法是:數(shù)組(峰值偏移-2*相對(duì)年齡)與基頻關(guān)聯(lián)度最大。這個(gè)嘗試具有可拓展性,也或許可以為定量表示聲帶衰老程度提供提示。
最后,在4.2中,我對(duì)于每一次峰值的y值進(jìn)行分析,發(fā)現(xiàn)二次、三次諧波顯著含能量更大。因?yàn)閿?shù)據(jù)采集方式問(wèn)題導(dǎo)致此板塊無(wú)法深入分析。如果可以在進(jìn)一步研究中把圖像圍成的面積作為新的y值標(biāo)準(zhǔn),或許會(huì)有新的突破。
5.2 展望
一方面,這個(gè)項(xiàng)目本身可以被進(jìn)一步優(yōu)化。
因?yàn)榍昂蟠隧?xiàng)目并前后用時(shí)也未超過(guò)一年,我是很難做到自己來(lái)做實(shí)驗(yàn)樣本的。所以就只能在網(wǎng)上去獲得實(shí)驗(yàn)樣本?!峨y忘今宵》作為一個(gè)跨度非常大而且還是同一位演唱者的一份數(shù)據(jù)在我看來(lái)已經(jīng)是非常好的突破口了。然而它也存在著伴奏音樂(lè)、背景噪聲、多次錄制使音頻質(zhì)量下降(它錄一次,我再錄一次)等等問(wèn)題。如果能把這個(gè)項(xiàng)目作為一個(gè)長(zhǎng)期項(xiàng)目(至少……四五年)的話,一定會(huì)是對(duì)于實(shí)驗(yàn)的一個(gè)重要優(yōu)化。
我的對(duì)于這個(gè)課題所涉及的領(lǐng)域的了解還需要加深。舉一個(gè)例子,我在確定諧波峰值(見(jiàn)3.2.4)時(shí)最終統(tǒng)一采取了最高峰峰值,雖然成功避免了數(shù)據(jù)的混亂,但這樣子是不夠嚴(yán)謹(jǐn)?shù)?。我想可能是因?yàn)槲覍?duì)于諧波的認(rèn)知不夠到位所以才找不到一個(gè)更好的方法。
其實(shí)做這個(gè)項(xiàng)目的過(guò)程也是一個(gè)我自己去摸索去提高的過(guò)程,在我的認(rèn)知不斷地被新知更新的時(shí)候,許多原先做的老數(shù)據(jù)就會(huì)暴露出問(wèn)題。我不斷地回過(guò)頭去刷新老數(shù)據(jù)實(shí)際上花了挺多時(shí)間。如果時(shí)間允許,我希望可以再多挑幾個(gè)字出來(lái)進(jìn)行研究來(lái)把這個(gè)數(shù)據(jù)量進(jìn)一步擴(kuò)大。相信那樣能讓我發(fā)現(xiàn)更多。
另一方面,這個(gè)項(xiàng)目在幾個(gè)點(diǎn)上可以被進(jìn)一步拓展:
此處引入的僅僅是“年齡”這個(gè)單一變量,那么性別呢?是否經(jīng)過(guò)訓(xùn)練呢?歌唱技巧呢?……更多的變量在一個(gè)全新的課題里是可以被拓展進(jìn)去的。
可觀測(cè)到的最高諧波次數(shù)到底與什么有關(guān)?這個(gè)問(wèn)題在調(diào)查過(guò)程中就已經(jīng)引起了我的好奇了,為什么我第一波樣本里一般只能最高到達(dá)三次、四次,而第二波里卻能達(dá)到八次、九次?是時(shí)長(zhǎng)問(wèn)題,還是強(qiáng)度問(wèn)題,還是發(fā)音口型問(wèn)題呢?
是否能將我的結(jié)論與生物板塊進(jìn)行更多的結(jié)合,而不要只是停留在發(fā)聲器官老化這一層上?(當(dāng)然我可以預(yù)想到,這個(gè)結(jié)合是對(duì)現(xiàn)在的我還是有一定技術(shù)困難的。)
聲帶老化在生物領(lǐng)域中更多是現(xiàn)象性的,如果本研究足夠成熟,本人認(rèn)為有可能可以作為定量聲帶衰老程度的一種方式。
音發(fā)聲研究[D]. 博士學(xué)位論文,北京大學(xué),2010 [2]覃折波,何蕓,馮玉潔,郭燕麗,華興. 正常成人聲帶區(qū)解剖結(jié)構(gòu)的超聲成像[J]. 臨床超聲醫(yī)學(xué)雜志 2017,19(1):14-17 [3]鈴木徹. 聲帶肌的衰老變化[J]. 日本耳科會(huì)報(bào)1982,85(11):1469 [4]張雪源. 面向音頻檢索的音頻特征分析方法研究[D]. 博士學(xué)位論文,華南理工大學(xué),2015 [5]黃天乾,謝志文. 鋼琴幅度譜的七、九次諧波對(duì)鋼琴音質(zhì)影響的研究[J]. 電聲基礎(chǔ) 2005,4:4-7 [6]楊婧. 基于諧波結(jié)構(gòu)的樂(lè)器音色提取方法研究[D]. 碩士學(xué)位論文,哈爾比工業(yè)大學(xué),2018