公務(wù)員期刊網(wǎng) 論文中心 正文

分形理論下時間序列音樂識別探析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了分形理論下時間序列音樂識別探析范文,希望能給你帶來靈感和參考,敬請閱讀。

分形理論下時間序列音樂識別探析

摘要:將分形理論時間序列(混沌序)運用與音樂信號識別,為音樂領(lǐng)域的智能發(fā)展提供實驗依據(jù).首先對分形理論進行質(zhì)性分析,并且提出關(guān)聯(lián)維數(shù)算法,判斷音樂分形程度.接著提出音樂中混沌現(xiàn)象的特征.最后進行實際音樂的實驗分析,以鋼琴曲目《致愛麗絲》、流行音樂《Disco-theque》和哀樂為例,對3種曲目進行材料性質(zhì)分析,分析不同曲目的Lyapunov指數(shù)(判斷時間序列)和關(guān)聯(lián)維數(shù)(判斷分形程度).結(jié)果表明:3種曲目在不同階數(shù)下的關(guān)聯(lián)維數(shù)基本沒有改變,說明不同曲目信號內(nèi)的分形程度具有穩(wěn)定性.

關(guān)鍵詞:分形理論;時間序列;音樂;Lyapunov指數(shù);關(guān)聯(lián)維數(shù)

音樂存在于人們生活中的各個地方,人們可以用音樂表達內(nèi)心的情感,同時也可以用音樂進行人與人之間的溝通交流[1].音樂以及其它語言類學科,都屬于具有顯著代表性的認知模式.隨著科學技術(shù)的發(fā)展,對于音樂的研究不僅僅局限于對音樂的欣賞和分類,更多則是傾向與音樂信號的識別,當前關(guān)于音樂信號識別的研究包括很多方向,如音樂搜索查詢、音樂生理學和自動生成曲目等[2].音樂信號的識別不僅可以運用于心理學和生理學[3],也可以運用于音樂數(shù)據(jù)庫的搜索查詢以及自動作曲.互聯(lián)網(wǎng)信息時代的飛速發(fā)展,音樂信號的信息量非常大,音樂的搜索和數(shù)據(jù)信息的分類非常復(fù)雜且困難,要對音樂搜索系統(tǒng)進行智能化升級和高效管理,就需要對音樂信號的特征進行研究,從而對音樂進行正確的分類[4].當前比較通用的歌曲檢索方式就是在網(wǎng)站內(nèi)輸入歌曲的名字或者歌詞的內(nèi)容,但是在實際情況中,人們總是會忘記歌曲的名字或者歌詞,但是不會忘記曲目的旋律,因此在該種情形下就要對自己能哼出的音樂旋律進行特征分析,從而得到信號特征進而在系統(tǒng)庫內(nèi)進行目標匹配.基于此,本研究基于分形理論和混沌特性,分析不同音樂曲目的Lyapunov指數(shù)和關(guān)聯(lián)維數(shù),從而判斷不同音樂信號的時間序列特征和分形程度,為音樂信號識別的智能化發(fā)展提供現(xiàn)實依據(jù).

1分形理論

1.1分形理論的質(zhì)性分析

分形指的是在規(guī)定的意義下部分與整體自相似的部分[5].而在相關(guān)文獻中定義“分形”屬于M維空間內(nèi)的某個點集的集合,在不一樣的方向上含有自相似性,而且含有一個不完整位數(shù)(小于M)[6].也有學者表明“自相似性”跟“分形”的結(jié)構(gòu)相似,指的是整體同部分的相似之處,在直觀方向存在一種構(gòu)造圖,前后2部分僅僅是標度不一樣,其余部分的構(gòu)造方式都相同.觀察的部位不管是近處還是遠處,得到的結(jié)果都一致,學者們就把這種圖稱作含有自相似的框架.如果在改變圖形的尺寸過程中,其余部分的結(jié)構(gòu)并沒有改變,此時該圖形就叫做分形[7].整體上來說,分形的特性包含3個部分:部分和整體具有相似特質(zhì)、構(gòu)造細致和非整數(shù)性(關(guān)聯(lián)維數(shù)).音樂則可以在空間序列上產(chǎn)生整體同部分的自相似性,而且逐漸地發(fā)展成為細致精確的結(jié)構(gòu),該種含有自相似性構(gòu)造的現(xiàn)象就叫音樂分形.關(guān)聯(lián)維數(shù)算法把一維序列中的數(shù)據(jù)組合成為相空間內(nèi)的n維向量a=(a1,a2,…,An),把向量往后挪動h(h為整數(shù)而且是取樣間隔),從而形成n維空間內(nèi)的不同向量a'=(a1,a2,…,An+h)[8].根據(jù)穩(wěn)定的間隔h向右依次挪動就能夠獲得相空間內(nèi)的點集合{ax}x=1,2,…,K,而集合內(nèi)點的個數(shù)可以由K=k-h(huán)+1計算得來.于點集合內(nèi)隨機取一個點當作參考點,以這個點為中心畫圓(半徑為r),再統(tǒng)計該圓內(nèi)除了中心點以外點集合內(nèi)的其他點數(shù),從而獲得關(guān)聯(lián)函數(shù)F,如下式所示:F=1K2∑x≠yGr-Ax-A()y.(1)其中G代表Heaviside函數(shù).如果K趨近于無窮大,那么關(guān)聯(lián)函數(shù)W是集合內(nèi)點間距離的概率函數(shù),設(shè)此時吸引子伸展量的最大值為D,此時W的表示公式為:W=r()DL2(n,r),r≤D.(2)其中,L2(n,r)屬于根n和r相關(guān)的常數(shù),L2屬于關(guān)聯(lián)函數(shù)曲線的斜率.如果r1和r2之間的相對距離非常小,則L2(n,r)的計算方法如下式所示:L2(n,r)=dlnDdlnr.(3)其中,d為吸引子中的伸展量,如果r非常小,就可以計算出關(guān)聯(lián)維數(shù).若曲線的斜率隨著嵌入維數(shù)的增大而增大,則說明沒有分形的特征.如果曲線的斜率隨著嵌入維數(shù)的增加而慢慢形成一個穩(wěn)定值,則表明含有分形的特征.時間延遲h的規(guī)定條件有2個:一個是與數(shù)據(jù)采集時間間隔成倍數(shù)關(guān)系;另一個是取值要適當,過小會導(dǎo)致獲取信息會很困難,過大會導(dǎo)致測量存在較大誤差,根據(jù)相關(guān)文獻,h的取值在接近15時,獲得的關(guān)聯(lián)維數(shù)最合適.

1.2音樂中混沌現(xiàn)象的特征

音樂屬于非線性動態(tài)系統(tǒng)[9],其非線性動態(tài)特性內(nèi)部存在著一定的深層次規(guī)律,對其內(nèi)部規(guī)律進行研究可以分成2種序列:時間序列和空間序列.在時間序列上,音樂表現(xiàn)出的形式是由有序慢慢轉(zhuǎn)變成無序,由有序轉(zhuǎn)變成無序的運動序列叫做混沌序[10].關(guān)于音樂的非線性解釋,一般都是音樂線條的非旋律化,而分形理論的核心特征是:無序性、不平衡性以及不確定性.在創(chuàng)作音樂作品時,多種音樂現(xiàn)象能組成某種確定的比例關(guān)系,如果把某個主題當作作品的起始條件,那么在時間序列以及空間序列軌跡上都會產(chǎn)生一定程度的改變,比如:某段旋律不斷重復(fù)、逆行和倒影等,接著以特定比例進行擴大和縮小,這些音樂現(xiàn)象都包括在音樂線性過程內(nèi).音樂的存在形式很多,包括音樂的基本屬性、音樂的一般變現(xiàn)方式、音樂的制作以及演奏,這些都有著復(fù)雜的時間序列和空間序列,其時空痕跡的擴散也非常復(fù)雜.所以,利用非線性的思維和方式進行音樂的特性分析,能夠反應(yīng)音樂最本質(zhì)的特征[11].時間序列(混沌序)的特征包括:1)邊界性混沌含有吸引域,它的活動范圍一般情況下都是特定的,且不會因為混沌內(nèi)部結(jié)構(gòu)的改變而改變.2)普遍性不同的非線性系統(tǒng)內(nèi),混沌序都會含有相同的特質(zhì),而且不會因為外界環(huán)境的的改變而改變,這就是混沌的基本屬性.3)分形維度在同一個空間里的混沌序,其運動軌跡的重合可以表示成分形維度,該分形維度能夠分為數(shù)個種類,本文使用的分形維度是關(guān)聯(lián)維數(shù)[12].4)量化特質(zhì)對于混沌序,能夠運用Lyapunov指數(shù)[13]研究其穩(wěn)定性,如果該指數(shù)比零大,就表明該混沌序不穩(wěn)定,運動軌跡會根據(jù)指數(shù)產(chǎn)生分離.該指數(shù)的絕對值可以表明序列的混沌程度,距離靠近的點之間,點內(nèi)部的信息丟失量會因為該指數(shù)絕對值的增大而提高,序列或者系統(tǒng)的混沌特性就能夠易于被發(fā)現(xiàn).

2音樂分形實驗及分析

2.1實驗準備

1)實驗設(shè)備本研究運用Matlab構(gòu)建一個快速數(shù)字化樂音仿真模型,該模型基于1組正弦波,經(jīng)過音色修飾后合成音樂進行播放,其中音色修飾分為音強隨時間的自然衰減包絡(luò)和各諧波成分的能量分配兩個部分.運用格式工廠把將MP3格式的音頻轉(zhuǎn)換成Matlab可以直接讀取的WAV格式,同時利用其截取的功能對音樂片段進行時長截?。?)音樂材料選擇3種不同類型的音樂進行分析,分別是鋼琴曲、流行樂和哀樂,如下表1所示:3)音樂信號提取第1,運用格式工廠把MP3格式的音樂轉(zhuǎn)換成WAV格式,接著進行小節(jié)劃分和A/D轉(zhuǎn)換.第2,分析混沌特性,根據(jù)Lyapunov指數(shù)的大小判斷信號是不是含有混沌特性,也就是時間序列.第3,基于關(guān)聯(lián)維數(shù)算法判斷關(guān)聯(lián)維數(shù),從而分析音樂分形的復(fù)雜程度.

2.2音樂信號劃分本研究選擇

3首不同的音樂信號進行劃分,結(jié)果如圖1所示.由圖1可以看出,鋼琴曲《致愛麗絲》的總時長是190s,分成106個小節(jié),每節(jié)1.79s.流行音樂《Discotheque》的總時長是74s,分成35個小節(jié),每節(jié)2.11s.哀樂的總時長是70s,分成32個小節(jié),每節(jié)2.19s.

2.3混沌特性和分形程度分析結(jié)果

首先,對鋼琴曲《致愛麗絲》的混沌特性和分形程度進行分析,結(jié)果如圖2所示.由圖2可以看出,鋼琴曲《致愛麗絲》的Lya-punov指數(shù)上下浮動區(qū)間是在[0.02,0.25]之間,而關(guān)聯(lián)維數(shù)在[13,17.8]之間.經(jīng)典鋼琴曲的維數(shù)起伏非常顯著,表明其分形程度比較強烈.鋼琴曲的創(chuàng)作難度非常大,同時其創(chuàng)作的過程非常繁瑣,這就表示作曲家的能力要很強,特別是針對是經(jīng)典的鋼琴曲.其次,對《Discotheque》的混沌特性和分形程度進行分析,結(jié)果如圖3所示.由圖3可以看出,《Discotheque》的Lyapunov指數(shù)上下浮動區(qū)間是在[0.006,0.0081]之間,而關(guān)聯(lián)維數(shù)在[9.901,15.001]之間.《Discotheque》屬于流行曲風,其創(chuàng)作過程相對來說比較簡單,但是該曲種的節(jié)拍非常強烈,也由非常強的動感,在演奏時音符的改變會充滿了隨機性,這就導(dǎo)致《Discotheque》的關(guān)聯(lián)維數(shù)改變不及鋼琴曲顯著.最后,對哀樂的混沌特性和分形程度進行分析,結(jié)果如圖4所示.由圖4可以看出,哀樂的Lyapunov指數(shù)上下浮動區(qū)間是在[0.052,0.159]之間,而關(guān)聯(lián)維數(shù)在[9.997,16.987]之間.哀樂一般是表示對逝者的思念和沉痛心情,其節(jié)奏的改變都是在相應(yīng)的范圍之內(nèi),主題的表達非常簡單,主要就是為哀痛和不舍,所以哀樂的關(guān)聯(lián)維數(shù)改變程度最低.

2.4不同差分后的關(guān)聯(lián)維數(shù)

為了保證關(guān)聯(lián)維數(shù)的穩(wěn)定性,對3種曲目的音樂信號進行差分求解,結(jié)果如圖5所示.由圖5可以看出,在進行不同階數(shù)的差分以后,不同曲目信號的關(guān)聯(lián)維數(shù)都在不同階數(shù)下的波動非常微弱,因為試驗過程存在一定的誤差,因此可以認為,不同階數(shù)下關(guān)聯(lián)維數(shù)基本沒有改變,說明不同曲目信號內(nèi)的分形程度具有穩(wěn)定性.

3結(jié)語

本研究為了對不同性質(zhì)的曲目音樂分形的復(fù)雜程度進行分析,通過對鋼琴曲、流行樂和哀樂進行音樂信號分析,根據(jù)Lyapunov指數(shù)的大小判斷信號是不是含有混沌特性(時間序列),并根據(jù)關(guān)聯(lián)維數(shù)算法判斷關(guān)聯(lián)維數(shù),從而分析音樂分形的復(fù)雜程度.從結(jié)果來看,鋼琴曲的分形程度最高,流行樂次之,哀樂的分形程度最低,而不同曲目內(nèi)的信號分形程度具有穩(wěn)定性.本研究也存在一定的不足之處,選擇曲目的種類比較少,這會對文章結(jié)果的普適性產(chǎn)生一定的影響,這也是文章下一步研究需要改進的地方.

作者:高莉 單位:湖北仙桃職業(yè)學院教育學院

精選范文推薦