公務(wù)員期刊網(wǎng) 論文中心 正文

探究信息的影響和未來研究方向

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了探究信息的影響和未來研究方向范文,希望能給你帶來靈感和參考,敬請閱讀。

探究信息的影響和未來研究方向

1基于傳播過程的模型

任一用戶發(fā)表一條博文,只有其粉絲可以看到,用戶的粉絲看到后,可能會(huì)評論,或者轉(zhuǎn)發(fā),或者發(fā)表與該信息話題相關(guān)的博文,那用戶的粉絲的粉絲就能有機(jī)會(huì)閱讀或者繼續(xù)傳播該條博文。如果原始博主的粉絲對其信息不感興趣,而沒有做出傳播的行為,則該條信息就會(huì)被逐漸忽略。最早,對于傳播動(dòng)力學(xué)的分析是從傳染病模型開始的。在典型的傳染病模型中,主要是將人群中的個(gè)體分成三類,每一類處于一個(gè)典型狀態(tài)。其基本狀態(tài)包括:S(susceptible)--易染狀態(tài)(通常為健康狀態(tài));I(infected)--感染狀態(tài);R(removed)--被移除狀態(tài)(也成為免疫狀態(tài)或恢復(fù)狀態(tài))。研究中主要用到的模型有SI、SIS、SIR以及SIRS,模型中,狀態(tài)為S的個(gè)體會(huì)以概率β感染到該疾病,狀態(tài)為I的個(gè)體會(huì)以概率γ恢復(fù)。在SIS模型中,那些恢復(fù)后的個(gè)體會(huì)自動(dòng)又變成易感染狀態(tài),在SIR模型中,個(gè)體會(huì)保持在恢復(fù)狀態(tài),而在SIRS模型中,個(gè)體會(huì)在恢復(fù)之后又以概率α變成易感染狀態(tài)。這種模型主要是側(cè)重于傳播過程的動(dòng)力學(xué)和個(gè)體在這幾個(gè)狀態(tài)之間的重新分配。通常使用微分方程來表示這幾個(gè)狀態(tài)的個(gè)體數(shù)量的變化。例如在SIR模型中,用下面的方程式來構(gòu)建模型:=-,=-,=dstditdrtitstitstititdtdtdt其中s(t),i(t)和r(t)是這三個(gè)狀態(tài)在每一時(shí)刻所占的比例,且s(t)+i(t)+r(t)=1。這種模型通常只是對信息傳播規(guī)則的建模,而沒有考慮傳播網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對傳播行為的影響。隨后一些研究分析了在不同類型的網(wǎng)絡(luò)上,傳染病模型所表現(xiàn)出的不同的狀態(tài)。Moreno等人發(fā)展了Daley等人在1964年提出的謠言傳播模型。該模型基于SIR模型將人們分為Ignorants(沒有聽過謠言的人,類似于Susceptible)、Spreaders(謠言傳播者)和Stiflers(聽到謠言但并不傳播謠言的人)三種類型。上述的傳染病傳播與與信息在中的傳播類似。一條博文首先要傳播給博文作者的直接粉絲,一部分粉絲會(huì)轉(zhuǎn)發(fā)該博文并變成轉(zhuǎn)發(fā)者,隨后影響他們的粉絲,這些轉(zhuǎn)發(fā)者在隨后看到該博文時(shí),可能會(huì)再次轉(zhuǎn)發(fā),也可能不再理會(huì)。列舉的幾種傳染病模型與信息傳播特征的類比,進(jìn)一步說明了信息傳播與傳染病傳播機(jī)制相一致。Liu等人參考SIR傳播模型,使用NetLogo構(gòu)造了一個(gè)基于主體的模型。模型中,將用戶分成三類:傳播者,未知者和不受影響者,并使用用戶出入度的比例代表其的影響力,同時(shí)考慮了類似Twitter的網(wǎng)絡(luò)結(jié)構(gòu)的無標(biāo)度性,信息傳播的特性以及謠言的最大傳播時(shí)間。許曉東根據(jù)社區(qū)信息傳播網(wǎng)的特性,使用SIR病毒傳染模型刻畫謠言傳播過程,并借助計(jì)算機(jī)仿真研究傳染率和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對謠言傳播規(guī)模的影響,發(fā)現(xiàn)降低有效傳播率和減小網(wǎng)絡(luò)度分布熵有利于縮小謠言傳播規(guī)模。Wang等人提出那些沒有關(guān)注轉(zhuǎn)發(fā)者(Retweetingusers)的用戶(Externalusers)也會(huì)有可能轉(zhuǎn)發(fā)信息,以及轉(zhuǎn)發(fā)者會(huì)多次地轉(zhuǎn)發(fā)相同的信息,并以SIS模型表示的傳播為基礎(chǔ),添加了這兩種轉(zhuǎn)發(fā)行為,來描述信息參與者的動(dòng)態(tài)變化。其他研究者沒有直接采用經(jīng)典的傳染病模型,而是根據(jù)具體的信息的傳播過程及特征來構(gòu)建傳播模型。Xiong等人將Twitter網(wǎng)絡(luò)中的用戶按對信息的接受程度劃分為四種類型(Susceptible、Infected、Contacted、Refractory),并提出SCIR模型,探討了模型仿真過程中隨著傳播速率改變的整個(gè)模型網(wǎng)絡(luò)的動(dòng)態(tài)變化。Wu等人根據(jù)中用戶發(fā)表、瀏覽、回復(fù)和轉(zhuǎn)發(fā)博文的基本行為,將的信息交流分成信息、信息接收、信息加工、信息傳播四個(gè)階段,并考慮信息丟失(被用戶忽略的信息熵),提出競爭窗口模型,描述了信息的動(dòng)態(tài)傳播。上述的基于傳播過程的模型,只是描述了網(wǎng)絡(luò)中用戶對信息的接受狀態(tài),以及信息傳播的動(dòng)態(tài)變化,但卻沒有考慮用戶之間的個(gè)體差異和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對信息傳播的影響。

2經(jīng)典影響力模型

模型從一組初始的活躍節(jié)點(diǎn)開始,沿著離散的時(shí)間軸以同步的方式不斷地將其他節(jié)點(diǎn)轉(zhuǎn)換為活躍態(tài)。線性閾值模型(LinearThresholdModel)在LT模型中,在時(shí)間t每一個(gè)節(jié)點(diǎn)v都有一個(gè)激活閾值,v所有的處于活躍態(tài)的鄰居節(jié)點(diǎn)都來嘗試激活v,如果所有鄰居活躍節(jié)點(diǎn)的影響度之和超過了v的激活閾值,則v在時(shí)間t+1轉(zhuǎn)換為活躍態(tài)。且節(jié)點(diǎn)v的活躍鄰居節(jié)點(diǎn)可以多次參與激活v。獨(dú)立級聯(lián)模型(IndependentCascadeModel)在IC模型中,在時(shí)間t處于活躍態(tài)的節(jié)點(diǎn)u可以獨(dú)立地以概率u,vp激活處于非活躍態(tài)的鄰居節(jié)點(diǎn)v,如果v被成功激活,則在時(shí)間t+1,轉(zhuǎn)換為活躍態(tài)。且不管u在時(shí)間t是否激活v,在后續(xù)的時(shí)間中,u不再激活v。由于這兩種模型都是基于離散的時(shí)間軸上以同步方式模擬傳播過程,并不符合真實(shí)的社會(huì)網(wǎng)絡(luò)的傳播方式。Gruhl等人[33]對IC模型進(jìn)行了改進(jìn),通過給出一種計(jì)算節(jié)點(diǎn)間閱讀概率和復(fù)制概率的算法,給每條邊賦予一個(gè)傳播行為發(fā)生概率,使IC模型能夠適用于傳播可能發(fā)生延遲的環(huán)境。在此基礎(chǔ)上,Saito等人[34]考慮傳播中連續(xù)時(shí)間延遲的影響,進(jìn)一步提出了CTIC(ContinuousTimeDelayIndependentCascade)和CTLT(ContinuousTimeDelayLinearThreshold)。為了使模型更能適應(yīng)真實(shí)社會(huì)網(wǎng)絡(luò),Saito[35]考慮傳播的異步性將IC和LT模型擴(kuò)展成AsIC和AsLT模型,模型中使用一個(gè)連續(xù)的時(shí)間軸,并為圖中的每條邊添加時(shí)間延遲的參數(shù)。冀進(jìn)朝等人[36]基于節(jié)點(diǎn)間影響不僅存在著衰減,也存在著加強(qiáng)和維持原狀的思想,在IC模型的基礎(chǔ)上提出完全級聯(lián)傳播模型。

3基于用戶影響力的模型

例如權(quán)威的用戶或處在中心位置的用戶都會(huì)產(chǎn)生較大的影響力,促進(jìn)信息的傳播。有研究者就從用戶對信息的影響力排名來預(yù)測信息的傳播趨勢。Yang等人[40]基于對Twitter網(wǎng)絡(luò)中的用戶行為的大量實(shí)證研究提出了一種通過對節(jié)點(diǎn)影響力的評估從而預(yù)測信息傳播趨勢的LI模型(LinearInfluenceModel),證明了該模型可以非常準(zhǔn)確地評估出節(jié)點(diǎn)的影響力并且能可靠地預(yù)測出信息在短時(shí)間內(nèi)的傳播范圍。張闖等人將網(wǎng)絡(luò)中節(jié)點(diǎn)屬性分成靜態(tài)和動(dòng)態(tài),并提出預(yù)測目標(biāo)的節(jié)點(diǎn)影響力,在此基礎(chǔ)上提出一種基于節(jié)點(diǎn)屬性進(jìn)行信息預(yù)測的屬性、節(jié)點(diǎn)數(shù)、傾向(ANV)模型。實(shí)驗(yàn)采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法,通過新浪數(shù)據(jù)預(yù)測電影票房,結(jié)果表明帶有節(jié)點(diǎn)屬性的方法比沒有節(jié)點(diǎn)屬性的方法的擬合和預(yù)測更為準(zhǔn)確。Ho等人[42]提出中兩種傳播關(guān)系,Rigid-propagation關(guān)系和Loose-propagation關(guān)系,并分別以這兩種傳播關(guān)系構(gòu)建兩種影響力樹,其中UBI(上限影響力樹)的邊代表一個(gè)從父節(jié)點(diǎn)指向子節(jié)點(diǎn)的Rigid-propagation關(guān)系,LBI(下限影響力樹)的邊代表一個(gè)從父節(jié)點(diǎn)指向子節(jié)點(diǎn)的Loose-propagation關(guān)系。然后使用這兩種類型的影響力樹模擬的信息傳播。

4未來研究方向

由于具有自己的新特征,其研究角度和方法都有待改進(jìn),未來的研究可以考慮以下幾個(gè)方向。目前絕大部分的信息傳播分析都是以靜態(tài)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ)的,但是在現(xiàn)實(shí)的中,用戶之間的關(guān)系網(wǎng)絡(luò)是隨時(shí)間動(dòng)態(tài)變化的。下一步的工作需要將網(wǎng)絡(luò)的動(dòng)態(tài)變化特征添加到信息傳播模型中,研究其演化規(guī)律。網(wǎng)絡(luò)中,由于現(xiàn)實(shí)的社會(huì)關(guān)系,共同的地理屬性以及相同的興趣愛好,用戶會(huì)自發(fā)地形成不同的社區(qū)。大部分的信息傳播都是在社區(qū)結(jié)構(gòu)內(nèi),因此傳播路徑都相對較短。目前有些信息傳播模型都是在整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)上定義,而忽略了社區(qū)結(jié)構(gòu)對信息傳播的影響。社區(qū)中用戶的關(guān)系比較緊密,而社區(qū)間聯(lián)系比較稀疏,通常連接各個(gè)社區(qū)的用戶是各社區(qū)通信的橋梁。結(jié)合社會(huì)網(wǎng)絡(luò)分析方法,研究網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),并分析信息在社區(qū)中及社區(qū)間的傳播規(guī)律是一個(gè)重要的研究領(lǐng)域。在分析博文內(nèi)容時(shí),需要注意由于博文的內(nèi)容簡短,口語化,較碎片化,就會(huì)導(dǎo)致對一條博文的主題難以準(zhǔn)確把握。所以在分析博文內(nèi)容特征時(shí),為了提高精確度,不但需要研究更準(zhǔn)確的特征關(guān)鍵字提取方法,而且要結(jié)合上下文情境來分析,這些上下文包括該條博文前后的博文、粉絲的評論等。信息的傳播體現(xiàn)在網(wǎng)絡(luò)中處在各個(gè)時(shí)間段的結(jié)點(diǎn)對信息接受狀態(tài)的變化,Zeng等人將話題的狀態(tài)描述成“不被關(guān)注”、“出現(xiàn)”、“增長”和“衰減”四個(gè)階段,通過網(wǎng)站結(jié)點(diǎn)對話題的不同接受行為分析話題在各個(gè)狀態(tài)之間的轉(zhuǎn)變,進(jìn)而描述話題在Internet中的動(dòng)態(tài)傳播。這類未采用經(jīng)典傳播模型的研究方法也可以具體應(yīng)用到網(wǎng)絡(luò)中,通過用戶對博文的關(guān)注轉(zhuǎn)發(fā)程度和概率,描述博文的動(dòng)態(tài)傳播過程?;谟绊懥Φ男畔鞑ツP椭?,大部分的參數(shù)都是根據(jù)經(jīng)驗(yàn)取值,并沒有通過真實(shí)的傳播數(shù)據(jù)統(tǒng)計(jì)獲取,這樣勢必會(huì)影響模型的準(zhǔn)確性,而不能很好地預(yù)測信息傳播的趨勢。所以在未來的研究中,獲取精確的數(shù)據(jù)來訓(xùn)練模型參數(shù)是構(gòu)建傳播模型的重要方面。

作者:王晶 朱珂 王斌強(qiáng) 單位:武漢大學(xué)