前言:想要寫出一篇引人入勝的文章?我們特意為您整理了互動點播業(yè)務(wù)中數(shù)據(jù)分析技術(shù)的應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。
業(yè)務(wù)數(shù)據(jù)分析基本技術(shù)介紹
隨著信息技術(shù)的發(fā)展以及計算機的數(shù)據(jù)存儲和處理能力的提升,數(shù)據(jù)分析技術(shù)的應(yīng)用領(lǐng)域逐漸拓展,各種技術(shù)也日趨成熟。目前,在數(shù)據(jù)挖掘分析技術(shù)上已經(jīng)形成了較為完備的體系,在大多數(shù)行業(yè)的業(yè)務(wù)數(shù)據(jù)分析領(lǐng)域已經(jīng)形成了固定的技術(shù)模式。
1數(shù)據(jù)源準(zhǔn)備
數(shù)據(jù)源是數(shù)據(jù)分析技術(shù)應(yīng)用的重要前提,數(shù)據(jù)來源關(guān)系到各種業(yè)務(wù)分析所需要的數(shù)據(jù)是否齊全、原始數(shù)據(jù)質(zhì)量是否可靠、數(shù)據(jù)提供的性能方面是否滿足相關(guān)要求等。對于不同的行業(yè)領(lǐng)域,數(shù)據(jù)來源的渠道各不相同,對于數(shù)據(jù)分析應(yīng)用而言,也需要在眾多的數(shù)據(jù)中選取合適的部分進行后續(xù)加工和處理。對于大多數(shù)信息化技術(shù)應(yīng)用比較廣泛的企業(yè)而言,主要的業(yè)務(wù)運營數(shù)據(jù)源都可以從自身的信息管理系統(tǒng)中取得,如業(yè)務(wù)支撐系統(tǒng)、企業(yè)資源規(guī)劃和管理系統(tǒng)以及流水線作業(yè)信息管理系統(tǒng)等。有部分數(shù)據(jù)信息是從非常專業(yè)的系統(tǒng)中直接采集到的,如專業(yè)調(diào)度系統(tǒng)、電話交換機以及生產(chǎn)線控制系統(tǒng)等。從這些系統(tǒng)中,可以取得企業(yè)運營過程中的基礎(chǔ)信息和關(guān)鍵數(shù)據(jù),這些數(shù)據(jù)通常是最能真實客觀地反映企業(yè)運行情況。此外,數(shù)據(jù)獲取的成本也比較低,穩(wěn)定性和質(zhì)量比較好,并且易于管理和重構(gòu)。然而,就經(jīng)營分析的角度而言,從企業(yè)內(nèi)部提供的數(shù)據(jù)還不能滿足全方位分析的需要,需要從企業(yè)外部獲取必要的信息。比如為了深入了解客戶的信息,就需要進行相應(yīng)的市場調(diào)研工作,設(shè)計一些調(diào)查問卷,搜集與業(yè)務(wù)開展和經(jīng)營相關(guān)的重要信息。另外,在某些特定的場合下,還有可能還需要從其它一些外部渠道去集中獲得一些有關(guān)客戶和市場的數(shù)據(jù)信息,目前有不少機構(gòu)專門從事市場信息數(shù)據(jù)提供的服務(wù)工作。從企業(yè)外部獲得的業(yè)務(wù)數(shù)據(jù)往往是針對性較強,有較高利用價值的信息。但這些信息的真實性、穩(wěn)定性程度就比內(nèi)部的數(shù)據(jù)源要低,并且數(shù)據(jù)獲得的成本相對比較高。
2數(shù)據(jù)倉庫技術(shù)的應(yīng)用
目前,數(shù)據(jù)倉庫技術(shù)對于大多數(shù)經(jīng)營業(yè)務(wù)數(shù)據(jù)分析任務(wù)而言,是必備的基礎(chǔ)條件之一,尤其是對于規(guī)模較大、業(yè)務(wù)開展較廣泛的企業(yè)。由于日常運營涉及到的數(shù)據(jù)來源和種類較多、數(shù)據(jù)量較大,在進行數(shù)據(jù)分析處理時需要對原始的信息進行大量的加工處理工作,因此數(shù)據(jù)倉庫技術(shù)的應(yīng)用就是必然的選擇。應(yīng)用數(shù)據(jù)倉庫技術(shù)的主要目的是將原始的數(shù)據(jù)源按相應(yīng)的要求進行轉(zhuǎn)換并按專門設(shè)計的數(shù)據(jù)結(jié)構(gòu)進行存儲。數(shù)據(jù)倉庫技術(shù)對原始數(shù)據(jù)加工處理流程目前一般稱為ETL,即抽取(Extract)、轉(zhuǎn)換(Transform)和加載(Loading)。抽取過程是指從各類原始的數(shù)據(jù)源獲取數(shù)據(jù)的過程,綜合考慮信息系統(tǒng)的處理性能和數(shù)據(jù)時效性以及分析應(yīng)用需求等因素,數(shù)據(jù)抽取過程可以是實時的,也可以是非實時的。對于抽取出的數(shù)據(jù)需要進行一定的轉(zhuǎn)換處理,才能夠進行后續(xù)的應(yīng)用,轉(zhuǎn)換過程主要是根據(jù)后期應(yīng)用需求將原始的數(shù)據(jù)進行過濾、異常處理后再進行格式變換、維度調(diào)整以及初步分類匯總等處理。數(shù)據(jù)加載過程就是將處理后的數(shù)據(jù)裝載到倉庫模型中,并根據(jù)應(yīng)用需求進行數(shù)據(jù)關(guān)聯(lián)關(guān)系的調(diào)整以及性能優(yōu)化。在一些專題分析應(yīng)用場合,還可以將已經(jīng)加載至數(shù)據(jù)倉庫中的數(shù)據(jù)進行進一步的歸納處理,形成相關(guān)主題的數(shù)據(jù)集市,以提高數(shù)據(jù)的可用程度。
數(shù)據(jù)分析方案的設(shè)計和實施
數(shù)據(jù)倉庫建設(shè)完成之后,為了實現(xiàn)業(yè)務(wù)分析的目標(biāo),就可以考慮實施一些數(shù)據(jù)分析方案,選擇合適的分析方法和工具建立相應(yīng)的模型,對數(shù)據(jù)進行處理,最終得到能夠支持業(yè)務(wù)經(jīng)營分析的關(guān)鍵信息,這一步對于整個業(yè)務(wù)數(shù)據(jù)分析工作而言是一個關(guān)鍵點。數(shù)據(jù)分析建模工作不僅需要掌握相關(guān)分析方法技術(shù),更需要對業(yè)務(wù)背景和業(yè)務(wù)分析目標(biāo)有充分的認識。因為數(shù)據(jù)分析挖掘建模方法沒有嚴格的定律可以遵循,往往需要在實踐中運用一些基本的方法去探索影響業(yè)務(wù)目標(biāo)的關(guān)鍵因素,并且需要長期跟蹤業(yè)務(wù)發(fā)展情況,不斷地完善模型、調(diào)整相關(guān)參數(shù),才能夠得到能正確輔助經(jīng)營決策制定的方案。此外,隨著業(yè)務(wù)運營模式的調(diào)整和市場環(huán)境的變化,業(yè)務(wù)分析模型還可能隨時需要重構(gòu)并且反復(fù)驗證。目前用于數(shù)據(jù)挖掘分析的方法有很多,從基本的數(shù)理統(tǒng)計方法到目前研究比較廣泛的神經(jīng)網(wǎng)絡(luò)、遺傳算法等。但是并不是越復(fù)雜的算法效果越好。在很多場合下,應(yīng)用較為簡便的方法得出的結(jié)論更易于描述業(yè)務(wù)信息,便于理解以及實踐操作。現(xiàn)在市場上用于進行數(shù)據(jù)挖掘和統(tǒng)計分析產(chǎn)品也比較豐富,比較典型的分析工具如SPSS、SAS、STAT等,在一些行業(yè)應(yīng)用領(lǐng)域,還有更加專業(yè)的數(shù)據(jù)分析工具和軟件包可供使用。在實際運用過程中,可以根據(jù)數(shù)據(jù)分析的需求和應(yīng)用范圍進行選擇。
互動點播業(yè)務(wù)的業(yè)務(wù)分析需求
以及數(shù)據(jù)分析方案設(shè)計目前,有線電視運營商在互動點播業(yè)務(wù)開展過程中關(guān)注最多的經(jīng)營目標(biāo)是如何提高用戶對服務(wù)的認可程度、擴大用戶規(guī)模、避免用戶流失以及提升用戶的業(yè)務(wù)貢獻價值等方面。在這個過程中同時也需要對點播內(nèi)容的使用情況進行分析,判斷哪些產(chǎn)品的點播頻率比較高,以便進行內(nèi)容安排方面的調(diào)整。為了支撐互動點播業(yè)務(wù)經(jīng)營分析的目標(biāo),首先需要初步選擇可能對點播業(yè)務(wù)使用頻率影響比較大的一些關(guān)鍵性因素,并且判斷哪些信息是有手段可以收集到的,以及從哪些渠道收集等等。這個過程通常需要對基礎(chǔ)業(yè)務(wù)有一定的認識,此外還需要對信息數(shù)據(jù)的分布和管理有相應(yīng)的了解。通常情況下,對于大多數(shù)有線電視運營商而言,目前都在建設(shè)和使用業(yè)務(wù)支撐系統(tǒng)。互動業(yè)務(wù)分析所需要的基礎(chǔ)信息大多數(shù)都可以從業(yè)務(wù)支撐系統(tǒng)中獲取,例如從客戶關(guān)系管理平臺中可以收集到用戶的基本信息,如客戶名稱、聯(lián)系方式、業(yè)務(wù)使用的地址等。另外,客戶開通的業(yè)務(wù)信息以及訂購的各種產(chǎn)品信息、業(yè)務(wù)變更記錄信息以及終端信息等基本上都可以從業(yè)務(wù)支撐系統(tǒng)中獲取到。經(jīng)過一些信息轉(zhuǎn)換和匯總,我們就可以了解到用戶業(yè)務(wù)的在網(wǎng)時間、消費情況、訂購記錄、離網(wǎng)情況等。從這些基本信息里面可以選擇一些業(yè)務(wù)上感興趣的因素進行統(tǒng)計分析,以歸納總結(jié)出經(jīng)營分析相關(guān)的業(yè)務(wù)特征。對于互動點播業(yè)務(wù)相關(guān)的另外一些信息,如客戶的點播行為記錄,一般就不是直接從業(yè)務(wù)支撐平臺上進行采集到。這些數(shù)據(jù)的來源通常是在互動業(yè)務(wù)管理平臺中,用戶在終端上進行點播操作后,互動業(yè)務(wù)管理平臺會記錄下與用戶點播操作相關(guān)的信息。從這些記錄中,我們可以了解到用戶的點播時間、點播內(nèi)容、收看時間等等。根據(jù)點播的內(nèi)容,可以在互動業(yè)務(wù)內(nèi)容管理平臺上關(guān)聯(lián)到其價格、類型、上線時間等信息。綜合上述信息后,就可以整理出互動點播業(yè)務(wù)的使用記錄,通過統(tǒng)計分析可以發(fā)現(xiàn)用戶點播的時間、內(nèi)容偏好和使用量發(fā)展趨勢等數(shù)據(jù),這些數(shù)據(jù)可以幫助判斷系統(tǒng)的容量以及內(nèi)容的受歡迎程度等信息。最后,為了綜合評估互動業(yè)務(wù)的發(fā)展情況,發(fā)現(xiàn)與業(yè)務(wù)分析目標(biāo)關(guān)聯(lián)較大的一些因素,可以綜合用戶的業(yè)務(wù)記錄信息和點播使用情況進行模型構(gòu)造,并且對結(jié)果進行驗證和評估,以得到對決策分析有價值的信息。
互動點播業(yè)務(wù)的數(shù)據(jù)分析方案的實施應(yīng)用
根據(jù)業(yè)務(wù)數(shù)據(jù)分析基本方案設(shè)計的思路,可以著手開始實施相應(yīng)的分析方案。在本文中主要介紹兩類數(shù)據(jù)分析應(yīng)用案例,一個是基于基礎(chǔ)點播行為數(shù)據(jù)進行的統(tǒng)計分析應(yīng)用,另外一個是根據(jù)用戶點播行為數(shù)據(jù)以及基礎(chǔ)業(yè)務(wù)數(shù)據(jù)綜合分析影響用戶的互動業(yè)務(wù)在線情況的因素。
1用戶點播行為數(shù)據(jù)分析案例
為了了解點播業(yè)務(wù)的使用情況,可以根據(jù)用戶的點播行為記錄進行數(shù)據(jù)挖掘分析,以實現(xiàn)總結(jié)互動點播內(nèi)容、時段和使用量趨勢等業(yè)務(wù)特征的分析目標(biāo)。根據(jù)方案設(shè)計的結(jié)論,從互動業(yè)務(wù)管理平臺中可以取得這類業(yè)務(wù)分析所需要的全部源數(shù)據(jù)。但是,互動業(yè)務(wù)管理平臺中的點播記錄通常全部是以文本記錄的方式保存的,并且由于點播記錄的數(shù)量較大,一般按照記錄數(shù)量或者時間間隔進行了拆分。為了利用這些信息就有必要進行相應(yīng)的數(shù)據(jù)抽取轉(zhuǎn)換工作。在實際應(yīng)用中可以使用預(yù)先設(shè)計的腳本定時從互動業(yè)務(wù)管理平臺中進行數(shù)據(jù)的抽取,然后經(jīng)過簡單的類型變換后加載至數(shù)據(jù)倉庫中。為了達到分析目標(biāo),主要抽取的信息有產(chǎn)生用戶點播記錄的用戶ID、點播內(nèi)容的代碼及分類信息、點播的開始和結(jié)束時間等等。原始的點播記錄信息轉(zhuǎn)換后,就可以進行下一步的主題分析準(zhǔn)備了,例如可以按照點播的時段、點播的內(nèi)容,以及用戶區(qū)域等信息進行不同維度的數(shù)據(jù)分析。圖2是對互動點播類業(yè)務(wù)按每日播頻率進行的一個分類統(tǒng)計后用SAS統(tǒng)計工具生成的圖形,在生成統(tǒng)計數(shù)據(jù)前需要從原始數(shù)據(jù)中分離出點播時段信息,并行分類匯總。從圖2中可以發(fā)現(xiàn),點播頻率在一天之中的大致分布規(guī)律。從點播總量上看,每天點播頻率最高的時段是在18:00至22:30左右,峰值在21:00到22:00左右出現(xiàn),此外在中午12:00左右也有一個高峰時期。點播頻率最低的時段大約在3:00至5:00左右。根據(jù)每天點播業(yè)務(wù)頻率的分布情況,可以進行相應(yīng)的網(wǎng)絡(luò)容量分析,比如通過業(yè)務(wù)高峰數(shù)值可以評估出互動點播平臺的并發(fā)容量是否足夠。另外,根據(jù)每日點播頻率的分布特征,可以安排相應(yīng)的業(yè)務(wù)運營工作部署。例如在業(yè)務(wù)高峰時段可以集中投放一些廣告、通知信息,而一些系統(tǒng)割接和調(diào)試工作盡量應(yīng)安排在使用頻率較低的時段內(nèi)進行。如果需要了解一些特殊的節(jié)假日的點播頻率分布特征,可以在原始數(shù)據(jù)中進行重新過濾篩選,生成類似的頻率分布圖并與圖2進行比對,然后分析其特點。從互動業(yè)務(wù)點播數(shù)據(jù)還可以按內(nèi)容代碼維度進行分析,以統(tǒng)計出與互動視頻節(jié)目內(nèi)容相關(guān)的數(shù)據(jù),也可以將不同維度的數(shù)據(jù)進行組合分析,進一步挖掘出業(yè)務(wù)方面感興趣的信息。
2影響互動業(yè)務(wù)用戶在線狀態(tài)因素的綜合分析案例
互動業(yè)務(wù)經(jīng)營分析的另外一個重點就是用戶的流失特點分析,其目的在于找到影響用戶在線狀態(tài)的主要因素,并且根據(jù)這些信息和目前的業(yè)務(wù)狀態(tài)去預(yù)測未來一段時間內(nèi)可能流失的用戶情況。另一方面可以針對影響用戶在線狀態(tài)的主要因素實施有針對性的市場營銷策略,盡可能避免用戶流失情況的產(chǎn)生。此外,在通過分析影響互動在線狀態(tài)的主要因素后,也可以從中發(fā)現(xiàn)進一步發(fā)展擴大用戶規(guī)模的一些線索。為了實現(xiàn)上述業(yè)務(wù)目標(biāo),首先需要確定分析數(shù)據(jù)來源。由于是綜合因素分析,首先需要使用業(yè)務(wù)支撐系統(tǒng)中用戶的互動業(yè)務(wù)狀態(tài)變更信息以及其它一些屬性特征信息。此外,用戶的點播行為數(shù)據(jù)也是一項重要的數(shù)據(jù)源,因此也需要引入到模型中。由于最終目的是需要分析影響用戶在線狀態(tài)的主要因素,而在某一個觀測時間點用戶的在線狀態(tài)一般認為是一個二值型的變量,因此可以使用邏輯回歸(logisticregression)方法進行建模。然后將在此時間點前一個時段的用戶點播次數(shù)、用戶的在網(wǎng)時長、終端特征等作為自變量。在本案例中,按照某一個時間段內(nèi)用戶在線狀態(tài)是否發(fā)生變更這一特征,選擇一個用戶的樣本使用SAS軟件的proclogistic過程進行分析。SAS的分析報告中還給出了模型的相關(guān)參數(shù)以及各變量的參數(shù)估計情況。根據(jù)分析結(jié)果中的卡方值和P值可以了解模型對數(shù)據(jù)的適配性和穩(wěn)定性。從分析結(jié)果給出的參數(shù)估計信息中可以了解不同自變量對于互動用戶在線狀態(tài)的影響情況。用戶的點播次數(shù)、在線時長以及終端屬性等參數(shù)都會影響到用戶的在線狀態(tài)。從參數(shù)估計中可以看出點播次數(shù)較高的用戶,其流失的比率相對較低,另外使用高清互動終端用戶流失率也相對較低,并且終端類型因素有較高的預(yù)測能力。在網(wǎng)時長似乎對用戶的在線情況影響不大,但實際建模的過程中需要考慮套餐贈送的情況,因此最好重新調(diào)整參數(shù)模型后再進行分析。根據(jù)分析的結(jié)果可以得出相關(guān)的結(jié)論,互動用戶的點播頻率越高,其連續(xù)使用的可能性就越大,并且使用高清終端用戶連續(xù)在線的概率比使用標(biāo)清終端的用戶更大。因此在后續(xù)的分析過程中就可以預(yù)測目前點播頻率較低的用戶流失的風(fēng)險較大,在進行針對性的營銷活動時就可以設(shè)法引導(dǎo)用戶更多地進行互動業(yè)務(wù)的體驗,并且鼓勵其進行終端升級,以提高這部分用戶在線的概率。當(dāng)然在分析過程中可能會發(fā)現(xiàn)一些使用頻率非常高的用戶意外流失了,這就值得進一步跟蹤分析,因為很有可能這些用戶選擇了競爭對手提供的類似服務(wù)。
結(jié)束語
有針對性的經(jīng)營分析工作對于目前廣泛開展各類增值業(yè)務(wù)的有線電視運營商而言顯得非常重要,數(shù)據(jù)分析技術(shù)的應(yīng)用對于提升企業(yè)業(yè)務(wù)分析能力以及制定各類營銷決策而言有較大的促進作用。在運用業(yè)務(wù)數(shù)據(jù)分析技術(shù)的過程中,不僅需要對數(shù)據(jù)分析技術(shù)方法本身有足夠的掌握,更重要的是需要深入理解業(yè)務(wù)的特點和經(jīng)營分析目標(biāo),并且在實施數(shù)據(jù)分析方案的過程中累積經(jīng)驗,對已經(jīng)建立的分析模型進行調(diào)整和優(yōu)化,才能不斷挖掘出對經(jīng)營決策制定有價值的業(yè)務(wù)信息。(本文作者:章鵬、唐月 單位:重慶有線電視網(wǎng)絡(luò)有限公司、國家廣電總局廣播電視規(guī)劃院)