公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)的審計(jì)技術(shù)探究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)的審計(jì)技術(shù)探究范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

大數(shù)據(jù)的審計(jì)技術(shù)探究

摘要:審計(jì)作為我國以及我黨監(jiān)督管理的關(guān)鍵組成之一,在保障國家經(jīng)濟(jì)秩序、提升財(cái)政資金使用效率、推動(dòng)政府廉政建設(shè)、維護(hù)經(jīng)濟(jì)社會(huì)健康發(fā)展等方面,都具有重要作用。大數(shù)據(jù)時(shí)代的到來也推動(dòng)著審計(jì)創(chuàng)新,運(yùn)用大數(shù)據(jù)分析科技是實(shí)現(xiàn)審計(jì)事業(yè)全面覆蓋目標(biāo)的需要,而大數(shù)據(jù)分析審計(jì)工程則是影響中國審計(jì)事業(yè)未來發(fā)展方向的核心。

關(guān)鍵詞:大數(shù)據(jù);審計(jì)技術(shù);技術(shù)分析

審計(jì)制度作為保證我國開展民主治國的根本制度,是我國依法使用權(quán)力約束的重要體系。審計(jì)制度的本質(zhì)是我國管理體系內(nèi)存在的一種內(nèi)生制度,其具有防范、預(yù)防、抵御的免疫管理體系,其核心任務(wù)為健全民主制度,完善審計(jì)管理,推動(dòng)我國社會(huì)經(jīng)濟(jì)健康運(yùn)行與科學(xué)發(fā)展,進(jìn)而更好地維護(hù)廣大民眾的切身利益,更是國管理的重要組成部分,故需完善大數(shù)據(jù)時(shí)代下的審計(jì)工作。

一、大數(shù)據(jù)分析審計(jì)方法和電子數(shù)據(jù)審核方式對(duì)比

電子數(shù)據(jù)審計(jì)的數(shù)據(jù)挖掘技術(shù),主要依靠統(tǒng)計(jì)分析模塊進(jìn)行審計(jì)疑點(diǎn)發(fā)現(xiàn)和審計(jì)線索發(fā)現(xiàn)。通常,統(tǒng)計(jì)分析流程主要分為信息收集、清理、匯總、挖掘和可視化。傳統(tǒng)環(huán)境下,常用方式包括賬表分類、大數(shù)據(jù)搜索、數(shù)據(jù)分析、審計(jì)抽樣和數(shù)值分析等。而在該類統(tǒng)計(jì)分析方式中,如Excel、Oracle、AO、ACL、IDEA等,作為主要的審計(jì)軟件而被普遍采用。在大數(shù)據(jù)分析時(shí)代的會(huì)計(jì)活動(dòng)往往包括國民經(jīng)濟(jì)運(yùn)行中的所有大數(shù)據(jù)分析,而這種大數(shù)據(jù)分析??缧袠I(yè)、跨領(lǐng)域,即具備了大量、多樣、高價(jià)值、低密度等的大數(shù)據(jù)特點(diǎn)。根據(jù)資料類型對(duì)其進(jìn)行分析,不難發(fā)現(xiàn)包含數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù),其中涵蓋照片、視頻、文檔等非數(shù)據(jù)內(nèi)容。根據(jù)各個(gè)數(shù)據(jù)的實(shí)際來源對(duì)其進(jìn)行分析后,可以發(fā)現(xiàn)單位內(nèi)進(jìn)行審計(jì)的相關(guān)數(shù)據(jù)信息以及資料,這些資料包括企業(yè)公開的信息。從目標(biāo)入手,能夠發(fā)現(xiàn)會(huì)計(jì)目標(biāo)逐漸成為發(fā)現(xiàn)線索、評(píng)價(jià)風(fēng)險(xiǎn)、關(guān)注績效的內(nèi)容。審計(jì)工作不僅關(guān)系到企業(yè)違法違規(guī)的情況,還要求一旦發(fā)現(xiàn)企業(yè)制度存在的問題,需及時(shí)評(píng)估企業(yè)的內(nèi)部控制風(fēng)險(xiǎn),借助社會(huì)經(jīng)濟(jì)以及大數(shù)據(jù)技術(shù),收集更多的信息內(nèi)容,并對(duì)其展開分析,充分了解企業(yè)的發(fā)展情況,隨后分析企業(yè)發(fā)展的趨勢以及規(guī)律。此時(shí),能夠?yàn)槠髽I(yè)以及國家提供更多的數(shù)據(jù),隨后制定合理的干預(yù)措施,便于企業(yè)做出決策。因此,大數(shù)據(jù)下的企業(yè)審計(jì)工作,具有收集、保存、管理、分析等多個(gè)功能,且在可視化的特點(diǎn)下,需明確其與傳統(tǒng)方法的顯著不同。所以,企業(yè)需明確大數(shù)據(jù)時(shí)代下,傳統(tǒng)審計(jì)與電子審計(jì)方式之間的主要區(qū)別。

二、大數(shù)據(jù)審計(jì)采集技術(shù)

企業(yè)使用電子技術(shù)收集數(shù)據(jù),直接關(guān)系到企業(yè)內(nèi)審計(jì)工作的準(zhǔn)確性,企業(yè)是否可以獲得精準(zhǔn)的數(shù)據(jù)內(nèi)容,是決定企業(yè)能否開展下一步數(shù)據(jù)分析的關(guān)鍵。所以,企業(yè)在收集各個(gè)模型以及理論的基礎(chǔ)上,可以發(fā)現(xiàn)采用大數(shù)據(jù)審計(jì)的關(guān)鍵如下:首先,電子數(shù)據(jù)的收集以及轉(zhuǎn)換相關(guān)技術(shù)。其次,已經(jīng)收集數(shù)據(jù)的完整性以及有效性。企業(yè)在收集數(shù)據(jù)的過程中,需明確研究重點(diǎn)為根據(jù)特定的領(lǐng)域、來源數(shù)據(jù),制定具有針對(duì)性的收集以及處理形式。數(shù)據(jù)完整度以及有效性的檢驗(yàn),主要是根據(jù)當(dāng)前審計(jì)的目標(biāo),并根據(jù)詳細(xì)的審計(jì)標(biāo)準(zhǔn)以及規(guī)范,通過分析審計(jì)數(shù)據(jù)與準(zhǔn)則的符合性,可以有效評(píng)價(jià)遠(yuǎn)程數(shù)據(jù)和本地?cái)?shù)據(jù)的完整性與有效性。

三、大數(shù)據(jù)審計(jì)存儲(chǔ)技術(shù)

處于大數(shù)據(jù)環(huán)境背景下的審計(jì)工作,保存數(shù)據(jù)的體系主要包含傳統(tǒng)、新型以及分布式操作。由于審計(jì)工作的展開內(nèi)容,多為一些敏感的數(shù)據(jù)信息,故對(duì)電子數(shù)據(jù)進(jìn)行審計(jì)的過程中,不僅需要保證數(shù)據(jù)存儲(chǔ)的有效性,還需保證數(shù)據(jù)的完整性,避免其被非法手段獲取。而云存儲(chǔ)信息技術(shù)是指運(yùn)用分布式操作系統(tǒng)、數(shù)據(jù)庫集群等現(xiàn)代信息技術(shù),將互聯(lián)網(wǎng)內(nèi)的多個(gè)不同種類的數(shù)據(jù)進(jìn)行協(xié)調(diào),隨后為大數(shù)據(jù)提供更多的技術(shù),便于其訪問各個(gè)內(nèi)容以及業(yè)務(wù)。這一技術(shù)具有較高的可用性、低成本以及高性能的特點(diǎn),故其是大部分?jǐn)?shù)據(jù)存儲(chǔ)的首選,再加上多副本以及數(shù)據(jù)完整性檢驗(yàn),均是大數(shù)據(jù)存儲(chǔ)的關(guān)鍵技術(shù)。

(一)多副本技術(shù)

多副本技術(shù)可以減少大數(shù)據(jù)技術(shù)由于磁盤故障產(chǎn)生的損失,其是大數(shù)據(jù)存儲(chǔ)過程中需處理的首要問題。多副本技術(shù)作為提高數(shù)據(jù)可用性的技術(shù),存在一個(gè)主節(jié)點(diǎn),以此保障副本內(nèi)的收據(jù)一致性、數(shù)據(jù)可用性管理。整體數(shù)據(jù)均儲(chǔ)存在工作節(jié)點(diǎn)內(nèi),且主要以多個(gè)副本的方式存儲(chǔ)。主節(jié)點(diǎn)與工作節(jié)點(diǎn)主要采用心跳包通訊的方式,且當(dāng)主節(jié)點(diǎn)出現(xiàn)故障之后,需自動(dòng)開展病程分布工作,以此盡快恢復(fù)存在故障的副本。多副本技術(shù)是指多個(gè)副本供系統(tǒng)操作,該系統(tǒng)可以將一個(gè)數(shù)據(jù)分散存儲(chǔ)在多個(gè)副本內(nèi)。此時(shí),其可以減輕系統(tǒng)存儲(chǔ)數(shù)據(jù)的壓力,提升可操作性以及系統(tǒng)運(yùn)行功能。并且,當(dāng)前這些云儲(chǔ)存內(nèi)的主流分布操作系統(tǒng),均使用這一技術(shù),可充分發(fā)揮其具有的價(jià)值。

(二)數(shù)據(jù)完整性驗(yàn)證技術(shù)

可證明數(shù)據(jù)持有(PDP模型)是典型的大數(shù)據(jù)儲(chǔ)存資料認(rèn)證形式,PDP模型主要是由Ateniese學(xué)者經(jīng)過不同研究后,根據(jù)數(shù)據(jù)形態(tài)提出的相關(guān)方案內(nèi)容。PDP可以分為兩個(gè)不同的階段,即預(yù)處理和驗(yàn)證。預(yù)處理過程中,用戶提交相關(guān)文本以及數(shù)據(jù)后,可以獲取修改之后的文本內(nèi)容,并在本地保留原本的數(shù)據(jù),服務(wù)端存儲(chǔ)修改之后的文件。驗(yàn)證過程中,則由用戶隨機(jī)對(duì)服務(wù)器生成不同的挑戰(zhàn),隨后結(jié)合服務(wù)器內(nèi)存在的內(nèi)容,獲得完整的證據(jù),及時(shí)將其傳遞給用戶。用戶通過驗(yàn)證內(nèi)容,再加上預(yù)處理過程中使用的元數(shù)據(jù),可以詳細(xì)計(jì)算數(shù)據(jù)的有效性,以此保證數(shù)據(jù)的完整性。為了完成上述兩個(gè)階段的運(yùn)算,PDP模型共包括四個(gè)基本計(jì)算,而為了提高有效性,上述計(jì)算均為多項(xiàng)式時(shí)間的計(jì)算。PDP模型僅能檢驗(yàn)數(shù)據(jù)塊是否完整,而無法恢復(fù)錯(cuò)誤的數(shù)據(jù)塊,這對(duì)挽回經(jīng)濟(jì)損失并沒有幫助,于是,學(xué)者就設(shè)計(jì)了可恢復(fù)證明(POR模型)的方法,利用POR模型采用糾刪碼原理進(jìn)行數(shù)據(jù)恢復(fù)。也可以擴(kuò)充PDP模塊,并支持動(dòng)態(tài)操作,但該方法僅支持對(duì)數(shù)據(jù)的更改、刪除和插入功能,而不支持對(duì)數(shù)據(jù)塊的嵌入功能。

四、大數(shù)據(jù)審計(jì)分析技術(shù)

大數(shù)據(jù)挖掘中采用的數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)方法,是實(shí)現(xiàn)從檢驗(yàn)式審計(jì)轉(zhuǎn)向發(fā)現(xiàn)式審計(jì)的主要手段。云計(jì)算架構(gòu)是進(jìn)行大數(shù)據(jù)審計(jì)的主要框架。按照審計(jì)使用差異,可分為以下結(jié)構(gòu):批信息處理結(jié)構(gòu)、流信息處理結(jié)構(gòu)、混合信息處理結(jié)構(gòu)等。首先,批信息處理結(jié)構(gòu)通過把無依賴關(guān)聯(lián)的大量數(shù)據(jù)分成多組小批量的生產(chǎn)數(shù)據(jù),每群數(shù)據(jù)分布到各個(gè)區(qū)域的同時(shí)數(shù)據(jù),完成大數(shù)據(jù)的分布式并行處理。批處理結(jié)構(gòu)擁有最高吞吐概率,主要運(yùn)用于事后審核,也是目前使用量最大的一個(gè)結(jié)構(gòu)。其次,流處理結(jié)構(gòu)與傳統(tǒng)的批處理結(jié)構(gòu)完全不同,它將信息看作如同從水龍頭流出的水一般源源不斷的到來,將收到的信息熔成數(shù)據(jù)塊,即分配給相應(yīng)的任務(wù)并進(jìn)行信息處理,而信息處理的全部過程也是流式的。流處理結(jié)構(gòu)的主要運(yùn)用在對(duì)即時(shí)化要求較高的情景,速度通??梢赃_(dá)到秒級(jí)甚至毫秒量級(jí),也主要運(yùn)用在實(shí)時(shí)審計(jì)中。但因?yàn)榧磿r(shí)化的特性,流程式處理大部分的結(jié)果都保留在存儲(chǔ)器中,而不是直接存儲(chǔ)在硬盤上。最后,混合處理結(jié)構(gòu)結(jié)合了批處理的高吞吐度與過程管理的高即時(shí)化,因此基于過程式處理和批處理的混合結(jié)構(gòu)也日益受到人們的重視,是未來審計(jì)應(yīng)用的重點(diǎn)方向。其中,Spark是目前應(yīng)用較為廣泛的混合處理架構(gòu)。Spark把數(shù)據(jù)組織為RDD(彈性分布式數(shù)據(jù)集)的方法,所有的運(yùn)算工作均通過RDD完成,其過程和MapReduce框架非常相似,但為了提高工作效率,中間結(jié)果可只保留到存儲(chǔ)器中,而不必通過磁盤。同時(shí),為了滿足流程管理要求,Spark發(fā)布了Steaming版本,它把所有輸入數(shù)據(jù)流都以時(shí)間片(秒級(jí))為單元加以分割,然后再以類似批處理的方法管理各個(gè)時(shí)間片數(shù)據(jù)。盡管借助云計(jì)算架構(gòu),可以顯著提升審計(jì)大數(shù)據(jù)分析的時(shí)效性,不過要得出合理的審計(jì)分析結(jié)果,還需要借助大數(shù)據(jù)挖掘技術(shù)。大數(shù)據(jù)挖掘的目標(biāo)與傳統(tǒng)數(shù)據(jù)挖掘的目標(biāo)是非常接近的,都是從大量復(fù)雜數(shù)據(jù)中獲取了對(duì)數(shù)據(jù)挖掘目標(biāo)具有重要價(jià)值的信息。而面向大統(tǒng)計(jì)的數(shù)據(jù)挖掘方法,則是在傳統(tǒng)數(shù)據(jù)挖掘算法基礎(chǔ)上發(fā)展起來的,因?yàn)樗炔捎脗鹘y(tǒng)大數(shù)據(jù)挖掘方式的數(shù)據(jù)源多、統(tǒng)計(jì)資料量大、類型復(fù)雜、數(shù)據(jù)價(jià)值存在的密度較低。因?yàn)榇髷?shù)據(jù)上的很多運(yùn)算都可以用標(biāo)準(zhǔn)數(shù)據(jù)庫的原語來表示,所以,為了方便地把傳統(tǒng)資料挖掘的計(jì)算方式運(yùn)用于大數(shù)據(jù)挖掘,部分學(xué)者已經(jīng)對(duì)在關(guān)系代數(shù)中標(biāo)準(zhǔn)運(yùn)算的MapReduce映射方式展開了研究。

五、基于區(qū)塊鏈的大數(shù)據(jù)審計(jì)

大數(shù)據(jù)審計(jì)分析過程中,被審核人員所提交電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)的真實(shí)性、正確性與完整度直接關(guān)系到具體實(shí)際審核業(yè)務(wù)的發(fā)展方向,對(duì)電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)等會(huì)計(jì)信息真實(shí)性做出一定的鑒別和定義是人員順利完成審核項(xiàng)目的基礎(chǔ)環(huán)節(jié),也是提高審核服務(wù)質(zhì)量的重要基礎(chǔ)。大數(shù)據(jù)分析審核的基礎(chǔ)流程就是獲取大量必需和完整的電子信息,構(gòu)建被審核資料數(shù)據(jù)庫,開展審查中間表、分析數(shù)據(jù)處理、延伸查實(shí)表以及審核取證工作,采集、交換、管理電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)信息是實(shí)現(xiàn)大數(shù)據(jù)分析審計(jì)工作的基礎(chǔ)工作,而電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)的質(zhì)量則直接影響著審核目標(biāo)的實(shí)現(xiàn)。要想獲取完整的、統(tǒng)一性的、可追溯的審核,電子數(shù)據(jù)信息質(zhì)量尤為重要。數(shù)據(jù)處理過程中,將區(qū)塊鏈技術(shù)作為關(guān)鍵技術(shù),結(jié)合分布式網(wǎng)絡(luò)結(jié)構(gòu),并采用多種數(shù)據(jù)信息技術(shù),可以及時(shí)針對(duì)審核流程中電子產(chǎn)品數(shù)據(jù)信息的不安全因素,以區(qū)塊鏈技術(shù)為基礎(chǔ),重點(diǎn)研究審核中電子產(chǎn)品數(shù)據(jù)信息采集及新聞?wù)鎸?shí)性的核實(shí)機(jī)理、一致性傳輸與可溯源保存機(jī)理,以及安全性和可追溯性加強(qiáng)方案的實(shí)現(xiàn)機(jī)理。本文認(rèn)為基于區(qū)塊鏈技術(shù)的大數(shù)據(jù)審計(jì),主要可以從如下幾個(gè)方面進(jìn)行研究:首先,在審計(jì)電子產(chǎn)品數(shù)據(jù)信息收集的過程中,由于在大數(shù)據(jù)處理環(huán)境下審計(jì)的電子產(chǎn)品統(tǒng)計(jì)數(shù)量多且繁雜,又牽涉諸多主體,所收集的電子產(chǎn)品數(shù)據(jù)信息中往往夾帶著巨量噪音,其完全、真實(shí)感都很難保障。而通過區(qū)塊鏈技術(shù),就能夠?qū)⑺袑徲?jì)節(jié)點(diǎn)單位的各種待審核電子記錄進(jìn)行自動(dòng)收集,并將其定期分批加密進(jìn)行傳播。同時(shí),通過分布式節(jié)點(diǎn)自動(dòng)解密和確認(rèn)機(jī)制,對(duì)各種待審核記錄所涉及的信息關(guān)聯(lián)方實(shí)現(xiàn)了交叉確認(rèn)。經(jīng)過確定的審核記錄,數(shù)據(jù)在加入時(shí)間戳和密碼機(jī)制之后被確認(rèn)并進(jìn)入?yún)^(qū)塊鏈,而無法再進(jìn)行更改。與傳統(tǒng)的審計(jì)數(shù)據(jù)收集方式比較,采用區(qū)塊鏈技術(shù)的審計(jì)數(shù)據(jù)收集方式將具備質(zhì)量較高、真實(shí)、無法修改、可追溯性的優(yōu)點(diǎn),將大大減少審核流程中的上下一級(jí)重復(fù)性勞動(dòng),并解決了審計(jì)電子數(shù)據(jù)收集方式不全面、不真實(shí),無法運(yùn)用于全覆蓋審核分析中的問題。其次,在審核電子商務(wù)數(shù)據(jù)分析中,我們可以利用區(qū)塊鏈的時(shí)限戳管理機(jī)制,即以每組數(shù)據(jù)分析前后的時(shí)限戳為重要參量,根據(jù)審計(jì)電子商務(wù)數(shù)據(jù)傳輸方法、統(tǒng)計(jì)量、信息的重要性、可恢復(fù)力量等統(tǒng)計(jì)相關(guān)性信息,建立電子數(shù)據(jù)一致性評(píng)價(jià)模型,從而為數(shù)據(jù)傳輸過程中的安全性評(píng)價(jià)提供基礎(chǔ)。最后,針對(duì)所存放的審核電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)的安全與可靠性問題,以區(qū)塊鏈的多數(shù)據(jù)副本共識(shí)技術(shù)為基礎(chǔ),將審核電子產(chǎn)品財(cái)務(wù)數(shù)據(jù)以多副本的方法分布式存放,并基于存放的位置、級(jí)別、管理授權(quán)等各方面的影響因素,對(duì)所存放的數(shù)據(jù)副本實(shí)行了本地評(píng)價(jià),最后再將對(duì)每個(gè)數(shù)據(jù)副本的評(píng)價(jià)結(jié)果加以綜述,形成各數(shù)據(jù)副本當(dāng)前的存放有效性評(píng)價(jià)模型。然后以此為依據(jù),對(duì)該電子數(shù)據(jù)的有效性做出評(píng)價(jià),然后根據(jù)評(píng)估價(jià)值和該信息的應(yīng)用范圍確定有效性,防止錯(cuò)誤信息流入審計(jì)報(bào)告體系,造成巨大會(huì)計(jì)風(fēng)險(xiǎn)。同時(shí)采用區(qū)塊鏈技術(shù)對(duì)審計(jì)報(bào)告信息加以組合,并針對(duì)審計(jì)報(bào)告電子信息的類別、屬性等諸多因素,以B+樹等方法形成多索引。根據(jù)該索引和區(qū)塊鏈的鏈?zhǔn)交瘶?gòu)造,通過設(shè)計(jì)對(duì)數(shù)據(jù)修改記錄的快速追溯監(jiān)控方法,不僅追溯了存儲(chǔ)中的不安全因素,還保證了重要數(shù)據(jù)的可重構(gòu)性,為進(jìn)行快速可追溯審計(jì)提供了基礎(chǔ)。

六、結(jié)束語

大數(shù)據(jù)信息技術(shù)在各行各業(yè)中的廣泛應(yīng)用,為國民經(jīng)濟(jì)高速發(fā)展與社會(huì)和諧穩(wěn)定提供了助力,同時(shí)也是實(shí)現(xiàn)信息審計(jì)全面覆蓋的必然需要。根據(jù)現(xiàn)階段會(huì)計(jì)信息化發(fā)展?fàn)顩r,系統(tǒng)梳理了電子數(shù)據(jù)審計(jì)的發(fā)展脈絡(luò),系統(tǒng)總結(jié)了大數(shù)據(jù)信息技術(shù)在會(huì)計(jì)電子數(shù)據(jù)的收集、保存、大數(shù)據(jù)分析與可視化等工作中的相關(guān)研究,探索了在大數(shù)據(jù)處理環(huán)境下電子數(shù)據(jù)審計(jì)所面臨的新機(jī)遇、新挑戰(zhàn),并預(yù)測了未來的重點(diǎn)研發(fā)方向。同計(jì)算機(jī)輔助審計(jì)與物聯(lián)網(wǎng)審計(jì)比較,大數(shù)據(jù)審計(jì)在思想模型、技術(shù)方法等方面,均有明顯不同,雖然目前有若干探索性研究工作,但從總體來看,中國大數(shù)據(jù)審計(jì)的重點(diǎn)研發(fā)方向還有待進(jìn)一步明確,而且還有許多問題亟待解決。

作者:陶燕 單位:武漢商學(xué)院