前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大額保險(xiǎn)大數(shù)據(jù)反欺詐系統(tǒng)設(shè)計(jì)探析范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:為了更好地識(shí)別針對(duì)大額保險(xiǎn)的欺詐行為,總結(jié)了大額保險(xiǎn)的主要風(fēng)險(xiǎn)類型,明確了大額保險(xiǎn)反欺詐系統(tǒng)的主要構(gòu)建方向。基于Apriori算法提出了大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)模型,重點(diǎn)分析了數(shù)據(jù)統(tǒng)計(jì)識(shí)別、保險(xiǎn)欺詐規(guī)律挖掘、保險(xiǎn)欺詐行為識(shí)別。構(gòu)建的大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)經(jīng)實(shí)證運(yùn)行,結(jié)果表明,基于Apriori算法構(gòu)建的大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)能快速完成對(duì)大額保險(xiǎn)欺詐行為的有效識(shí)別。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);Apriori算法;反欺詐系統(tǒng);實(shí)踐
0引言
大額保險(xiǎn)是指投保的保險(xiǎn)金額相對(duì)較大的人身保險(xiǎn),通常保險(xiǎn)金額是在50萬(wàn)以上,投保時(shí)需要對(duì)其實(shí)施契約調(diào)查,充分掌握投保人的資產(chǎn)情況,明確投保人的投保動(dòng)機(jī),身體健康情況等[1]。近年來(lái),在中國(guó)經(jīng)濟(jì)飛速發(fā)展的影響下,國(guó)內(nèi)保險(xiǎn)行業(yè)迅速崛起,為廣大社會(huì)群體提供了健康保障。大額保險(xiǎn)作為保險(xiǎn)行業(yè)非常重要的一類產(chǎn)品,具有“避債、避稅、傳承”的作用,成為了高凈值人士投資理財(cái)?shù)臒衢T選擇,這使得大額保單量持續(xù)增加,保額也在不斷攀升。本文擬根據(jù)大額保險(xiǎn)的特點(diǎn),基于關(guān)聯(lián)規(guī)則挖掘算法的經(jīng)典算法Apriori算法,設(shè)計(jì)一套具有較高可行性的反欺詐系統(tǒng),期望以此降低保險(xiǎn)運(yùn)營(yíng)成本,營(yíng)造一個(gè)良好的保險(xiǎn)行業(yè)環(huán)境。
1大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)模型設(shè)計(jì)
本文從變量篩選、數(shù)據(jù)預(yù)處理、保險(xiǎn)欺詐規(guī)律挖掘和行為識(shí)別等方面,挖掘數(shù)據(jù)信息,基于Apriori算法建立大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)。
1.1數(shù)據(jù)統(tǒng)計(jì)識(shí)別
1.1.1變量選擇。變量篩選主要是從個(gè)人行為數(shù)據(jù)中選擇能夠反映個(gè)人信用的變量。因?yàn)榛ヂ?lián)網(wǎng)上個(gè)人行為種類繁多,有些變量能很好體現(xiàn)個(gè)人信用度,有些變量則對(duì)個(gè)人信用的影響不明顯。因此,我們需要選擇合適變量,才能夠準(zhǔn)確評(píng)價(jià)用戶的信用度[2]。大額保險(xiǎn)用戶大致可分為以下幾個(gè)方面。用戶數(shù)據(jù)用戶數(shù)據(jù):包括用戶的年齡,性別,婚姻,職業(yè),教育程度,收入情況等。信用數(shù)據(jù)信用數(shù)據(jù):包括用戶在銀行的征信記錄,用戶在銀行或其他征信公司的征信記錄。交易數(shù)據(jù)交易數(shù)據(jù):包括用戶的交易金額,交易頻率,交易地點(diǎn),交易賬戶等。消費(fèi)數(shù)據(jù)消費(fèi)數(shù)據(jù):包括用戶的消費(fèi)時(shí)間,消費(fèi)地點(diǎn),消費(fèi)習(xí)慣,消費(fèi)金額等。社交數(shù)據(jù)社交數(shù)據(jù):包括用戶的好友數(shù)量,好友的信用評(píng)級(jí),好友的身份特征等。除此之外變量之間可能存在一定聯(lián)系,共同反映用戶的某種特性,所以我們要盡量從多個(gè)維度來(lái)刻畫(huà)用戶的特征。1.1.2數(shù)據(jù)預(yù)處理。原始數(shù)據(jù)集常規(guī)情況下很難直接將其作為系統(tǒng)數(shù)據(jù)來(lái)源,針對(duì)該情況,必須對(duì)所收集到的數(shù)據(jù)作出相應(yīng)的處理,以確保建模和統(tǒng)計(jì)處理的相關(guān)要求。
1.2保險(xiǎn)欺詐規(guī)律挖掘
保險(xiǎn)欺詐盡管花樣百出,但保險(xiǎn)公司有豐富的經(jīng)驗(yàn)和積累了豐富的數(shù)據(jù),那么就能夠結(jié)合數(shù)據(jù)掌握其具體規(guī)律。目前,不少的保險(xiǎn)公司,針對(duì)大額保險(xiǎn)的欺詐處理,多以保險(xiǎn)人員個(gè)人的經(jīng)驗(yàn)為主,并從中總結(jié)出相應(yīng)的規(guī)律。大額保險(xiǎn)所出現(xiàn)的欺詐行為分析指標(biāo)主要包括了欺詐特征、行為特征指標(biāo)兩個(gè)部分,抽取其中的一部分的指標(biāo)用來(lái)對(duì)Apriori算法進(jìn)行演示。
1.3保險(xiǎn)欺詐行為識(shí)別
經(jīng)由保險(xiǎn)公司的信息系統(tǒng)數(shù)據(jù)庫(kù)來(lái)進(jìn)行數(shù)據(jù)的構(gòu)建,在對(duì)傳統(tǒng)分析模型進(jìn)行使用的過(guò)程中,結(jié)合Apriori算法數(shù)據(jù)關(guān)聯(lián)挖掘技術(shù),對(duì)欺詐行為進(jìn)行分析、識(shí)別和評(píng)價(jià)。借助欺詐行為發(fā)生風(fēng)險(xiǎn)、可能性和成本、指數(shù)的分析,總結(jié)出一套相應(yīng)的欺詐風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果,并基于提出反欺詐風(fēng)險(xiǎn)管理策略與監(jiān)督管理體系??紤]到保險(xiǎn)欺詐行為的識(shí)別業(yè)務(wù)的特殊性,如果將保險(xiǎn)欺詐的挖掘業(yè)務(wù)模式應(yīng)用與保險(xiǎn)欺詐行為的識(shí)別業(yè)務(wù)中是不可行的。為此,本文在進(jìn)行欺詐行為識(shí)別業(yè)務(wù)過(guò)程中,首先提出了先分布、然后再集中的流程處理模型。保險(xiǎn)欺詐行為的詳細(xì)識(shí)別業(yè)務(wù)模型如圖1所示。各個(gè)保險(xiǎn)公司首先將內(nèi)部數(shù)據(jù)庫(kù)中的業(yè)務(wù)數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,所有的公司處理后的數(shù)據(jù)結(jié)構(gòu)應(yīng)該是一致的。
2大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)實(shí)證分析
2.1數(shù)據(jù)預(yù)處理及描述
本文基于Apriori算法構(gòu)建大額保險(xiǎn)大數(shù)據(jù)智能反欺詐新系統(tǒng),具體的操作步驟如下。首先掃描整張事務(wù)數(shù)據(jù)庫(kù)D,設(shè)置一個(gè)最小支持度Smin,根據(jù)最小支持度Smin產(chǎn)生第一個(gè)頻繁項(xiàng)集S1;由S1執(zhí)行連接和剪枝操作,產(chǎn)生候選項(xiàng)集的集合,并根據(jù)Smin產(chǎn)生頻繁項(xiàng)集S2;接下來(lái)再由S2產(chǎn)生S3;這樣的操作一直進(jìn)行下去,直到Sk成為空集時(shí)結(jié)束。根據(jù)聚類分析中運(yùn)行效率高低的類別,所有的事務(wù)也可以分為五大類。對(duì)這五類數(shù)據(jù)分別使用Apriori算法,找到各自情況下的主要影響因素。所以頻繁項(xiàng)集的最小支持度滿足:Sminn<||An⑴公式⑴中,An主要用于表示第n類運(yùn)行效率的事務(wù)集;Sminn主要用于對(duì)該事務(wù)集的頻繁項(xiàng)集的最小支持度進(jìn)行表示。每個(gè)影響因素都產(chǎn)生五個(gè)“項(xiàng)”,假設(shè)最終數(shù)據(jù)產(chǎn)生的項(xiàng)為B1,B2,B3,B4,C1,C2,C3,D1,...,掃描整張數(shù)據(jù)表格,根據(jù)最小支持度Smin找到第一個(gè)頻繁項(xiàng)集的集合;在此基礎(chǔ)上,連接下一個(gè)項(xiàng),產(chǎn)生含有兩個(gè)項(xiàng)的候選項(xiàng)集(例如:B1BC2,B1BC3,C2D2,...);剪枝后根據(jù)最小支持度得出第二個(gè)頻繁項(xiàng)集的集合。以此類推,直到最后產(chǎn)生的頻繁項(xiàng)集是空集。最終,該算法一共得到五個(gè)頻繁項(xiàng)集。該算法分別找出了可以欺詐行為風(fēng)險(xiǎn)高、較高、一般、較低、低的頻繁項(xiàng)集。在這些項(xiàng)集中,所有出現(xiàn)的疑似欺詐行為,都是導(dǎo)致大額保險(xiǎn)管理風(fēng)險(xiǎn)的主要影響因素。
2.2大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng)實(shí)證結(jié)果
2.2.1系統(tǒng)主體業(yè)務(wù)流程。系統(tǒng)的主體業(yè)務(wù)流程分為四個(gè)階段:StepStep1:數(shù)據(jù)抽取,系統(tǒng)通過(guò)把各個(gè)保險(xiǎn)公司的大額保險(xiǎn)業(yè)務(wù)數(shù)據(jù)集合起來(lái)并進(jìn)行預(yù)處理,然后把保單數(shù)據(jù)保存至汽車保險(xiǎn)反欺詐系統(tǒng)的中央數(shù)據(jù)庫(kù)。StepStep2:數(shù)據(jù)加工,大額保險(xiǎn)反欺詐系統(tǒng)的核必系統(tǒng)通過(guò)這些數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)其中的規(guī)律,并將規(guī)律與數(shù)據(jù)進(jìn)行保存。StepStep3:數(shù)據(jù)查詢,當(dāng)各個(gè)保險(xiǎn)公司的業(yè)務(wù)員在建立保單時(shí),需要通過(guò)大額保險(xiǎn)的反欺詐系統(tǒng)進(jìn)行風(fēng)險(xiǎn)分析,以確定該保單是否接受,當(dāng)投保人要求理賠時(shí),可以根據(jù)分析結(jié)果來(lái)確定是否應(yīng)該賠付與賠付的具體額度。StepStep4:數(shù)據(jù)保存,對(duì)于風(fēng)險(xiǎn)特別高的數(shù)據(jù),業(yè)務(wù)員應(yīng)該保存到大額保險(xiǎn)反欺詐系統(tǒng)中。2.2.2試驗(yàn)結(jié)果。將已有的數(shù)據(jù)分別分為訓(xùn)練集和測(cè)試集兩個(gè)部分,訓(xùn)練集用于反向傳播訓(xùn)練系統(tǒng),測(cè)試集用來(lái)檢驗(yàn)系統(tǒng)輸出的誤差與精度。將所有數(shù)據(jù)循環(huán)處理一次,時(shí)間在0.5s左右,此時(shí)的測(cè)試誤差約15%;循環(huán)處理100、1000、2000次系統(tǒng)的預(yù)測(cè)精度會(huì)有明顯的提升。最終將2000次循環(huán)后的結(jié)果等價(jià)為:運(yùn)行效率與其主要影響因素的定量關(guān)系。將提取主要影響因素的訓(xùn)練結(jié)果(CNN4)、不提取主要影響因素的結(jié)果(CNN6)以及使用Apriori算法的結(jié)果放到一張表中進(jìn)行對(duì)比,結(jié)果見(jiàn)表1。從表1對(duì)比結(jié)果來(lái)看,Apriori算法考慮全部影響因素的運(yùn)行效率預(yù)測(cè)值誤差為0.98%;而僅考慮主要影響因素的預(yù)測(cè)誤差0.71%,預(yù)測(cè)精度都很高,都可以很好地預(yù)測(cè)運(yùn)行效率值。本系統(tǒng)已經(jīng)在某財(cái)險(xiǎn)的部分分公司與某保險(xiǎn)的部分分公司試運(yùn)營(yíng),通過(guò)半年內(nèi)的152件減損與拒賠的案件的處理,總共為保險(xiǎn)公司減損或拒賠的金額達(dá)9638.84萬(wàn)元。
3結(jié)束語(yǔ)
近年來(lái),我國(guó)各個(gè)地區(qū)保險(xiǎn)欺詐事件的頻頻出現(xiàn),且發(fā)生率日漸明顯。面對(duì)這種層出不窮的欺詐行為,保險(xiǎn)人士很難經(jīng)由個(gè)人經(jīng)驗(yàn)來(lái)進(jìn)行有效識(shí)別,但隨著大數(shù)據(jù)技術(shù)的發(fā)展,基于Apriori算法就能夠?qū)崿F(xiàn)對(duì)各項(xiàng)數(shù)據(jù)的關(guān)聯(lián)處理,從而快速完成對(duì)大額保險(xiǎn)欺詐行為的有效識(shí)別。為了能夠盡可能地減少欺詐案件,推動(dòng)社會(huì)資金的合理分配與保險(xiǎn)行業(yè)的正常發(fā)展,本文基于Apriori算法構(gòu)建起了大額保險(xiǎn)大數(shù)據(jù)智能反欺詐系統(tǒng),較好的實(shí)現(xiàn)對(duì)現(xiàn)階段大額保險(xiǎn)欺詐行為的有效識(shí)別,但該系統(tǒng)還存在一定的局限之處,還需要借助數(shù)據(jù)挖掘技術(shù)對(duì)各項(xiàng)業(yè)務(wù)數(shù)據(jù)做進(jìn)一步的挖掘,提高系統(tǒng)運(yùn)作的有效性。
參考文獻(xiàn)
[1]白浩,袁智勇,孫睿等.基于Apriori算法和卷積神經(jīng)網(wǎng)絡(luò)的配電設(shè)備運(yùn)行效率主要影響因素挖掘[J].電力建設(shè),2020.41(3):31-38
[2]翟繼強(qiáng),馬文亭,肖亞軍.Apriori-KNN算法的警報(bào)過(guò)濾機(jī)制的入侵檢測(cè)系統(tǒng)[J].小型微型計(jì)算機(jī)系統(tǒng),2018.39(12):2632-2635
作者:須秋夢(mèng) 章民融 單位:中國(guó)人民財(cái)產(chǎn)保險(xiǎn)股份有限公司 上海市分公司上海市計(jì)算技術(shù)研究所