某保險賠款數(shù)據(jù)研究
時間:2022-06-23 11:08:25
導(dǎo)語:某保險賠款數(shù)據(jù)研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]以四川某保險的理賠數(shù)據(jù)為研究對象,采用SPSS和Excel針對賠款金額與費(fèi)用金額使用了均值分析法,從而獲得哪種金額的理賠金額最高;針對險種,賠款金額進(jìn)行單因素方差分析,根據(jù)p值得到拒絕方差具有齊次性的原假設(shè),再在數(shù)據(jù)表中根據(jù)p值得到拒絕不同險種類別的賠款金額沒有顯著性差異。根據(jù)以上兩個結(jié)論,能夠直觀地看出其不同險種的差異,使其進(jìn)一步改進(jìn)和完善。
[關(guān)鍵詞]理賠數(shù)據(jù);數(shù)據(jù)分析;SPSS分析
自肺炎疫情暴發(fā)以來,保險業(yè)的作用得到更多重視[1],但是與此同時還是有很多的群眾并不了解其購買的保險好不好,購買的費(fèi)用與其所理賠的金額是否合理。群眾在維護(hù)自身利益的同時,也要選擇對的保險才能更加放心。在保險行業(yè)中,理賠這項(xiàng)工作,既是風(fēng)險的晴雨表,也是反映保險行業(yè)的經(jīng)營狀況的重要依據(jù)[2]。本文通過SPSS分析對理賠數(shù)據(jù)進(jìn)行相關(guān)性分析,并通過結(jié)論提出建議。
1.分析思路
1.1分析工具
此研究里所用到了SPSS和Excel兩種工具,應(yīng)用SPSS軟件,有利于方便、快捷地處理統(tǒng)計(jì)圖形、圖表,使過程變得直觀、形象[3]。Excel工具,則是可以進(jìn)行數(shù)據(jù)清洗,將重復(fù)、多余的數(shù)據(jù)篩選清除,將缺失的數(shù)據(jù)補(bǔ)充完整,將錯誤的數(shù)據(jù)糾正或者刪除,最后整理成為標(biāo)準(zhǔn)的、干凈的、連續(xù)的數(shù)據(jù),提供給數(shù)據(jù)分析、數(shù)據(jù)挖掘等使用[4]。
1.2思路
先通過用Excel對數(shù)據(jù)進(jìn)行清洗,檢測數(shù)據(jù)是否符合完整性,如果不符合,則要修復(fù)數(shù)據(jù)。如果在數(shù)據(jù)修復(fù)之后依然存在著與數(shù)據(jù)完整性約束不一致的情況,則要再次修復(fù)數(shù)據(jù),直到數(shù)據(jù)符合要求[5];再通過SPSS分析將數(shù)據(jù)可視化,使用均值分析、單因素方差分析等一系列分析得出結(jié)果。
2.數(shù)據(jù)準(zhǔn)備與清洗
2.1數(shù)據(jù)準(zhǔn)備
理賠數(shù)據(jù)共16列212182行,主要包括的是機(jī)構(gòu)、險種、案件號、保單號、賠款金額,賠款時間、費(fèi)用類型、總保費(fèi)、保額、客戶號、性別、年齡、婚姻狀況、過去三年平均收入、職業(yè)。其中總保費(fèi)代表客戶第一年投的所有保險費(fèi)用,保額代表機(jī)構(gòu)賠付的最大限額。
2.2數(shù)據(jù)清洗
(1)刪去表格中過去三年平均收入為0、1、4的行。(2)隱藏?zé)o用的數(shù)據(jù)列,機(jī)構(gòu)、賠款時間、性別、婚姻狀況以及職業(yè)。(3)將險種進(jìn)行編號歸類,把類型一樣的險種分別編號為1、2、3、4、5、6。
3.SPSS數(shù)據(jù)分析
3.1賠款金額與費(fèi)用金額的均值分析
使用均值分析方法分析因變量賠款金額與自變量費(fèi)用類型,從而獲得那種類型的賠款金額更高。均值分析的步驟:因?yàn)橘M(fèi)用類型有很多需要先將它們重新編碼分組,采用的是SPSS轉(zhuǎn)化里的自動重新編碼將費(fèi)用類型重新命名fylx,然后開始點(diǎn)擊分析,選擇比較均值選擇均值分析,將fylx放入自變量列表,將賠款金額放入因變量列表可得出報告表,激活報告表點(diǎn)擊編輯創(chuàng)建圖選擇點(diǎn),可得出散點(diǎn)圖。圖1散點(diǎn)圖在費(fèi)用類型中他殺的賠款金額是最高的,而精神病的賠款金額是最低的,所有類型的平均賠款金額是2664.1RMB,其中癌癥各類器官重大疾病占賠款金額的主體部分。
3.2賠款金額、年齡以及過去三年平均值收入的相關(guān)性分析
相關(guān)性分析步驟:在SPSS上的分析選項(xiàng)中選擇相關(guān)中的雙變量相關(guān)性分析,將賠款金額、年齡和過去三年平均年收入放入變量中,選擇皮爾遜相關(guān)系數(shù)和雙尾顯著性檢驗(yàn),可得出相關(guān)性表。從相關(guān)性表中可以看出,賠款金額與年齡沒有顯著的相關(guān)性,與過去三年平均收入有著顯著的相關(guān)性;年齡與過去三年平均年收入有著顯著相關(guān)性;并且在表中,三者之間存在顯著相關(guān)性時,顯著性(雙尾)均<.001,說明這個相關(guān)顯著會犯錯的可能小于1%。
3.3總保費(fèi)、繳費(fèi)期限、年齡以及過去三年平均年收入與保額之間的線性回歸分析
回歸分析步驟:在SPSS上選擇分析選項(xiàng)下的回歸,再在回歸選項(xiàng)下選擇線性回歸,在因變量那一項(xiàng)當(dāng)中將右邊的保額選中,塊內(nèi)將總保費(fèi),繳費(fèi)期限,年齡以及過去三年平均年收入與保額選中,再在方法當(dāng)中選擇步進(jìn),這樣方便看出加入不同參數(shù)進(jìn)去過后各個回歸方程的擬合程度的高低,最后通過查看模型摘要當(dāng)中各個R方的值可以看出將4個參數(shù)都加入回歸方程的情況下R方會大于0.6且R方最大。所以選擇建立總保費(fèi),繳費(fèi)期限,年齡以及過去三年平均年收入的回歸方程,最后在系數(shù)當(dāng)中可以看到各個參數(shù)所帶有的參數(shù)值的大小以及常數(shù),最后可以建立回歸方程:保額=5061.178+1.062*總保費(fèi)+1103.919*繳費(fèi)期限+0.026*過去三年平均年收入-137.095*年齡。3.4險種、賠款金額的單因素方差分析此刻Excel中在險種后插入一列命名為XD種別,然后點(diǎn)擊公式選項(xiàng)卡中的邏輯函數(shù)中的IF函數(shù),在Logical_test中輸入LEFT(B873,1)="4",Value_if_true中輸入1,Value_if_false中點(diǎn)擊左上角,選擇IF函數(shù),在彈出的Logical_test中輸入LEFT(B2,1)="6",Value_if_true中輸入2,Value_if_false中點(diǎn)擊左上角,選擇IF函數(shù),在彈出的Logical_test中輸入LEFT(B2,1)="B",Value_if_true中輸入3,Value_if_false中點(diǎn)擊左上角,選擇IF函數(shù),在彈出的Logical_test中輸入LEFT(B2,1)="F",Value_if_true中輸入4,Value_if_false中點(diǎn)擊左上角,選擇IF函數(shù),在彈出的Logical_test中輸入LEFT(B2,1)="S",Value_if_true中輸入4,Value_if_false中輸入5,點(diǎn)擊肯定,然后保留Excel表格。先在SPSS中導(dǎo)入表格,然后在SPSS分析選項(xiàng)卡中點(diǎn)擊分析中比較平均值中的單因素方差分析,將賠款金額導(dǎo)入因變量列表,將險種類別導(dǎo)入因子列表,點(diǎn)擊選項(xiàng),勾中方差齊性檢驗(yàn),點(diǎn)擊繼續(xù),點(diǎn)擊事后比較,勾中假定等方差中的LSD,勾中不假定等方差中的T2,點(diǎn)擊繼續(xù),點(diǎn)擊對比,添加系數(shù)1、1、-1、-1、-1、-1,確定后將會得到方差齊次性檢驗(yàn)表。因?yàn)榉讲畈痪哂旋R次性,方差齊次性表中險種類別為1與險種類別為2、3、4的P值大于0.05,說明險種類別為1與險種類別為2、3、4的賠款金額沒有顯著性差異;險種類別為1與險種類別為5、6的P值小于0.05,說明險種類別為1與險種類別為5、6的賠款金額有顯著性差異,其中平均值差值(i-j)的值為負(fù),說明險種類別為1的賠款金額小于險種類別為5、6的賠款金額。同理可得,險種類別為2與險種類別為3、4、5、6的賠款金額有顯著性差異,險種類別為2的賠款金額大于險種類別為3、4的賠款金額,小于險種類別為5、6的賠款金額;險種類別為3與險種類別為4的賠款金額沒有顯著性差異,險種類別為3與險種類別為5、6的賠款金額有顯著性差異,險種類別為2的賠款金額小于險種類別為5、6的賠款金額;險種類別為5與險種類別為6的賠款金額有顯著性差異,險種類別為5的賠款金額小于險種類別為6的賠款金額。
4.結(jié)論和建議
4.1結(jié)論
在費(fèi)用類型中他殺的賠款金額是最高的,而精神病的賠款金額是最低的,所有類型的平均賠款金額是2664.1RMB,其中癌癥各類器官重大疾病占賠款金額的主體部分;從相關(guān)性表中可以看出,賠款金額與年齡沒有顯著的相關(guān)性,與過去三年平均收入有著顯著的相關(guān)性;年齡與過去三年平均年收入有著顯著相關(guān)性;并且在表中,三者之間存在顯著相關(guān)性時,顯著性(雙尾)均<.001,說明這個相關(guān)顯著會犯錯的可能小于1%;險種類別為5與險種類別為6的賠款金額有顯著性差異,險種類別為5的賠款金額小于險種類別為6的賠款金額。
4.2建議
其一,保險公司可以將年平均收入高和年平均收入低的客戶進(jìn)行篩選分類,對不同平均年收入的客戶制定其針對性的方案,有效的推薦,可以使客戶通過理賠的金額來選擇自己所能承擔(dān)的最可靠回報大的險種。其二,可以將賣得好的保險的理賠金額適當(dāng)調(diào)高,將保險費(fèi)用降低可以讓收入并不是很高的客戶群體,有更多樣的選擇,讓客戶更加愿意相信這份保險。其三,可以著重理賠過后的服務(wù),更好地建立公司的形象。對于客戶群體,筆者給出如下建議:第一,量力而行,選擇自己所能承擔(dān)的保險費(fèi)用的保險,而不是盲目跟風(fēng),不要因?yàn)槔碣r金額高就選擇它,而是要看是否適合自身情況。第二,多重選擇,可以購買多個理賠條件并不苛刻的保險項(xiàng)目,而不是一味選擇理賠金額高的項(xiàng)目。在大數(shù)據(jù)時代的大環(huán)境下,許多隱私已經(jīng)不能稱為隱私,如果能在普通信息中深度發(fā)掘出更有意義更有價值的信息,就需要權(quán)衡利用底線與信息保護(hù)之間的關(guān)系。一個公司能否把產(chǎn)業(yè)做好,取決于它是否能夠知道客戶真正所需求的是什么。像所研究的這所公司一樣,理賠所包含的保險種類十分的多,但是所真正能夠達(dá)到收益真正能夠?qū)蛻魩淼暮锰幍谋kU并不多,并不是能夠?qū)蛻舻囊笮枨蟾采w得多就能夠達(dá)到很好的效果,一個機(jī)構(gòu)雖然擁有很多種類,雖滿足了當(dāng)今社會群體的大部分需求,但是又因?yàn)榭蛻羧后w太大了,每個方面又不能同時兼顧,使得運(yùn)營起來又十分有風(fēng)險。公司需要降低某些險種的賠款風(fēng)險,在不傷及客戶權(quán)益的情況下要讓自身的收益達(dá)到最大化,使機(jī)構(gòu)與客戶雙方都達(dá)到合作共贏的局面。
5.結(jié)語
本文通過對理賠數(shù)據(jù)的分析,得出了相關(guān)的結(jié)論和建議。保險公司可以調(diào)整理賠金額以及保險費(fèi)用來吸引客戶購買,客戶則要做到不能只看到理賠金額高而不考慮自身的經(jīng)濟(jì)情況就盲目購買。
【參考文獻(xiàn)】
[1]王笑.強(qiáng)調(diào)保障屬性保險業(yè)服務(wù)民生更“給力”[N].金融時報,2021-02-04.
[2]徐高凱,楊杉.基于大數(shù)據(jù)的保險公司理賠數(shù)據(jù)畫像研究[J].商業(yè)文化,2021(01):53-55.
[3]喻平.SPSS在統(tǒng)計(jì)學(xué)中的應(yīng)用[J].中國商界(上半月),2010(03):46-47.
[4]滕文惠,閆媛媛,姚曉芳.基于Excel的數(shù)據(jù)清洗應(yīng)用研究[J].科技資訊,2019,17(15):28+30.
[5]劉政宇.基于大數(shù)據(jù)的數(shù)據(jù)清洗技術(shù)及應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2019(04):92.
作者:王浩 楊杉 單位:四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院