资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,按一下以編輯母片標題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,資料採礦理論與實務,Spring 2019,授課教師:統計系余清祥,日期:2019年4月28日,第十一週:政府、保險資料庫,定義問題,(Problem Definition),“An approximate answer to the right question is worth a great deal more than a precise answer to the wrong problem.”,-the first golden rule of applied mathematics,資料採礦,Data Mining,應用,Application,概念,Conceptual,實體,Physical,Data mining is a team work!,資料庫名稱,戶口普查資料庫,全民健康保險資料庫,政府公務統計,(衛生署、內政部、主計處、),私人機構,研究動機,1.男女平權議題,2.國民健康現況、醫療費用分析,3.疾病及醫療供需的空間分析,資料庫適用對象及用途,政府部門,社會保險評估(e.g.重大傷病免部份負擔),保險公司,評估費率、設計商品,醫療院所,人力、物力的資源規劃、,新舊醫療院所的設置及整合,醫療費用分析,過去研究的限制,國內過去較缺乏大量及完整的健康保險資料庫,建立經驗生命表及評估費率多借助國外資料庫,保單設計未考慮地區特性,變數名稱,以重大傷病為例:,1.身分證號7.出生日期,2.醫事機構代號8.性別,3.費用年月9.受理編號(年度),4.申請年月10.退保原因(死亡),5.診斷代碼11.申請金額,6.重大傷病類別,資料分析,分析方法,費率擬定:修勻、精算數學,分類:Logistic Regression、CART、SVM、Neural Network,分析工具,資料庫軟體:SQL、Access,資料分析軟體:SPSS、S-Plus,分析結果,分成以下項目陳述結果:,就診率,平均就診金額,實支實付保險純保費,定額給付保險純保費,女性85年至89年住院日數比較圖,男性85年至89年住院日數比較圖,醫療費用分析小結,重大傷病女性的純保費較高,但住院費用則是男性較高,扣除女性的生產住院之後,差異將更大。,就診率、平均就診金額並非年齡的單調函數,且兩者的變化趨勢不相同。,民國85年至89年的數據在各年齡均呈現穩定變化。,疾病及醫療供需的空間分析,老年人失能率的空間分析,癌症的群集分析,醫院的同質性比較,Answers:and,Can you find co-location patterns from the following sample dataset?,空間迴歸檢定結果,輕微失能,6個解釋變數為顯著,分成三類:,(1)交通:,省轄市(+)、東部縣(+)、,山地鄉(+),(2)老化程度:,高齡人口比例(+),(3)醫療與環境:,高齡死亡率(+),、教育程度(-),空間迴歸檢定結果(續),嚴重失能,6個解釋變數為顯著,分成四類:,(1)交通:,東部縣(+),(2)老化程度:,高齡人口比例(+),(3)醫療與環境:,高齡死亡率(+),、醫學中心(-)、,醫院醫師(+),(4),人口密度(-),空間失能分析結果小結,失能率較高的地區與東部山區、高齡人口比例、高齡死亡率為正相關,顯示這些地區特別需要長期照護政策的關注。,輕微與嚴重失能較高發生率的地區多數重疊,顯示兩者有密切的關連,若能加強這些地區的醫療資源,或可降低這些地區發生嚴重失能的發生率。,癌症是否集中在某些地區?,癌症空間群集分析小結,男性65歲及65歲以上的死亡率在幾個地區可能有集中的現象,其中集中區域較大者有三個:,1.宜蘭地區,2.雲嘉地區,3.高雄地區,這些地區的高齡死亡率較其他地區高,且這個地區內的鄉鎮市區與其鄰區有集結的現象。,
展开阅读全文