资源描述
按一下以編輯母片標題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,第五章,購物籃分析,Market Basket Analysis,雖然購物分析的主要資料來源是零售業,但是它仍然可以應用在其他的行業中:,如果消費者使用信用卡消費,我們將可以推知他,們下一項會購買的商品。,電話使用者最常選用的附加功能,可以幫助我,們決定配套方案。,消費者的常用銀行服務,可以幫助我們找出他,們會要的其他服務。,異常的保險配套方式可能是詐欺的跡象,提醒,我們進行深入調查。,依據患者的病歷,我們可以判定他們使用特定,治療方式發生併發症的可能機會。,購物籃分析的三大特點,有用的-包含高品質的有效情報,在禮拜四,消費者通常同時購買尿布和啤,酒。,明顯的-該行老手已經知道的事,消費者簽定維修協定後,通常會買大型家,電用品。,無法理解的-看起來沒有合理解釋的,當一個大型的五金行開幕後,最常賣出的,商品之一是馬桶蓋。,虛擬標籤,(,Virtual Items),虛擬標籤可以幫助描述一筆交易,但它們並不是真的分類項,可以幫助比較差異,Example:,健怡可樂,低糖百事可樂,可口可樂,百事可樂,Confidence、Support,交易紀錄,客戶 商品,1 柳橙汁、蘇打飲料,2 牛奶、柳橙汁、玻璃清潔劑,3 柳橙汁、清潔劑,4 柳橙汁、清潔劑、蘇打飲料,規律,條件 結果,有蘇打飲料,必有柳橙汁 ,100%,有柳橙汁 ,必有蘇打飲料,50%,Confidence,在,A,事件發生的狀況下,同時發生,A、B,事件的機率,=條件機率=,P(B,A),Support,在所有事件發生的狀況下,同時發生,A、B,事件的機率,=,P(BA),使用購物籃分析的基本流程,選擇正確的組合,*組成的,item,是取決於各行業所需,*,分類法,商品分類,*去除雜質,使用購物籃分析的基本流程,計算超過門檻的商品,*,Support-P(AB),*Confidence-P,(BlA,),定義,threshold,大小,分析機率取得規則,規則,(,如果,條件句,,則,結論句,),表8.5 商品及其組合的機率:,表8.6 規則的信心水準,信心水準最的就是最好的規則,所以我們似乎應該選如果,B,和,C,則,A。,但是這裡有點問題,這個規則事實上比隨便說,A,會出現在交易中還糟。,A,在45%的交易中出現,但是該規則只有33%的信心水準,規則比隨便猜猜還糟。,這種情況就要利用一技巧-增益,(,Improvement,),。,增益能告訴我們,一條規則在預測結果時能比隨機發生的機會好多少。公式如下:,當增益效果大於1時,那麼最後的結果會在預期結困的基礎上比單純亂數好;但是當數值小於1時,效果就很差了。表8.7顯示了三種規則的增益效果和最高增益的增益效果。,表8.7 規則的,增益效果,當增益效果小於1時,否定陳述句會引出一條比較好的規則,。,例如:,如果,B,和,C,,則,A =,有0.33的信心水準;,如果,B,和,C,,則,A =,會有0.67的信心水準,。,P(A l BC)=0.67,I(A l BC)=0.67/0.55,=1.22,連續時間序列分析,購物籃分析主要發生同一時間的事件,在特定時間點發生的事,時間序列資料(,Time series data),通常建立在顧客的基本資料上,,才能找出同一個人的不同交易紀錄,跨時綜覽,(,Time Windows),一般將一個月發生的交易全都簡化紀錄為單筆紀錄。,可以幫助我們了解行為模式,。,Example:,滿 意,:,(,存款、提款,),不滿意:,(,存款、提款、查詢餘額,、,結算、取消帳戶,),
展开阅读全文