最新三章叙述统计量

上传人:仙*** 文档编号:242661558 上传时间:2024-08-30 格式:PPT 页数:150 大小:951KB
返回 下载 相关 举报
最新三章叙述统计量_第1页
第1页 / 共150页
最新三章叙述统计量_第2页
第2页 / 共150页
最新三章叙述统计量_第3页
第3页 / 共150页
点击查看更多>>
资源描述
按一下以編輯母片標題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,三章叙述统计量,統計量,學習如何將資料轉變成一個(或幾個),統計量, 如樣本平均數, 標準差,s,等,,但由於這種數是由樣本算出,因此也,稱為”,樣本統計量,”(Sample Statistic)或,簡稱,統計量,2,平均投中,4次,9,平均投中比例,10,例3.2,、(,例1.9 續,),抽樣50位,台南市,成年市民,求,(1) 50位市民樣本平均身高,(2) 男生的平均身高,(3),女生的平均身高,。,11,50位市民的平均身高,12,25位男生平均身高,13,25位女生平均身高,14,例3.3,、,(例2.2續),全班50位學生統計學期中考試成績,如表2.2,,求全班成績的母體平均數,15,母體平均數,16,2.,中位數,所謂,中位數,是資料從小排到大,,經排序後“,最中間的數,”,,也就是當資料有奇數個時,,中位數是排序最中間的數,,而當資料有偶數個時,,中位數為排序最中間的兩個數的平均。,17,大約有一半的數據小於或等於中位數,大約有一半的數據大於或等於中位數,中位數以Me表示,18,例3.4,、(,例3.1,續),求11位同學投中次數的中位數,19,中位數為3,23333344667,20,例3.5,、(,例3.3,續),求全班50位學生統計學期中考試成績的中位數?,21,中位數=62,50位學生的成績排序如表2.2,,中間位置為25.5,,因此以排序25的62分與排序26的62分的平均 (62+62)/2=62 當做中位數,22,中位數,23,3.,眾數,(Mode),眾數,就是資料中出現頻率最多的數,24,例3.6,、(例3.1續),求11位同學投中次數的眾數,25,眾數=3,11位同學投中次數頻率,最多的是投中 “3” 次,共出現 5 次,,因此 3就是此組資料的眾數,26,例3.7,、(,例3.3,續),求50位學生統計學期中考成績的眾數,27,眾數=60,在50位學生成績中,60分的有4位,,出現的次數最多,,所以60分即為此組資料的眾數,28,4.,去頭尾平均數,去頭與去尾的筆數相等,且去掉的筆數為 ,其中n為樣本數。,例如n=32, =0.2(即80%),則,去頭及去尾的筆數各為3筆,因,32,0.2/2=3.2=3,29,例3.8,、(,例3.1,續),求11位同學投中次數的,80%去頭尾平均數,30,去頭與去尾的筆數分別為,31,32,5.,加權平均數,33,國文78分、英文83分、,數學65分、理化70分,地科75分、歷史76分、,地理74分、公民94分,則以上課時數加權的學年平均成績為:,(5,78+5,83+5,65+3,70+3,75,+2,76+2,74+2,94)/27,= 2053/27 = 76.0370,34,3.3,位置統計量,位置的量測,百分位數,(Percentile),四分位數,(Quartile),35,p百分位數,36,例3.11,、(,例2.1,續),(1)求全班成績的85百分位數是多少?,(2)求全班成績的60百分位數是多少?,37,38,85百分位數,39,60百分位數,40,.,四分位數,Q,1,= 25百分位數,Q,2,= 50百分位數=中位數,Q,3,= 75百分位數,41,例3.12,、(,例3.11,續),求Q,1, Q,2, Q,3,42,43,3.4,離勢統計量,全距,、,四分位距,、,平均絕對偏差,、,變異數,、,標準差,、,變異係數,44,全距,R,45,例3.13,、(,例3.1,續),求11位學生投中次數的全距,R= 7 2 =5,46,例3.14,、(,例3.3,續),求50位學生統計學期中考成績的全距,R=9732 = 65,47,2.,四分位距,IQR = Q,3,Q,1,48,例3.15,、(,例3.1,續),求11位學生投中次數的四分位距,IQR = Q,3,Q,1,= 4 3 =1,49,例3.16,、(,例3.12,續),求50位學生統計學期中考成績的,四分位距,IQR= Q,3,Q,1,= 7454 = 20,50,平均絕對偏差,51,例3.17,、(,例3.1,續 ),求11位同學投中次數的絕對偏差,52,53,54,變異,變異,(Variation)是每一筆資料與,中心點差距(稱為偏差)的平方和,,即變異為偏差平方和,55,可證明,56,樣本變異數,57,母體變異數,58,例3.18,、(,例3.1,續),求11位同學投中球數的變異及變異數,59,60,x,的變異,61,例3.19,、(,例3.3,續),求全班50位學生統計學期中考成績的,母體變異數,62,63,64,樣本標準差,65,母體標準差,66,甲乙兩人打靶,您會收那一位為徒,67,例3.20,、(,例3.18,續),求11位同學投中次數的標準差,68,69,例3.21,、,(例3.2,續,),求50位,台南市,成年市民身高的,樣本變異數 與樣本標準差,70,樣本變異數 與樣本標準差,71,例3.22,、(,例3.19,續),求全班50位學生統計學期中考成績的,母體標準差,72,73,母體標準差,74,變異係數,75,76,身高與體重變異係數,77,例3.23、,某人想投資甲、乙兩投資策略,78,79,對稱的直方圖,80,右偏的直方圖,81,左偏的直方圖,82,3.6,經驗法則與,謝比雪夫,不等式,一組資料,算出樣本平均數及,樣本標準差,s,後,,我們可能進一步問資料落在與平均數相差兩個標準差以內的比例會是多少?,像這類問題,,經驗法則,與,謝比雪夫,不等式(Chebyshevs Inequality)提供部份答案,83,鐘形的資料,,經驗法則,84,謝比雪夫,提供一個較粗糙的答案,但它對任何形態的資料分配都適用,85,例3.25,、(例3.10續),試以,謝比雪夫,不等式及經驗法則,求資料落在與平均數相差,1個標準差以內、,2個標準差以內、,3個標準差以內,,所佔比例並與實際結果做比較,86,87,88,89,3.7,相關係數,1.,經理想了解產品價格與銷售量,是否有相關?,2.,教育學者想了解 IQ成績與教學成績,是有相關?,3.醫生想了解人出生時的體重與壽命,是否有相關?,4. 房地產公司想了解房價與物價,是否有相關?,90,關係程度有多高?,要了解是否有相關,,最直接的方法便是畫散佈圖,,但有時除了要知道是否有相關外,,也想要知道關係程度有多高?,此即本節所要介紹的相關係數,91,樣本相關係數,(簡稱,相關係數,),92,相關係數,93,例3.26,、,研究某產品定價(x)(單位:元)與銷售量(y)(單位:箱)的關係,,在12個地區做實驗,,結果資料如下:(實際價格為x+50元),94,產品廣告費(x)與銷售量(y) 資料,95,標準化法,96,97,五行合計法,98,99,100,廣告費(x)與銷售量 (y)相關係數,101,例3.27,、10位學生的數學(x)、統計(y)成績,102,數學、統計偏差與偏差乘積,103,平方和,104,數學與統計相關係數,105,資料標準化,106,數學與統計相關係數,107,(1)由定義可以看出相關係數是純量,,它的大小與單位無關,(或說相關係數是單位不變量)。,108,(2)由看出,,如果大部份 ,同向(同正或同負),,則,r,是正的。,反之,如果大部份反向(一正一負),,則,r,是負的。,109,(3),r ,0 表,x,值增加時,,y,值有增加的傾向;,r, 0 表,x,值增加時,,y,值有減少的傾向。,110,r,=1,111,r,= -1,112,r,= 0.9,113,r,= 0.5,114,r = -,0.9,115,r = -,0.5,116,r,= 0,117,r,= 0 U形曲線相關,118,正的曲線相關,119,負的曲線相關,120,相關係數 因果關係,變數間有,相關,不一定有,因果關係,121,例3.28,、離婚率與出國人數,122,(1),試畫出離婚率對出國人數的散佈圖;,(2),求離婚率與出國人數的相關係數;,(3) 試問離婚率與出國人數是否有因果關係?,123,離婚率對出國人數的散佈圖,124,相關係數 r0.9225,125,如離婚率是因,出國人數是果,即離婚率高低會影響出國人數,,這表示什麼?,它的意義可能是台灣地區,這幾年來離婚人數增加,,這些離婚的人(或其親朋好友),為了散心到國外,造成出國人數的增加。,126,如出國人數是因,離婚率是果,可能解釋是國人出國後,,看見外國人很開放,也就見異思遷,,回國後就和老伴離婚了,127,事實上並非如此,過去幾年,台灣地區由於經濟的成長,,國民所得的增加、社會的開放,,造成女性同胞經濟獨立,不需要靠長期飯票,也有多餘的錢到國外旅遊,,128,所以這幾年來離婚率不斷地增加,,出國人數也不斷地增加,都是受第三者(經濟成長(GNP)等因素)的影響所造成,,離婚率與出國人數的相關是一種,間接相關,129,離婚率與GNP,130,出國人數與GNP,131,例3.29、,身高與髮長,132,身高對髮長的散佈圖,133,相關係數,r,0.81,134,髮長(,y,)對身高(,x,)的散佈圖,135,頭髮長度有愈短的現象,此散佈圖仍呈現身高愈高的人,,頭髮長度有愈短的現象,,事實上頭髮長度與身高並沒有關係,,它們都是受第三個變數性別的影響,,男生頭髮較短但身高較高,,女生頭髮較長,身高較矮。,136,20位女生平均身高160.7公分,,平均髮長25.2公分;,30位男生平均身高172.4公分,,平均髮長7.5公分,137,30位男生髮長對身高的散佈圖,138,20位女生髮長對身高的散佈圖,139,髮長與身高的關係是間接的,男生的髮長對身高散佈圖,看起來很亂,表示髮長與身高無關(-0.23),,同樣的女生的髮長與身高的,相關係數也很低(0.11)。,所以控制性別後,髮長與身高,就沒有相關了,,140,兩組相關(或稱成對)的資料,相加後其平均數及標準差,(1)兩組資料相加的平均 = 兩組資料個別平均再相加,對否?,(2)兩組資料相加的標準差是否等於兩組資料個別標準差的相加呢?對否?,141,1.統計量是由觀察資料組成,如平均數、標準差,會隨觀察(或抽樣),資料不同而得到不同的答案,,所以統計量是“,隨機變數,”,,142,2.統計量與參數的差異,前者是可算的,後者是“未知的”定數,統計量可用來“估計”參數,,但估計會有誤差,,如何使誤差愈小愈好,是學習統計必須了解的。,143,3. “平均數”代表資料中心點,但有敏感性(或稱不穩健性),,會受某些大數據的影響,144,4.了解標準差的意義,,何種情況下標準差愈大愈好,(如評分、區別等問題),,何種情況下標準差愈小愈好,(如品質問題),145,5.右偏(或稱正偏)分配時,平均數大於中位數。,146,6.做統計推論最主要的兩個統計量是,樣本平均數與樣本變異數,147,7.資料分佈呈鐘形時,,經驗法則提供較精確的機率比例,,不知資料分佈形態時,,謝比雪夫,提供較粗糙的機率不等式,148,8.量測兩個變數線性相關程度的指標為,相關係數,,但兩變數有相關一定有因果關係,149,结束语,谢谢大家聆听!,150,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!