分佈域和四分位數間距
考慮以下兩組數據:
單靠平均值不足以判斷數據的分散程度,我們需要一些離差的量度。
數據組 A: 1, 3, 5, 5, 7, 9
數據組 B: 4, 5, 5, 5, 5, 6
A 的平均數 = B 的平均數 = 5,
A 的中位數 = B 的中位數 = 5,
A 的眾數 = B 的眾數 = 5
分佈域
四分位數間距
標準差
分佈域 = 最大值 – 最小值
分佈域 = 最高組界 – 最低組界
對於不分組數據,
數據組中最大值與最小值的差是一個量度數據離差的簡單方法。
對於分組數據
分佈域
對於一組由小至大順序排列的
不分組數據…
一組由小至大順排列的數據
數據的下半部分(50%的數據)
數據的上半部分(50%的數據)
中位數
25%的數據
25%的數據
25%的數據
25%的數據
中位數 Q2
下四分位數 Q1
上四分位數 Q3
四分位數間距 = Q3 – Q1
四分位數間距
對於分組數據,下四分位數和上四分位數可從累積頻數多邊形(或曲線)讀出。它們分別對應數據組的第 25 個百分位數和第 75 個百分位數。
下列所示為某商店的 8 款球鞋的售價。
$250, $270, $275, $350, $380, $395, $420, $480
∴ 四分位數間距 = $( – )
= $135
最大數據 = $480,最小數據 = $250
Q1
Q3
Q2
∴ 分佈域 = $(480 – 250 )
= $230
課當研習
圖中所示為 40 名學生身高的累積頻數多邊形。
求學生身高的分佈域。
求學生身高的四分位數間距。
(a) 最高組界 = cm
最低組界 = cm
分佈域 = ( – ) cm
= 51 cm
從圖中可得,
Q1
Q3
四分位數間距
= (175 – 157) cm
= 18 cm
Q1 = 157 cm
Q3 = 175 cm
下四分位數、上四分位數、中位數、最大值和最小值提供了有關一組數據中最重要的資料。我們可以透過框線圖把這些資料一併展示出來。
框線圖
框包含了 50% 的數據,而兩旁的線則各包含了 25% 的數據。
由於 Q1 和 Q3 代表了數據的第 25 個和第 75 個百分位數,因此 Q1 以下有 25% 的數據而 Q3 以上有 25% 的數據。
6
5
3
8
2
數值
上四分位數
中位數
下四分位數
最大值
最小值
1 2 3 4 5 6 7 8 9 10
從下面的框線圖我們可得到數據的甚麼資料呢?
課堂研習
以下框線圖所示為一組小孩的智商。
求該組小孩的智商的中位數。
求該組小孩的智商的分佈域和四分位數間距。
試描述該組小孩的智商的分佈情況。
100 105 110 115 120 125 130 135 140 145
智商的中位數 = 135
最低智商 = 100,最高智商 = 145
∴ 分佈域 = 145 – 100
= 45
下四分位數 = 115,上四分位數 = 140
∴ 四分位數間距 = 140 – 115
= 25
(c) 由於智商的中位數較接近上四分位數,因此分佈於下半部 (100 至 135) 的智商的離差較上半部(135 至 145) 的為大。