Công thức xác định tứ phân vị của mẫu số liệu ghép nhóm Tứ phân vị thứ hai $Q_2$ Tứ phân vị thứ hai của mẫu số liệu ghép nhóm, kí hiệu $Q...
Công thức xác định tứ phân vị của mẫu số liệu ghép nhóm
Tứ phân vị thứ hai $Q_2$
Tứ phân vị thứ nhất $Q_1$
Để tìm tứ phân vị thứ nhất của mẫu số liệu ghép nhóm, kí hiệu $Q_1$, ta thực hiện như sau:
• Giả sử nhóm $[ u_m ; u_{m+1})$ chứa tứ phân vị thứ nhất,
• $n_m$ là tần số của nhóm chứa tứ phân vị thứ nhất,
• $C=n_1+n_2+\cdots + n_{m-1}.$
Khi đó
$$Q_1=u_m+\frac{\frac{n}{4}-C}{n_m} \cdot (u_{m+1}-u_m).$$
Tứ phân vị thứ ba $Q_3$
Tương tự, để tìm tứ phân vị thứ ba của mẫu số liệu ghép nhóm, kí hiệu $Q_3$, ta thực hiện
như sau:
• Giả sử nhóm $[u_j; u_{j+1} )$ chứa tứ phân vị thứ ba,
• $n_j$ là tần số của nhóm chứa tứ phân vị thứ ba,
• $C=n_1+n_2+\cdots + n_{j-1}.$
Khi đó $$Q_3=u_m+\frac{\frac{3n}{4}-C}{n_j} \cdot (u_{j+1}-u_j).$$
Công thức tổng quát cho cả $Q_1, Q_2$ và $Q_3$
Tứ phân vị thứ $r$ (với $r=1,2,3$) được tính theo công thức tổng quát sau: $$Q_r=u_p+\frac{\frac{r\cdot n}{4}-C}{n_p} \cdot (u_{p+1}-u_p).$$ Trong đó: $[u_p; u_{p+1} )$ là nhóm chứa tứ phân vị thứ $r$; $n_p$ là tần số của nhóm chứa tứ phân vị thứ $r$; $C=n_1+n_2+\cdots + n_{p-1}.$Chú ý
Nếu tứ phân vị thứ $k$ là trung bình cộng của 2 số hạng thuộc hai nhóm liên tiếp thì ta lấy điểm "ngăn cách" 2 nhóm đó làm tứ phân vị thứ $k$ (xem Ví dụ).Ý nghĩa của tứ phân vị của mẫu số liệu ghép nhóm
Ba điểm tứ phân vị chia mẫu số liệu đã sắp xếp theo thứ tự không giảm thành bốn phần đều nhau. Giống như với trung vị, nói chung không thể xác định chính xác các điểm tứ phân vị của mẫu số liệu ghép nhóm.Bộ ba tứ phân vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho tứ phân vị của mẫu số liệu gốc và được sử dụng làm giá trị đo xu thế trung tâm của mẫu số liệu.
Tứ phân vị thứ nhất và thứ ba đo xu thế trung tâm của nửa dưới (các dữ liệu nhỏ hơn $Q_2$) và nửa trên (các dữ liệu lớn hơn $Q_2$) của mẫu số liệu.
Ví dụ tìm tứ phân vị của mẫu số liệu ghép nhóm
Ví dụ. Một hãng xe ô tô thống kê lại số lần gặp sự cố về động cơ của 100 chiếc xe cùng loại sau 2 năm sử dụng đầu tiên ở bảng sau:Số lần gặp sự cố | [1; 2] | [3; 4] | [5; 6] | [7; 8] | [9; 10] |
Số xe | 17 | 33 | 25 | 20 | 5 |
a) Hãy ước lượng các tứ phân vị của mẫu số liệu ghép nhóm trên.
b) Một người cho rằng có trên 25% xe của hãng gặp không ít hơn 4 sự cố về động cơ trong 2 năm sử dụng đầu tiên. Nhận định trên có hợp lí không?
Lời giải
a) Do số lần gặp sự cố là số nguyên nên ta hiệu chỉnh lại như sau:
Số lần gặp sự cố | [0,5; 2,5) | [2,5; 4,5) | [4,5; 6,5) | [6,5; 8,5) | [8,5; 10,5) |
Số xe | 17 | 33 | 25 | 20 | 5 |
Gọi $x_1; x_2;...;x_{100}$ là mẫu số liệu được xếp theo thứ tự không giảm ($n=100$).
Tìm $Q_2$
Ta có $x_1, ..., x_{17} \in [0,5; 2,5)$; $x_{18},..., x_{50} \in [2,5; 4,5)$; $x_{51},..., x_{75} \in [4,5; 6,5)$; $x_{76},..., x_{95}\in [6,5; 8,5)$; $x_{96},...,x_{100} \in [8,5; 10,5).$
Tứ phân vị thứ hai của dãy số liệu $x_1; x_2;...;x_{100}$ là $\dfrac{1}{2} (x_{50} + x_{51})$.
Do $x_{50} \in [2,5; 4,5)$ và $x_{51}\in [4,5; 6,5)$ nên tứ phân vị thứ hai của mẫu số liệu ghép nhóm là $Q_2=4,5.$
Tìm $Q_1$
Tứ phân vị thứ nhất của dãy số liệu $x_1; x_2;...;x_{100}$ là $\dfrac{1}{2} (x_{25} + x_{26})$.Do $x_{25}$ và $x_{26}$ cùng thuộc nhóm $[2,5; 4,5)$ nên tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là
$Q_1=2,5+\dfrac{\dfrac{100}{4}-17}{33} \cdot (4,5-2,5)≈2,98.$
Tìm $Q_3$
Tứ phân vị thứ ba của dãy số liệu $x_1; x_2;...;x_{100}$ là $\dfrac{1}{2} (x_{75} + x_{76})$. Do $x_{75}\in [4,5; 6,5)$ và $x_{76} \in [6,5; 8,5)$ nên tứ phân vị thứ ba của mẫu số liệu ghép nhóm là $Q_3=6,5.$b) Do tứ phân vị thứ nhất $Q_1 \approx 2,98$ nên nhận định trên là hợp lí.