Lỗi: Trang web OLM.VN không tải hết được tài nguyên, xem cách sửa tại đây.

Bài 3. Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm

Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm Các bài giảng

I. KHOẢNG BIẾN THIÊN. KHOẢNG TỨ PHÂN VỊ

1. Định nghĩa

Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó.

Ta có thể tính khoảng biến thiên \(R\) của mẫu số liệu theo công thức sau: \(R=x_{max}-x_{min}\), trong đó \(x_{max}\) là giá trị lớn nhất, \(x_{min}\) là giá trị nhỏ nhất của mẫu số liệu đó.

Giả sử \(Q_1,Q_2,Q_3\) là tứ phân vị của mẫu số liệu. Ta gọi \(\Delta_Q=Q_3-Q_1\) là khoảng tứ phân vị của mẫu số liệu đó.

Chú ý: Khoảng tứ phân vị của mẫu số liệu còn được gọi là khoảng trải giữa của mẫu số liệu.

Ví dụ 1. Cho mẫu số liệu:

\(5\) \(6\) \(4\) \(7\) \(6\) \(8\) \(5\) \(6\)

Tìm khoảng biến thiên của mẫu số liệu này.

Giải 

Giá trị cao nhất và thấp nhất của mẫu số liệu lần lượt là \(8\) và \(4\), do đó khoảng biến thiên là \(R=8-4=4.\)

Ví dụ 2. Cho mẫu số liệu điểm kiểm tra môn Toán của một tổ:

\(9\) \(8\) \(8\) \(7\) \(6\) \(9\) \(7\) \(10\) \(8\)

Tìm khoảng tứ phân vị cho mẫu số liệu này.

Giải

Sắp xếp mẫu số liệu theo thứ tự không giảm

\(6\) \(7\) \(7\) \(8\) \(8\) \(8\) \(9\) \(9\) \(10\)

Mẫu số liệu có \(9\) giá trị nên trung vị là số chính giữa, \(Q_2=8\).

\(Q_1=\dfrac{7+7}{2}=7;Q_3=\dfrac{9+9}{2}=9;\)

Vậy khoảng tứ phân vị của mẫu số liệu trên là \(\Delta_Q=Q_3-Q_1=9-7=2.\)

2. Ý nghĩa

a. Khoảng biến thiên của mẫu số liệu phản ánh sự "dao động", "sự dàn trải" của các số liệu trong mẫu đó.

b. Khoảng tứ phân vị là đại lượng cho biết mức độ phân tán của nửa giữa mẫu số liệu và có thể giúp xác định các giá trị bất thường của mẫu số liệu đó. Khoảng tứ phân vị thường được dùng thay cho khoảng biến thiên vì nó loại trừ hầu hết giá trị bất thường của mẫu số liệu.

@200525877837@@200526282775@

II. PHƯƠNG SAI

1. Định nghĩa

Cho mẫu số liệu thống kê có \(n\) giá trị \(x_1,x_2,...,x_n\) và số trung bình cộng là \(\overline{x}\).

Ta gọi số \(s^2=\dfrac{\left(x_1-\overline{x}\right)^2+\left(x_2-\overline{x}\right)^2+...+\left(x_n-\overline{x}\right)^2}{n}\) là phương sai của mẫu số liệu trên.

Nhận xét: Mỗi hiệu giữa số liệu và số trung bình cộng gọi là độ lệch của số liệu đó đối với số trung bình cộng.

  • Khi mẫu số liệu được cho dưới dạng bảng tần số
Giá trị \(x_1\) \(x_2\) \(...\) \(x_k\)
Tần số \(n_1\) \(n_2\) \(...\) \(n_k\)

Phương sai của mẫu số liệu thống kê trong bảng phân bố tần số là:

\(s^2=\dfrac{n_1\left(x_1-\overline{x}\right)^2+n_2\left(x_2-\overline{x}\right)^2+...+n_k\left(x_k-\overline{x}\right)^2}{n}\) trong đó \(n=n_1+n_2+...+n_k\)\(\overline{x}\) là số trung bình cộng của các số liệu đã cho.

  • Khi mẫu số liệu cho bởi bảng phân bố tần số tương đối
Giá trị \(x_1\) \(x_2\) \(...\) \(x_k\)
Tần số tương đối \(f_1\) \(f_2\) \(...\) \(f_k\)

Phương sai của mẫu số liệu thống kê trong bảng phân bố tần số là:

\(s^2=f_1\left(x_1-\overline{x}\right)^2+f_2\left(x_2-\overline{x}\right)^2+...+f_k\left(x_k-\overline{x}\right)^2\) trong đó \(\overline{x}\) là số trung bình cộng của các số liệu đã cho.

2. Ý nghĩa

Phương sai là số đặc trưng đo mức độ phân tán của mẫu số liệu.

III. ĐỘ LỆCH CHUẨN

1. Định nghĩa

Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu số liệu thống kê.

2.  Ý nghĩa

Độ lệch chuẩn là số đặc trưng đo mức độ phân tán của mẫu số liệu thống kê có cùng đơn vị đo. Mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình cộng) của các số liệu trong mẫu đó sẽ thấp hơn.

Ví dụ 3. Mẫu số liệu sau đây cho biết cân nặng của \(5\) bạn lớp \(10\) (đơn vị kg):

\(45\) \(48\) \(46\) \(50\) \(48\)

Tìm phương sai và độ lệch chuẩn cho mẫu số liệu này.

Giải

Số trung bình của mẫu số liệu là

\(\overline{X}=\dfrac{45+48+46+50+48}{5}=47,4\)

Phương sai của mẫu số liệu là

\(s^2=\dfrac{\left(45-47,4\right)^2+\left(48-47,4\right)^2+\left(46-47,4\right)^2+\left(50-47,4\right)^2+\left(48-47,4\right)^2}{5}=3,04\)

Độ lệch chuẩn \(s=\sqrt{s^2}\approx1,74.\)

@200525878330@@200525880891@

IV. TÍNH HỢP LÍ CỦA SỐ LIỆU THỐNG KÊ

Ta có thể sử dụng các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm để chỉ ra được những số liệu bất thường của mẫu số liệu. Ta thường sử dụng khoảng tứ phân vị để xác định số liệu bất thường của mẫu số liệu như sau:

Giả sử \(Q_1,Q_2,Q_3\) là tứ phân vị của mẫu số liệu và \(\Delta_Q=Q_3-Q_1\) là khoảng tứ phân vị của mẫu số liệu. Một giá trị \(x\) trong mẫu là một giá trị bất thường nếu \(x>Q_3+1,5\Delta_Q\) hoặc \(x< Q_1-1,5\Delta_Q.\)

Ví dụ 4. Một mẫu số liệu có tứ phân vị thứ nhất là \(48\) và tứ phân vị thứ ba là \(76\). Hãy kiểm tra xem trong hai giá trị \(5\) và \(100\) giá trị nào được xem là giá trị bất thường của mẫu số liệu.

Giải

Ta có \(Q_1=48;Q_3=76\Rightarrow\Delta_Q=Q_3-Q_1=76-48=28\) 

Khi đó \(Q_1-1,5.\Delta_Q=6;Q_3+1,5.\Delta_Q=118\)

 nên \(5\) (nhỏ hơn \(6\)) là một giá trị bất thường của mẫu số liệu.

@200525879806@

 

 

 

 

Phụ huynh có nhu cầu đăng ký học kèm trực tuyến với giáo viên OLM xem tại đây, hoặc liên hệ: 0966 971 996 (cô Quyên)