Lỗi: Trang web OLM.VN không tải hết được tài nguyên, xem cách sửa tại đây.

Bài 4: Phương sai và độ lệch chuẩn

Danh sách bài làm & chấm bài  
Phương sai và độ lệch chuẩn Các bài giảng

1. Phương sai

Ví dụ 1: Cho biết điểm thi Toán của hai nhóm, mỗi nhóm 6 học sinh như sau.

Nhóm 1 Nhóm 2
5, 6, 6, 9, 9 (1) 2, 5, 9, 9, 10 (2)

Ta thấy số trung bình cộng $\bar{x}$ của dãy (1) và số trung bình cộng $\bar{y}$ dãy (2) bằng nhau:  $\bar{x} = \bar{y} = 7$.

Tuy nhiên, khi so dãy (1) và dãy (2), ta thấy các số liệu ở dãy (1) gần với số trung bình cộng hơn nên chúng đồng đều hơn (hay có thể nói nhóm học sinh 1 học đều hơn). Khi đó ta nói các số liệu thống kê ở dãy (1) ít phân tán hơn dãy (2).

Để tìm số đo độ phân tán (so với số trung bình cộng) của dãy (1) ta tính các độ lệch của mỗi số liệu thống kê đối với số trung bình cộng:

(5 - 7) ; (6 - 7) ; (6 - 7) ; (9 - 7) ; (9 - 7).

Bình phương các độ lệch và tính trung bình cộng của chúng, ta được

\(s_1^2=\dfrac{\left(5-7\right)^2+2\left(6-7\right)^2+2\left(9-7\right)^2}{5}=2,8\)

Số $s_1^2$ được gọi là phương sai của dãy (1).

Tương tự, phương sai của dãy (2) là

\(s_2^2=\dfrac{\left(2-7\right)^2+\left(5-7\right)^2+2\left(9-7\right)^2+\left(10-7\right)^2}{5}=9,2\).

Ta thấy phương sai của dãy (1) nhỏ hơn phương sai của dãy (2). Điều đó biểu thị độ phân tán của của các số liệu thống kê ở dãy (1) ít hơn dãy (2).

 

@108262478550@

 

Ví dụ 2: Cho bảng phân bố tần số, tần suất ghép lớp

 

Lớp số đo chiều cao (cm) Tần số Tần suất (%)
[150; 156) 3 15%
[156; 162) 8 40%
[162; 168) 6 30%
[168; 174) 3 30%

Chiều cao của 20 học sinh trong một lớp

Mỗi số liệu thống kê của một lớp được thay thế bởi số liệu đại diện của lớp đó.

Các số liệu đại diện lần lượt là: 153; 159; 165; 171.

Số trung bình cộng của bảng trên là \(\overline{x}=\dfrac{3\times153+8\times159+6\times165+3\times171}{20}=161,7.\)

a) Phương sai $s^2$ của bảng trên là

\(s^2=\dfrac{3\left(153-161,7\right)^2+8\left(159-161,7\right)^2+6\left(165-161,7\right)^2+3\left(171-161,7\right)^2}{20}=30,51\quad\left(3\right)\)

Hệ thức (3) biểu thị cách tính gần đúng phương sai của bảng trên theo tần số.

b) Từ (3) ta có 

\(s^2=\dfrac{3}{20}\left(153-161,7\right)^2+\dfrac{8}{20}\left(159-161,7\right)^2+\dfrac{6}{20}\left(165-161,7\right)^2+\dfrac{3}{20}\left(171-161,7\right)^2\)

hay

\(s^2=\dfrac{15}{100}\left(153-161,7\right)^2+\dfrac{40}{400}\left(159-161,7\right)^2+\dfrac{30}{100}\left(165-161,7\right)^2+\dfrac{15}{100}\left(171-161,7\right)^2=30,51\quad\left(4\right)\)

Hệ thức (3) biểu thị cách tính gần đúng phương sai của bảng trên theo tần suất.

Ngoài các cách tính trên, ta còn chứng minh được công thức sau:

\(s^2=\overline{x^2}-\left(\overline{x}\right)^2\)

Trong đó \(\overline{x^2}\) là trung bình cộng của các bình phương số liệu thống kê:

\(\overline{x^2}=\dfrac{1}{n}\left(n_1x_1^2+n_2x_2^2+\ldots+n_kx_k^2\right)=f_1x_1^2+f_2x_2^2+\ldots+f_kx_k^2\)

(đối với bảng phân bố tần số, tần suất)

\(\overline{x^2}=\dfrac{1}{n}\left(n_1c_1^2+n_2c_2^2+\ldots+n_kc_k^2\right)=f_1c_1^2+f_2c_2^2+\ldots+f_kc_k^2\)

(đối với bảng phân bố tần số, tần suất ghép lớp, trong đó \(c_k\) là số liệu đại diện của lớp thứ $k$).

 

@108262480194@

2. Độ lệch chuẩn

Trong ví dụ 2 ở trên, ta đã tính được phương sai của bảng số liệu là \(s^2\approx30,51\). Nếu xét tới đơn vị đo thì ta thấy đơn vị đo của $s^2$ là $cm^2$ (bình phương của đơn vị đo được nghiên cứu): Muốn tránh điều này, có thể dùng căn bậc hai của phương sai, gọi là độ lệch chuẩn, kí hiệu là $s$ (viết tắt của standard deviation).

Vậy, \(s=\sqrt{s^2}=\sqrt{32,1}\approx5,52\left(cm\right)\).

Độ lệch chuẩn cùng với phương sai được dùng để đánh giá độ phân tán của số liệu thống kê (so với số trung bình cộng). Khi cần chú ý đến đơn vị đo ta dùng $s$ vì $s$ có cùng đơn vị với dấu hiệu được nghiên cứu.

Phụ huynh có nhu cầu đăng ký học kèm trực tuyến với giáo viên OLM xem tại đây, hoặc liên hệ: 0966 971 996 (cô Quyên)