Bài tập — cụm Hypothesis Testing

Đề + đáp án phần lớn lấy từ Schweser 2025 L1 Reading 8 (ghi Schweser answer key); vài bài nhỏ tự dựng để lấp khoảng trống công thức, tự tính tay đã kiểm số học (ghi ví dụ tự dựng). Mỗi bài chốt một node; đây cũng là mầm test cho vòng 2 (mỗi đáp án thành một assert).

Cách dùng: che phần Đáp án, tự giải theo công thức ở concept.md, rồi đối chiếu.

1. Dựng giả thuyết

Bài 1.1 — Đặt null và alternative (ví dụ tự dựng)

Đề: một nhà nghiên cứu tin rằng trung bình lợi nhuận ngày của một danh mục khác 0. Viết $H_{0}$ và $H_{a}$ , và cho biết một hay hai phía.
Cách làm:
- Điều muốn chứng minh ("khác 0") luôn đặt vào $H_{a}$ .
- $H_{0}$ giữ dấu bằng.
- "Khác 0" quan tâm cả hai hướng (lớn hơn hoặc nhỏ hơn 0).
Đáp án: $H_{0} : μ = 0$ ; $H_{a} : μ \neq 0$ → kiểm hai phía.

Bài 1.2 — Một phía (ví dụ tự dựng)

Đề: nhà nghiên cứu giờ chỉ muốn biết trung bình lợi nhuận có lớn hơn 0 hay không. Viết lại giả thuyết và cho biết số phía.
Cách làm: "lớn hơn 0" chỉ quan tâm một hướng → một phía; mệnh đề muốn chứng minh vào $H_{a}$ .
Đáp án: $H_{0} : μ \leq 0$ ; $H_{a} : μ > 0$ → kiểm một phía (đuôi phải).

2. Sai lầm và độ mạnh

Bài 2.1 — Đọc nghĩa hai loại sai lầm (Schweser answer key)

Đề: một kiểm định có xác suất sai lầm loại II là 60% và xác suất sai lầm loại I là 5%. Phát biểu nào đúng?
- A. Độ mạnh là 40%, và có 5% khả năng thống kê vượt giá trị tới hạn.
- B. Có 95% khả năng thống kê nằm giữa hai giá trị tới hạn (nếu hai phía).
- C. Có 5% khả năng bác bỏ $H_{0}$ khi nó thật sự đúng, và xác suất bác bỏ $H_{0}$ khi nó sai là 40%.
Cách làm:
- Loại I = bác bỏ $H_{0}$ đúng → xác suất chính là $α = 5 %$ .
- Độ mạnh = $1 - P (loại II) = 1 - 0.60 = 40 %$ = xác suất bác bỏ $H_{0}$ khi nó sai.
- A và B chỉ đúng khi biết $H_{0}$ đúng/sai cụ thể, không chắc trong mọi tình huống.
Đáp án: C (Schweser answer key).

Bài 2.2 — Tính độ mạnh (Schweser answer key)

Đề: mức ý nghĩa của một kiểm định là 0.05 và xác suất sai lầm loại II là 0.15. Độ mạnh bằng bao nhiêu?
Cách làm: Power $= 1 - P (loại II) = 1 - 0.15$ .
Đáp án: 0.85 (Schweser answer key). Mức ý nghĩa 0.05 là số gây nhiễu, không vào công thức power.

Bài 2.3 — Đánh đổi loại I và loại II (ví dụ tự dựng)

Đề: giữ nguyên cỡ mẫu, hạ mức ý nghĩa từ 5% xuống 1%. Xác suất sai lầm loại II và độ mạnh thay đổi ra sao?
Cách làm: $α$ nhỏ → giá trị tới hạn xa 0 hơn → khó bác bỏ hơn → loại II (bỏ sót) tăng → power giảm.
Đáp án: loại II tăng, độ mạnh giảm. Muốn vừa giảm loại II vừa giữ $α$ thì chỉ còn cách tăng cỡ mẫu.

3. Thống kê kiểm định cho trung bình

Bài 3.1 — z-test một trung bình, mẫu lớn (Schweser answer key)

Đề: lợi nhuận ngày của một danh mục quyền chọn trong 250 ngày: trung bình $\bar{x} = 0.1 %$ , độ lệch chuẩn mẫu $s = 0.25 %$ . Nhà nghiên cứu tin trung bình khác 0. Kiểm ở mức ý nghĩa 5% (hai phía).
Cách làm:
- $H_{0} : μ = 0$ ; $H_{a} : μ \neq 0$ .
- Mẫu 250 rất lớn → z chấp nhận được; giá trị tới hạn hai phía 5% là $\pm 1.96$ .
- Sai số chuẩn $= s / \sqrt{n} = 0.25 / \sqrt{250} = 0.25 / 15.811 = 0.0158 %$ .
- Thống kê $= (0.1 - 0) / 0.0158 = 6.33$ .
Đáp án: test stat $\approx 6.33 > 1.96$ → bác bỏ $H_{0}$ ; trung bình lợi nhuận khác 0 có ý nghĩa thống kê (Schweser answer key).

Bài 3.2 — t-test một trung bình, mẫu nhỏ (ví dụ tự dựng)

Đề: mẫu $n = 25$ lợi nhuận tháng, trung bình $\bar{x} = 1.2 %$ , độ lệch chuẩn mẫu $s = 2.0 %$ . Kiểm $H_{0} : μ = 0$ ở mức 5% (hai phía). Giá trị tới hạn t với $d f = 24$ là $\pm 2.064$ .
Cách làm:
- $σ$ chưa biết + mẫu nhỏ → dùng t, $d f = n - 1 = 24$ .
- Sai số chuẩn $= s / \sqrt{n} = 2.0 / \sqrt{25} = 2.0 / 5 = 0.4 %$ .
- Thống kê $t = (1.2 - 0) / 0.4 = 3.0$ .
Đáp án: $t = 3.0 > 2.064$ → bác bỏ $H_{0}$ ; trung bình lợi nhuận khác 0 ở mức 5% (ví dụ tự dựng).

Bài 3.3 — Sai số chuẩn của trung bình (ví dụ tự dựng)

Đề: $σ = 20 %$ (đã biết), $n = 36$ . Tính sai số chuẩn của trung bình mẫu.
Cách làm: $σ_{\bar{x}} = σ / \sqrt{n} = 20 / \sqrt{36} = 20 / 6$ .
Đáp án: $\approx 3.33 %$ (ví dụ tự dựng). Mẫu lớn gấp 4 lần sẽ làm số này còn một nửa ( $\sqrt{4} = 2$ ).

Bài 3.4 — Chọn loại t-test, độc lập hay cặp đôi (ví dụ tự dựng)

Đề: (a) so lợi nhuận bất thường giữa thâu tóm ngang và thâu tóm dọc (hai nhóm công ty khác nhau); (b) so beta của cùng một nhóm công ty trước và sau bãi bỏ quản chế. Mỗi câu dùng kiểm nào?
Cách làm: mẫu độc lập → kiểm hiệu hai trung bình; mẫu phụ thuộc (cùng đối tượng, hai thời điểm / cùng chịu một yếu tố chung) → kiểm cặp đôi.
Đáp án: (a) hiệu hai trung bình (độc lập); (b) cặp đôi (phụ thuộc, lấy hiệu từng cặp rồi t-test) (ví dụ tự dựng).

Bài 3.5 — Hiệu hai trung bình độc lập (Schweser answer key)

Đề: lợi nhuận bất thường thâu tóm ngang (trung bình 1.0%, lệch 1.0%) so với thâu tóm dọc (trung bình 2.5%, lệch 2.0%), giả định độc lập + phương sai bằng nhau. Thống kê tính được $t = - 5.474$ , $d f = 120$ . Giá trị tới hạn hai phía 5% là $\pm 1.980$ . Kết luận?
Cách làm: so $| t |$ với giá trị tới hạn; $- 5.474$ nằm bên trái $- 1.980$ → rơi vùng bác bỏ.
Đáp án: $- 5.474 < - 1.980$ → bác bỏ $H_{0}$ ; lợi nhuận bất thường khác nhau giữa hai loại thâu tóm (Schweser answer key).

Bài 3.6 — Kiểm cặp đôi (Schweser answer key)

Đề: beta của các công ty viễn thông trước/sau bãi bỏ quản chế (mẫu phụ thuộc). Thống kê $t = 10.26$ trên cỡ mẫu $n = 39$ . Giá trị tới hạn hai phía 5% với $d f = 38$ là $\pm 2.024$ . Có thay đổi beta không?
Cách làm:
- Mẫu phụ thuộc → kiểm cặp đôi, $d f = n - 1 = 38$ .
- $H_{0}$ : trung bình các hiệu $= 0$ (không đổi); hai phía.
- So $10.26$ với $\pm 2.024$ .
Đáp án: $10.26 > 2.024$ → bác bỏ $H_{0}$ ; beta thay đổi có ý nghĩa thống kê (Schweser answer key).

4. Kiểm định phương sai

Bài 4.1 — Chi-square cho một phương sai (Schweser answer key)

Đề: quỹ High-Return quảng cáo lợi nhuận tháng có độ lệch chuẩn $4 %$ (từ dữ liệu 2005–2013). Lấy 24 tháng giai đoạn 2013–2015, đo được độ lệch chuẩn $3.8 %$ . Ở mức ý nghĩa 5% (hai phía), độ lệch chuẩn gần đây có khác mức quảng cáo không?
Cách làm:
- $H_{0} : σ^{2} = (0.04)^{2} = 0.0016$ so với $H_{a} : σ^{2} \neq 0.0016$ → hai phía.
- Thống kê: $χ^{2} = \frac{(n - 1) s^{2}}{σ_{0}^{2}} = \frac{23 \times (0.038)^{2}}{(0.04)^{2}} = 23 \times \frac{0.001444}{0.0016} = 23 \times 0.9025 = 20.76$ .
- Bậc tự do $= n - 1 = 23$ ; hai giá trị tới hạn hai phía 5%: cận dưới $11.689$ , cận trên $38.076$ .
- So sánh: $11.689 < 20.76 < 38.076$ → thống kê nằm TRONG khoảng.
Đáp án: không bác bỏ $H_{0}$ (Schweser answer key) — độ lệch chuẩn gần đây không khác mức quảng cáo $4 %$ một cách có ý nghĩa. Lưu ý chi-square không đối xứng nên phải tra hai cận riêng, khác z/t chỉ một số $\pm$ .

Bài 4.2 — F-test cho hai phương sai (Schweser answer key)

Đề: nghi ngờ phương sai lợi nhuận ngành dệt may khác ngành giấy. Mẫu 31 hãng dệt may có độ lệch chuẩn $$ 4.30$ ; mẫu 41 hãng giấy có độ lệch chuẩn $$ 3.80$ . Ở mức 5% (hai phía), hai phương sai có khác nhau không?
Cách làm:
- $H_{0} : σ_{1}^{2} = σ_{2}^{2}$ so với $H_{a} : σ_{1}^{2} \neq σ_{2}^{2}$ .
- Đặt phương sai lớn lên tử số: $F = \frac{s_{1}^{2}}{s_{2}^{2}} = \frac{(4.30)^{2}}{(3.80)^{2}} = \frac{18.49}{14.44} = 1.2805$ .
- Bậc tự do $(d f_{1}, d f_{2}) = (30, 40)$ ; giá trị tới hạn đuôi phải (2.5% mỗi đuôi) $= 1.94$ .
- So sánh: $1.2805 < 1.94$ .
Đáp án: không bác bỏ $H_{0}$ (Schweser answer key) — phương sai lợi nhuận hai ngành không khác nhau có ý nghĩa ở mức 5%. Mẹo lớn-trên-nhỏ-dưới khiến $F \geq 1$ nên chỉ cần tra một giá trị tới hạn đuôi phải.

5. Quy tắc quyết định và p-value

Bài 5.1 — z-test một phía, đọc bảng (Schweser answer key)

Đề: lợi nhuận của một cổ phiếu trong 36 ngày không liên tiếp, trung bình $\bar{x} = 2.0 %$ , $σ = 20.0 %$ (đã biết). Nói được với độ tin cậy 95% rằng trung bình lớn hơn 0% không?
Cách làm:
- $H_{0} : μ \leq 0$ ; $H_{a} : μ > 0$ → một phía, đuôi phải.
- Mức ý nghĩa $= 1 - 0.95 = 0.05$ ; giá trị tới hạn z một phía 5% $\approx 1.65$ .
- Sai số chuẩn $= 20 / \sqrt{36} = 20 / 6 = 3.333 %$ ; thống kê $z = (2.0 - 0) / 3.333 = 0.60$ .
Đáp án: $z = 0.60 < 1.65$ → không bác bỏ $H_{0}$ ; không kết luận được trung bình lớn hơn 0 (Schweser answer key).

Bài 5.2 — z-test hai phía, đổi độ tin cậy (Schweser answer key)

Đề: cùng dữ liệu bài 4.1, giờ hỏi với độ tin cậy 99% rằng lợi nhuận khác 0% không.
Cách làm:
- $H_{0} : μ = 0$ ; $H_{a} : μ \neq 0$ → hai phía.
- Mức ý nghĩa $= 1 - 0.99 = 0.01$ ; mỗi đuôi 0.005 → giá trị tới hạn z $\approx 2.58$ .
- Thống kê vẫn là $z = (2.0 - 0) / (20 / 6) = 0.60$ .
Đáp án: $0.60 < 2.58$ → không bác bỏ $H_{0}$ ; lợi nhuận coi như bằng 0 ở mức này (Schweser answer key).

Bài 5.3 — Đọc p-value (ví dụ tự dựng)

Đề: một phép kiểm cho ra p-value $= 0.03$ . Quyết định gì ở mức ý nghĩa 5%? Còn ở mức 1%?
Cách làm: quy tắc $p < α$ thì bác bỏ.
Đáp án: ở 5%: $0.03 < 0.05$ → bác bỏ $H_{0}$ ; ở 1%: $0.03 > 0.01$ → không bác bỏ. Cùng dữ liệu, ngưỡng khắt khe hơn cho kết luận ngược — đó là lý do p-value tiện hơn (mỗi người tự so với $α$ riêng) (ví dụ tự dựng).

Bài tập — cụm Hypothesis Testing ​

1. Dựng giả thuyết ​

Bài 1.1 — Đặt null và alternative (ví dụ tự dựng) ​

Bài 1.2 — Một phía (ví dụ tự dựng) ​

2. Sai lầm và độ mạnh ​

Bài 2.1 — Đọc nghĩa hai loại sai lầm (Schweser answer key) ​

Bài 2.2 — Tính độ mạnh (Schweser answer key) ​

Bài 2.3 — Đánh đổi loại I và loại II (ví dụ tự dựng) ​

3. Thống kê kiểm định cho trung bình ​

Bài 3.1 — z-test một trung bình, mẫu lớn (Schweser answer key) ​

Bài 3.2 — t-test một trung bình, mẫu nhỏ (ví dụ tự dựng) ​

Bài 3.3 — Sai số chuẩn của trung bình (ví dụ tự dựng) ​

Bài 3.4 — Chọn loại t-test, độc lập hay cặp đôi (ví dụ tự dựng) ​

Bài 3.5 — Hiệu hai trung bình độc lập (Schweser answer key) ​

Bài 3.6 — Kiểm cặp đôi (Schweser answer key) ​

4. Kiểm định phương sai ​

Bài 4.1 — Chi-square cho một phương sai (Schweser answer key) ​

Bài 4.2 — F-test cho hai phương sai (Schweser answer key) ​

5. Quy tắc quyết định và p-value ​

Bài 5.1 — z-test một phía, đọc bảng (Schweser answer key) ​

Bài 5.2 — z-test hai phía, đổi độ tin cậy (Schweser answer key) ​

Bài 5.3 — Đọc p-value (ví dụ tự dựng) ​