Skip to content

Bài tập — cụm Hypothesis Testing

Đề + đáp án phần lớn lấy từ Schweser 2025 L1 Reading 8 (ghi Schweser answer key); vài bài nhỏ tự dựng để lấp khoảng trống công thức, tự tính tay đã kiểm số học (ghi ví dụ tự dựng). Mỗi bài chốt một node; đây cũng là mầm test cho vòng 2 (mỗi đáp án thành một assert).

Cách dùng: che phần Đáp án, tự giải theo công thức ở concept.md, rồi đối chiếu.


1. Dựng giả thuyết

Bài 1.1 — Đặt null và alternative (ví dụ tự dựng)

  • Đề: một nhà nghiên cứu tin rằng trung bình lợi nhuận ngày của một danh mục khác 0. Viết H0Ha, và cho biết một hay hai phía.
  • Cách làm:
    • Điều muốn chứng minh ("khác 0") luôn đặt vào Ha.
    • H0 giữ dấu bằng.
    • "Khác 0" quan tâm cả hai hướng (lớn hơn hoặc nhỏ hơn 0).
  • Đáp án: H0:μ=0; Ha:μ0 → kiểm hai phía.

Bài 1.2 — Một phía (ví dụ tự dựng)

  • Đề: nhà nghiên cứu giờ chỉ muốn biết trung bình lợi nhuận có lớn hơn 0 hay không. Viết lại giả thuyết và cho biết số phía.
  • Cách làm: "lớn hơn 0" chỉ quan tâm một hướng → một phía; mệnh đề muốn chứng minh vào Ha.
  • Đáp án: H0:μ0; Ha:μ>0 → kiểm một phía (đuôi phải).

2. Sai lầm và độ mạnh

Bài 2.1 — Đọc nghĩa hai loại sai lầm (Schweser answer key)

  • Đề: một kiểm định có xác suất sai lầm loại II là 60% và xác suất sai lầm loại I là 5%. Phát biểu nào đúng?
    • A. Độ mạnh là 40%, và có 5% khả năng thống kê vượt giá trị tới hạn.
    • B. Có 95% khả năng thống kê nằm giữa hai giá trị tới hạn (nếu hai phía).
    • C. Có 5% khả năng bác bỏ H0 khi nó thật sự đúng, và xác suất bác bỏ H0 khi nó sai là 40%.
  • Cách làm:
    • Loại I = bác bỏ H0 đúng → xác suất chính là α=5%.
    • Độ mạnh = 1P(loại II)=10.60=40% = xác suất bác bỏ H0 khi nó sai.
    • A và B chỉ đúng khi biết H0 đúng/sai cụ thể, không chắc trong mọi tình huống.
  • Đáp án: C (Schweser answer key).

Bài 2.2 — Tính độ mạnh (Schweser answer key)

  • Đề: mức ý nghĩa của một kiểm định là 0.05 và xác suất sai lầm loại II là 0.15. Độ mạnh bằng bao nhiêu?
  • Cách làm: Power =1P(loại II)=10.15.
  • Đáp án: 0.85 (Schweser answer key). Mức ý nghĩa 0.05 là số gây nhiễu, không vào công thức power.

Bài 2.3 — Đánh đổi loại I và loại II (ví dụ tự dựng)

  • Đề: giữ nguyên cỡ mẫu, hạ mức ý nghĩa từ 5% xuống 1%. Xác suất sai lầm loại II và độ mạnh thay đổi ra sao?
  • Cách làm: α nhỏ → giá trị tới hạn xa 0 hơn → khó bác bỏ hơn → loại II (bỏ sót) tăng → power giảm.
  • Đáp án: loại II tăng, độ mạnh giảm. Muốn vừa giảm loại II vừa giữ α thì chỉ còn cách tăng cỡ mẫu.

3. Thống kê kiểm định cho trung bình

Bài 3.1 — z-test một trung bình, mẫu lớn (Schweser answer key)

  • Đề: lợi nhuận ngày của một danh mục quyền chọn trong 250 ngày: trung bình x¯=0.1%, độ lệch chuẩn mẫu s=0.25%. Nhà nghiên cứu tin trung bình khác 0. Kiểm ở mức ý nghĩa 5% (hai phía).
  • Cách làm:
    • H0:μ=0; Ha:μ0.
    • Mẫu 250 rất lớn → z chấp nhận được; giá trị tới hạn hai phía 5% là ±1.96.
    • Sai số chuẩn =s/n=0.25/250=0.25/15.811=0.0158%.
    • Thống kê =(0.10)/0.0158=6.33.
  • Đáp án: test stat 6.33>1.96bác bỏ H0; trung bình lợi nhuận khác 0 có ý nghĩa thống kê (Schweser answer key).

Bài 3.2 — t-test một trung bình, mẫu nhỏ (ví dụ tự dựng)

  • Đề: mẫu n=25 lợi nhuận tháng, trung bình x¯=1.2%, độ lệch chuẩn mẫu s=2.0%. Kiểm H0:μ=0 ở mức 5% (hai phía). Giá trị tới hạn t với df=24±2.064.
  • Cách làm:
    • σ chưa biết + mẫu nhỏ → dùng t, df=n1=24.
    • Sai số chuẩn =s/n=2.0/25=2.0/5=0.4%.
    • Thống kê t=(1.20)/0.4=3.0.
  • Đáp án: t=3.0>2.064bác bỏ H0; trung bình lợi nhuận khác 0 ở mức 5% (ví dụ tự dựng).

Bài 3.3 — Sai số chuẩn của trung bình (ví dụ tự dựng)

  • Đề: σ=20% (đã biết), n=36. Tính sai số chuẩn của trung bình mẫu.
  • Cách làm: σx¯=σ/n=20/36=20/6.
  • Đáp án: 3.33% (ví dụ tự dựng). Mẫu lớn gấp 4 lần sẽ làm số này còn một nửa (4=2).

Bài 3.4 — Chọn loại t-test, độc lập hay cặp đôi (ví dụ tự dựng)

  • Đề: (a) so lợi nhuận bất thường giữa thâu tóm ngang và thâu tóm dọc (hai nhóm công ty khác nhau); (b) so beta của cùng một nhóm công ty trước và sau bãi bỏ quản chế. Mỗi câu dùng kiểm nào?
  • Cách làm: mẫu độc lập → kiểm hiệu hai trung bình; mẫu phụ thuộc (cùng đối tượng, hai thời điểm / cùng chịu một yếu tố chung) → kiểm cặp đôi.
  • Đáp án: (a) hiệu hai trung bình (độc lập); (b) cặp đôi (phụ thuộc, lấy hiệu từng cặp rồi t-test) (ví dụ tự dựng).

Bài 3.5 — Hiệu hai trung bình độc lập (Schweser answer key)

  • Đề: lợi nhuận bất thường thâu tóm ngang (trung bình 1.0%, lệch 1.0%) so với thâu tóm dọc (trung bình 2.5%, lệch 2.0%), giả định độc lập + phương sai bằng nhau. Thống kê tính được t=5.474, df=120. Giá trị tới hạn hai phía 5% là ±1.980. Kết luận?
  • Cách làm: so |t| với giá trị tới hạn; 5.474 nằm bên trái 1.980 → rơi vùng bác bỏ.
  • Đáp án: 5.474<1.980bác bỏ H0; lợi nhuận bất thường khác nhau giữa hai loại thâu tóm (Schweser answer key).

Bài 3.6 — Kiểm cặp đôi (Schweser answer key)

  • Đề: beta của các công ty viễn thông trước/sau bãi bỏ quản chế (mẫu phụ thuộc). Thống kê t=10.26 trên cỡ mẫu n=39. Giá trị tới hạn hai phía 5% với df=38±2.024. Có thay đổi beta không?
  • Cách làm:
    • Mẫu phụ thuộc → kiểm cặp đôi, df=n1=38.
    • H0: trung bình các hiệu =0 (không đổi); hai phía.
    • So 10.26 với ±2.024.
  • Đáp án: 10.26>2.024bác bỏ H0; beta thay đổi có ý nghĩa thống kê (Schweser answer key).

4. Kiểm định phương sai

Bài 4.1 — Chi-square cho một phương sai (Schweser answer key)

  • Đề: quỹ High-Return quảng cáo lợi nhuận tháng có độ lệch chuẩn 4% (từ dữ liệu 2005–2013). Lấy 24 tháng giai đoạn 2013–2015, đo được độ lệch chuẩn 3.8%. Ở mức ý nghĩa 5% (hai phía), độ lệch chuẩn gần đây có khác mức quảng cáo không?
  • Cách làm:
    • H0:σ2=(0.04)2=0.0016 so với Ha:σ20.0016 → hai phía.
    • Thống kê: χ2=(n1)s2σ02=23×(0.038)2(0.04)2=23×0.0014440.0016=23×0.9025=20.76.
    • Bậc tự do =n1=23; hai giá trị tới hạn hai phía 5%: cận dưới 11.689, cận trên 38.076.
    • So sánh: 11.689<20.76<38.076 → thống kê nằm TRONG khoảng.
  • Đáp án: không bác bỏ H0 (Schweser answer key) — độ lệch chuẩn gần đây không khác mức quảng cáo 4% một cách có ý nghĩa. Lưu ý chi-square không đối xứng nên phải tra hai cận riêng, khác z/t chỉ một số ±.

Bài 4.2 — F-test cho hai phương sai (Schweser answer key)

  • Đề: nghi ngờ phương sai lợi nhuận ngành dệt may khác ngành giấy. Mẫu 31 hãng dệt may có độ lệch chuẩn $4.30; mẫu 41 hãng giấy có độ lệch chuẩn $3.80. Ở mức 5% (hai phía), hai phương sai có khác nhau không?
  • Cách làm:
    • H0:σ12=σ22 so với Ha:σ12σ22.
    • Đặt phương sai lớn lên tử số: F=s12s22=(4.30)2(3.80)2=18.4914.44=1.2805.
    • Bậc tự do (df1,df2)=(30,40); giá trị tới hạn đuôi phải (2.5% mỗi đuôi) =1.94.
    • So sánh: 1.2805<1.94.
  • Đáp án: không bác bỏ H0 (Schweser answer key) — phương sai lợi nhuận hai ngành không khác nhau có ý nghĩa ở mức 5%. Mẹo lớn-trên-nhỏ-dưới khiến F1 nên chỉ cần tra một giá trị tới hạn đuôi phải.

5. Quy tắc quyết định và p-value

Bài 5.1 — z-test một phía, đọc bảng (Schweser answer key)

  • Đề: lợi nhuận của một cổ phiếu trong 36 ngày không liên tiếp, trung bình x¯=2.0%, σ=20.0% (đã biết). Nói được với độ tin cậy 95% rằng trung bình lớn hơn 0% không?
  • Cách làm:
    • H0:μ0; Ha:μ>0 → một phía, đuôi phải.
    • Mức ý nghĩa =10.95=0.05; giá trị tới hạn z một phía 5% 1.65.
    • Sai số chuẩn =20/36=20/6=3.333%; thống kê z=(2.00)/3.333=0.60.
  • Đáp án: z=0.60<1.65không bác bỏ H0; không kết luận được trung bình lớn hơn 0 (Schweser answer key).

Bài 5.2 — z-test hai phía, đổi độ tin cậy (Schweser answer key)

  • Đề: cùng dữ liệu bài 4.1, giờ hỏi với độ tin cậy 99% rằng lợi nhuận khác 0% không.
  • Cách làm:
    • H0:μ=0; Ha:μ0 → hai phía.
    • Mức ý nghĩa =10.99=0.01; mỗi đuôi 0.005 → giá trị tới hạn z 2.58.
    • Thống kê vẫn là z=(2.00)/(20/6)=0.60.
  • Đáp án: 0.60<2.58không bác bỏ H0; lợi nhuận coi như bằng 0 ở mức này (Schweser answer key).

Bài 5.3 — Đọc p-value (ví dụ tự dựng)

  • Đề: một phép kiểm cho ra p-value =0.03. Quyết định gì ở mức ý nghĩa 5%? Còn ở mức 1%?
  • Cách làm: quy tắc p<α thì bác bỏ.
  • Đáp án: ở 5%: 0.03<0.05bác bỏ H0; ở 1%: 0.03>0.01không bác bỏ. Cùng dữ liệu, ngưỡng khắt khe hơn cho kết luận ngược — đó là lý do p-value tiện hơn (mỗi người tự so với α riêng) (ví dụ tự dựng).