Skip to content

Bài tập — cụm Simple Linear Regression

Bài lấy từ Schweser 2025 L1 Reading 10 ghi (Schweser answer key) — số có thật trong text nguồn. Các bài tính phân rã SST/SSR/SSE/R2/SEE/F dùng ví dụ tự dựng (bảng ANOVA của Schweser nằm trong ảnh, pdftotext không lấy được số) — số tự tính, tự kiểm, ghi rõ (ví dụ tự dựng). Đây cũng là mầm test cho vòng 2 (mỗi đáp án thành một assert).

Cách dùng: che phần Đáp án, tự giải theo công thức ở concept.md, rồi đối chiếu.


1. Đường khớp OLS

Bài 1.1 — Đọc nghĩa hệ số (Schweser answer key)

  • Đề: hồi quy lợi nhuận vượt trội của cổ phiếu ABC (Y) lên lợi nhuận vượt trội của S&P 500 (X) trên 36 tháng cho đường khớp: hệ số chặn 2.3%, độ dốc 0.64. Đọc nghĩa từng hệ số.
  • Cách làm:
    • Hệ số chặn = Y dự báo khi X bằng 0.
    • Độ dốc = Y đổi bao nhiêu cho mỗi 1 đơn vị X tăng.
  • Đáp án:
    • Độ dốc 0.64: khi lợi nhuận vượt trội S&P 500 tăng (giảm) 1%, lợi nhuận vượt trội ABC dự báo tăng (giảm) 0.64%. Vì độ dốc < 1 nên ABC ít nhạy hơn thị trường (beta < 1, rủi ro hệ thống dưới trung bình).
    • Hệ số chặn 2.3%: khi lợi nhuận vượt trội S&P 500 bằng 0, lợi nhuận ABC dự báo là 2.3%.

Bài 1.2 — Phần dư của một quan sát (Schweser answer key)

  • Đề: tháng 5/20X4 có lợi nhuận vượt trội S&P 500 là 7.8% và ABC thực tế là 1.1%. Đường khớp ở bài 1.1. Tính giá trị dự báo và phần dư tháng đó.
  • Cách làm:
    • Dự báo: Y^=2.3%+0.64×(7.8%).
    • Phần dư: thực tế trừ dự báo.
  • Đáp án:
    • Dự báo =2.3+0.64×(7.8)=7.3%.
    • Phần dư =1.1%(7.3%)=8.4% — mô hình dự báo thấp hơn thực tế 8.4 điểm phần trăm ở tháng này.

3. Phân rã biến thiên + đo độ khớp

Bốn bài dưới dùng chung một bộ dữ liệu tự dựng để chạy trọn vẹn phân rã ANOVA bằng tay (số tròn để kiểm dễ).

Dữ liệu 5 quan sát, X = lợi nhuận vượt trội thị trường (%), Y = lợi nhuận vượt trội cổ phiếu (%):

Quan sátXY
101
212
322
435
545

Trung bình: X¯=2, Y¯=3.

Bài 3.1 — Độ dốc và hệ số chặn (ví dụ tự dựng)

  • Cách làm:
    • Sai lệch X tới X¯=2: 2,1,0,1,2. Sai lệch Y tới Y¯=3: 2,1,1,2,2.
    • Tử số (hiệp phương sai chưa chia): (XX¯)(YY¯)=4+1+0+2+4=11.
    • Mẫu số (phương sai X chưa chia): (XX¯)2=4+1+0+1+4=10.
    • Độ dốc: b^1=11/10=1.1.
    • Hệ số chặn: b^0=Y¯b^1X¯=31.1×2=0.8.
  • Đáp án: b^1=1.1, b^0=0.8 → đường khớp Y^=0.8+1.1X. Độ dốc > 1 nên cổ phiếu này nhạy hơn thị trường (beta > 1).

Bài 3.2 — Phân rã SST, SSR, SSE (ví dụ tự dựng)

  • Cách làm:
    • Giá trị dự báo Y^=0.8+1.1X cho X = 0..4: 0.8,1.9,3.0,4.1,5.2.
    • SST =(YY¯)2=(2)2+(1)2+(1)2+22+22=4+1+1+4+4=14.
    • SSR =(Y^Y¯)2=(0.83)2+(1.93)2+(33)2+(4.13)2+(5.23)2=4.84+1.21+0+1.21+4.84=12.1.
    • SSE =(YY^)2=(10.8)2+(21.9)2+(23)2+(54.1)2+(55.2)2=0.04+0.01+1+0.81+0.04=1.9.
  • Đáp án: SST =14, SSR =12.1, SSE =1.9. Kiểm tra phân rã: $12.1 + 1.9 = 14 = $ SST → khớp.

Bài 3.3 — Hệ số xác định và sai số chuẩn ước lượng (ví dụ tự dựng)

  • Cách làm:
    • R2=SSR/SST=12.1/14.
    • Bậc tự do =n2=52=3.
    • SEE=SSE/(n2)=1.9/3.
  • Đáp án:
    • R2=12.1/14=0.864 → X giải thích được 86.4% biến thiên của Y.
    • SEE=0.6333=0.796% → sai số dự báo điển hình khoảng 0.8 điểm phần trăm.
    • Kiểm chéo: tương quan r=R2=0.864=0.93, và r2=0.864 đúng bằng R2 (mẹo hồi quy đơn).

Bài 3.4 — Thống kê F (ví dụ tự dựng)

  • Cách làm:
    • MSR =SSR/1=12.1 (hồi quy đơn nên MSR = SSR).
    • MSE =SSE/(n2)=1.9/3=0.6333.
    • F=MSR/MSE=12.1/0.6333.
  • Đáp án: F=19.1 với bậc tự do (1,3). F lớn = phần X giải thích lấn át phần sót → độ dốc có ý nghĩa. Kiểm chéo: F=19.1=4.37, đúng bằng thống kê t của độ dốc ở bài 4.2 (quan hệ t=F trong hồi quy đơn).

4. Kiểm định độ dốc

Bài 4.1 — t-test độ dốc với sai số chuẩn cho sẵn (Schweser answer key)

  • Đề: độ dốc ABC ước lượng 0.64, sai số chuẩn của độ dốc 0.26, mẫu 36 quan sát. Kiểm tra độ dốc có khác 0 ở mức ý nghĩa 5% không.
  • Cách làm:
    • H0:b1=0 vs Ha:b10 (hai phía).
    • t=(b^10)/sb^1=0.64/0.26.
    • Bậc tự do =362=34; t tới hạn hai phía ±2.03.
  • Đáp án: t=0.64/0.26=2.46. Vì 2.46>2.03 → bác H0 → độ dốc khác 0 có ý nghĩa → S&P 500 thật sự giải thích lợi nhuận ABC.

Bài 4.2 — t-test độ dốc từ ví dụ tự dựng (ví dụ tự dựng)

  • Đề: dùng bộ dữ liệu nhóm 3 (độ dốc 1.1). Sai số chuẩn của độ dốc tính bằng sb^1=SEE/(XX¯)2. Kiểm tra độ dốc khác 0 ở mức 5%.
  • Cách làm:
    • sb^1=0.796/10=0.796/3.162=0.252.
    • t=1.1/0.252=4.37, bậc tự do =52=3.
    • t tới hạn hai phía mức 5%, df = 3 là ±3.18.
  • Đáp án: t=4.37>3.18 → bác H0 → độ dốc khác 0 có ý nghĩa. Khớp với F=4.37 ở bài 3.4 (mẫu nhỏ nên ngưỡng tới hạn lớn, nhưng vẫn qua).

5. Dự báo + khoảng tin

Bài 5.1 — Giá trị dự báo (Schweser answer key)

  • Đề: đường khớp ABC Y^=2.3%+0.64X. Dự báo lợi nhuận vượt trội ABC nếu dự báo lợi nhuận vượt trội S&P 500 là 10%.
  • Cách làm: cắm Xp=10 vào phương trình: 2.3+0.64×10.
  • Đáp án: Y^p=2.3+6.4=4.1%.

Bài 5.2 — Khoảng dự báo 95% (Schweser answer key)

  • Đề: từ bài 5.1, sai số chuẩn của dự báo sf=3.67, mẫu 36 quan sát. Tính khoảng dự báo 95%.
  • Cách làm:
    • Bậc tự do =362=34; t tới hạn hai phía mức 5%2.03.
    • Khoảng: Y^p±tcsf=4.1±2.03×3.67.
    • 2.03×3.67=7.45.
  • Đáp án: 4.1%±7.45% → khoảng 3.4% tới 11.6%. Đọc: với S&P 500 dự báo 10%, ta tin 95% rằng lợi nhuận ABC rơi vào khoảng 3.4% đến 11.6% — dải khá rộng, nhắc rằng một con số dự báo điểm trần (4.1%) che giấu sai số lớn.

Bài 5.3 — Khoảng tin từ mô hình mẫu lớn (Schweser answer key)

  • Đề: mô hình Y=5+3.5X (mẫu lớn), sai số chuẩn dự báo sf=2.5, sai số chuẩn độ dốc 0.8. Tính khoảng tin 90% cho Y khi X=10.
  • Cách làm:
    • Dự báo điểm: Y^p=5+3.5×10=40.
    • Mẫu lớn → t tới hạn hai phía mức 10% xấp xỉ z =1.645.
    • Khoảng: 40±1.645×2.5=40±4.11. (Dùng sf=2.5, KHÔNG dùng sai số chuẩn độ dốc 0.8 — đó là bẫy của câu hỏi.)
  • Đáp án: 40±4.11 → khoảng 35.9 tới 44.1 (đáp án C của Module Quiz 10.3).