Máy tính ANOVA

Thống kê F

Dán hai hoặc nhiều nhóm số và máy tính sẽ chạy ANOVA một nhân tố để kiểm tra liệu trung bình các nhóm có khác biệt đáng kể hay không. Nó trả về thống kê F, bậc tự do, p-value và kích thước hiệu ứng eta-squared — các đầu ra chuẩn mà bất kỳ bài thống kê hoặc báo cáo phòng thí nghiệm nào cũng sẽ trích dẫn.

Cách chạy ANOVA một nhân tố

  1. 1

    Nhập dữ liệu nhóm

    Dán mỗi nhóm dưới dạng danh sách phân tách bằng dấu phẩy hoặc xuống dòng. Tối thiểu hai nhóm; nên có ít nhất 3-5 quan sát mỗi nhóm.

  2. 2

    Kiểm tra giả định

    ANOVA một nhân tố giả định phần dư phân phối chuẩn và phương sai giữa các nhóm tương đối bằng nhau. Hãy đánh dấu nếu các nhóm có độ phân tán rất khác nhau.

  3. 3

    Đọc thống kê F

    F là tỷ số giữa phương sai giữa nhóm và phương sai trong nhóm. F càng lớn nghĩa là bằng chứng về khác biệt giữa nhóm càng mạnh.

  4. 4

    Diễn giải p-value

    Nếu thấp hơn alpha bạn chọn (thường là 0.05), bác bỏ giả thuyết không rằng mọi trung bình nhóm đều bằng nhau. ANOVA không cho biết nhóm nào khác nhau — hãy dùng kiểm định hậu nghiệm cho việc đó.

Bảng ANOVA

Nguồn SS (tổng bình phương) df MS (trung bình bình phương) F
Giữa các nhóm SSB k - 1 MSB = SSB/(k-1) MSB/MSW
Trong các nhóm SSW N - k MSW = SSW/(N-k)
Tổng SST = SSB + SSW N - 1

Trong đó k = số nhóm, N = tổng số quan sát.

Giá trị tới hạn phân phối F (alpha = 0.05)

df1 \ df2 10 20 30 60 120
2 4.10 3.49 3.32 3.15 3.07
3 3.71 3.10 2.92 2.76 2.68
4 3.48 2.87 2.69 2.53 2.45
5 3.33 2.71 2.53 2.37 2.29

Nếu F tính được lớn hơn giá trị trong bảng cho df1 (= k-1) và df2 (= N-k), hãy bác bỏ giả thuyết không ở p < 0.05.

Giả định cần xác minh trước khi trích dẫn ANOVA

  1. Độc lập của các quan sát trong và giữa các nhóm.
  2. Tính chuẩn của phần dư (kiểm định Shapiro-Wilk, hoặc trực quan: biểu đồ Q-Q).
  3. Đồng nhất phương sai (kiểm định Levene, hoặc quy tắc kinh nghiệm: SD lớn nhất nhỏ hơn 2× SD nhỏ nhất).

Nếu tính chuẩn không đạt: kiểm định Kruskal-Wallis là lựa chọn phi tham số thay thế. Nếu đồng nhất phương sai không đạt: Welch's ANOVA xử lý phương sai không bằng nhau.

Sau một ANOVA có ý nghĩa: kiểm định hậu nghiệm

ANOVA một nhân tố cho biết một số nhóm khác nhau nhưng không cho biết nhóm nào. Tiếp tục với:

  • Tukey HSD — thận trọng, kiểm soát tỷ lệ sai lầm toàn nhóm so sánh.
  • Bonferroni — điều chỉnh đơn giản: α / số phép so sánh.
  • Scheffé — linh hoạt nhưng lực kiểm định thấp; tốt cho phân tích khám phá.
  • Dunnett — chỉ so sánh từng nhóm điều trị với nhóm chứng.

Kích thước hiệu ứng

Một p-value có ý nghĩa nói rằng “có khác biệt.” Kích thước hiệu ứng nói “khác biệt lớn đến đâu.” Báo cáo eta-squared (η²) = SSB / SST. Hướng dẫn nhanh: 0.01 nhỏ, 0.06 trung bình, 0.14 lớn.

Câu hỏi thường gặp

Khi bạn có ba nhóm trở lên. Chạy nhiều kiểm định t làm tăng tỷ lệ sai lầm loại I trên toàn nhóm so sánh (α là 0.05 trên ba kiểm định cặp có thể thành khoảng 0.14). ANOVA giữ mức ý nghĩa alpha tổng thể ở 0.05.

Một nhân tố có một yếu tố phân nhóm duy nhất (ví dụ loại điều trị). Hai nhân tố có hai yếu tố (ví dụ điều trị × giới tính) và có thể kiểm tra hiệu ứng chính cùng tương tác. Máy tính này xử lý trường hợp một nhân tố.

Về thống kê thì không — chúng gần như giống hệt. Ngưỡng 0.05 là quy ước, không phải hằng số vật lý. Hãy báo cáo p-value chính xác và kích thước hiệu ứng để người đọc tự đánh giá, thay vì xem 0.05 như một đường cắt sắc.

Mẫu nhỏ tạo ra giá trị F kém ổn định. F rất lớn với n=3 mỗi nhóm là gợi ý đáng chú ý nhưng nên được lặp lại. Hãy báo cáo khoảng tin cậy quanh trung bình nhóm cùng với F.

Công cụ liên quan