Bộ tính toán độ lệch chuẩn

Standard deviation

Chỉ cần dán một danh sách các số, máy tính sẽ trả về giá trị trung bình, phương sai, độ lệch chuẩn (đối với mẫu s sử dụng phân tử là n−1 và đối với quần thể σ sử dụng n), hệ số biến thiên và điểm z cho từng giá trị. Đây là công cụ hữu ích khi bạn muốn đánh giá mức độ phân tán của dữ liệu so với giá trị trung bình – một yếu tố quan trọng trong việc chẩn đoán trước khi thực hiện bất kỳ kiểm định tham số nào.

Cách tính độ lệch chuẩn

  1. 1

    Dán các số của bạn vào đây

    Các mục được phân tách bằng dấu phẩy, khoảng trắng hoặc dòng mới; các mục không phải số sẽ bị bỏ qua.

  2. 2

    Đường trung bình dạng thanh (x-bar) được tính toán.

    Tổng chia cho số lượng.

  3. 3

    Các sai lệch bình phương được cộng lại.

    Tổng của (x − trung bình của các giá trị x)².

  4. 4

    Chia và lấy căn

    Ví dụ: chia cho (n−1), lấy căn bậc hai; đối với quần thể: chia cho n, lấy căn bậc hai.

Mẫu so với quần thể – nên sử dụng phương pháp nào khi nào

Sử dụng quần thể (phân tử n) Sử dụng mẫu (phân tử n−1)
Bạn có toàn bộ quần thể; hoặc bạn có một mẫu được lấy từ một quần thể lớn hơn.
Danh sách đầy đủ nhân viên 20 khách hàng được chọn ngẫu nhiên từ hàng nghìn người
Tất cả 10 lần ném xúc xắc trong một phiên cụ thể Các giá trị đo đạc từ dây chuyền sản xuất

Phân tử n−1 (điều chỉnh Bessel) cho ra một ước lượng không thiên lệch của phương sai quần thể từ dữ liệu mẫu. Khi sử dụng n làm phân tử, người ta sẽ hệ thống đánh giá thấp phương sai thực sự của quần thể. Với số mẫu lớn, sự chênh lệch này giảm dần; tuy nhiên, nó vẫn đáng kể ở các kích thước mẫu nhỏ.

Khái niệm về độ lệch chuẩn

Nếu một tập hợp có giá trị trung bình là 100 và độ lệch chuẩn là 15, thì (giả sử phân bố gần như chuẩn):

Đó là quy tắc 68–95–99,7, còn được gọi là quy tắc thực nghiệm. Các điểm IQ, chiều cao con người và nhiều chỉ số đo lường tự nhiên khác đều tuân thủ chặt chẽ quy tắc này.

Hệ số biến thiên

CV = SD / trung bình. Đây là một chỉ số đo độ phân tán không có đơn vị – rất hữu ích khi so sánh mức độ biến thiên giữa các tập dữ liệu có giá trị trung bình khác nhau. Một giá trị CV bằng 0,1 (10%) có nghĩa là độ lệch chuẩn tương đương khoảng 10% của giá trị trung bình; tuy nhiên, chỉ số này không mang ý nghĩa thực tiễn đối với những dữ liệu có giá trị có thể vượt quá 0.

Điểm Z

Đối với mỗi giá trị x: z = (x − trung bình) / SD, biểu thị số độ lệch chuẩn (SD) so với giá trị đó tính lên hay xuống trung bình. Giá trị |z| > 2 thường được coi là có xu hướng là giá trị ngoại lai; trong dữ liệu chuẩn, trường hợp |z| > 3 rất hiếm gặp.

Các lỗi phổ biến

Câu hỏi thường gặp

Excel có hai hàm: STDEV (dùng với mẫu, với phân tử là n − 1) và STDEVP (dùng với toàn bộ dữ liệu, với phân tử là n). Hãy đảm bảo bạn sử dụng hàm phù hợp với giả định về mẫu hoặc tổng thể mà bạn đang áp dụng.

Đúng vậy – độ lệch chuẩn (SD) sử dụng cùng các đơn vị với các giá trị đo lường của bạn (cm, đô la Mỹ, giây). Độ lệch chuẩn tính bằng bình phương các đơn vị này, vì vậy nó dễ đọc hơn.

Độ lệch chuẩn mẫu được định nghĩa khi n ≥ 2. Khi n ≈ 30 trở xuống, nên sử dụng các khoảng tin cậy xung quanh độ lệch chuẩn hoặc áp dụng một phương pháp thay thế đáng tin cậy hơn.

Độ lệch chuẩn vẫn được định nghĩa như sau: Với tỷ lệ p, độ lệch chuẩn bằng √(p × (1 − p)). Đối với một mẫu có 60% giá trị là 1, độ lệch chuẩn sẽ bằng √(0,6 × 0,4) ≈ 0,49, bất kể số lượng quan sát là bao nhiêu.

Công cụ liên quan