Bộ tính toán độ lệch chuẩn
Chỉ cần dán một danh sách các số, máy tính sẽ trả về giá trị trung bình, phương sai, độ lệch chuẩn (đối với mẫu s sử dụng phân tử là n−1 và đối với quần thể σ sử dụng n), hệ số biến thiên và điểm z cho từng giá trị. Đây là công cụ hữu ích khi bạn muốn đánh giá mức độ phân tán của dữ liệu so với giá trị trung bình – một yếu tố quan trọng trong việc chẩn đoán trước khi thực hiện bất kỳ kiểm định tham số nào.
Cách tính độ lệch chuẩn
-
1
Dán các số của bạn vào đây
Các mục được phân tách bằng dấu phẩy, khoảng trắng hoặc dòng mới; các mục không phải số sẽ bị bỏ qua.
-
2
Đường trung bình dạng thanh (x-bar) được tính toán.
Tổng chia cho số lượng.
-
3
Các sai lệch bình phương được cộng lại.
Tổng của (x − trung bình của các giá trị x)².
-
4
Chia và lấy căn
Ví dụ: chia cho (n−1), lấy căn bậc hai; đối với quần thể: chia cho n, lấy căn bậc hai.
Mẫu so với quần thể – nên sử dụng phương pháp nào khi nào
| Sử dụng quần thể (phân tử n) | Sử dụng mẫu (phân tử n−1) |
|---|---|
| Bạn có toàn bộ quần thể; hoặc bạn có một mẫu được lấy từ một quần thể lớn hơn. | |
| Danh sách đầy đủ nhân viên | 20 khách hàng được chọn ngẫu nhiên từ hàng nghìn người |
| Tất cả 10 lần ném xúc xắc trong một phiên cụ thể | Các giá trị đo đạc từ dây chuyền sản xuất |
Phân tử n−1 (điều chỉnh Bessel) cho ra một ước lượng không thiên lệch của phương sai quần thể từ dữ liệu mẫu. Khi sử dụng n làm phân tử, người ta sẽ hệ thống đánh giá thấp phương sai thực sự của quần thể. Với số mẫu lớn, sự chênh lệch này giảm dần; tuy nhiên, nó vẫn đáng kể ở các kích thước mẫu nhỏ.
Khái niệm về độ lệch chuẩn
Nếu một tập hợp có giá trị trung bình là 100 và độ lệch chuẩn là 15, thì (giả sử phân bố gần như chuẩn):
- 68% các giá trị nằm trong khoảng từ 85 đến 115 (1 độ lệch chuẩn)
- 95% trong khoảng từ 70 đến 130 (2 SD)
- 99,7% trong khoảng từ 55 đến 145 (3 SD)
Đó là quy tắc 68–95–99,7, còn được gọi là quy tắc thực nghiệm. Các điểm IQ, chiều cao con người và nhiều chỉ số đo lường tự nhiên khác đều tuân thủ chặt chẽ quy tắc này.
Hệ số biến thiên
CV = SD / trung bình. Đây là một chỉ số đo độ phân tán không có đơn vị – rất hữu ích khi so sánh mức độ biến thiên giữa các tập dữ liệu có giá trị trung bình khác nhau. Một giá trị CV bằng 0,1 (10%) có nghĩa là độ lệch chuẩn tương đương khoảng 10% của giá trị trung bình; tuy nhiên, chỉ số này không mang ý nghĩa thực tiễn đối với những dữ liệu có giá trị có thể vượt quá 0.
Điểm Z
Đối với mỗi giá trị x: z = (x − trung bình) / SD, biểu thị số độ lệch chuẩn (SD) so với giá trị đó tính lên hay xuống trung bình. Giá trị |z| > 2 thường được coi là có xu hướng là giá trị ngoại lai; trong dữ liệu chuẩn, trường hợp |z| > 3 rất hiếm gặp.
Các lỗi phổ biến
- Sử dụng dữ liệu quần thể thay vì mẫu khi cần sử dụng mẫu. Điều này làm giảm đánh giá mức độ biến thiên trong tập dữ liệu mẫu. – Kết hợp giá trị trung bình và độ lệch chuẩn từ các đơn vị khác nhau. Luôn kiểm tra thang đo. – Áp dụng các quy tắc phân phối chuẩn cho dữ liệu không tuân theo phân phối chuẩn: Dữ liệu lệch hoặc đa cực có thể làm sai lệch nguyên tắc nhận biết phổ biến 68–95–99,7. Hãy vẽ biểu đồ histogram trước tiên. – Bỏ qua các giá trị ngoại lai: Một giá trị cực đoan có thể làm tăng độ lệch chuẩn (SD) lên gấp ba lần. Đối với dữ liệu có đuôi nặng, có các phương pháp thay thế đáng tin cậy hơn như độ lệch tuyệt đối trung vị hoặc khoảng tứ phân vị.
Câu hỏi thường gặp
Excel có hai hàm: STDEV (dùng với mẫu, với phân tử là n − 1) và STDEVP (dùng với toàn bộ dữ liệu, với phân tử là n). Hãy đảm bảo bạn sử dụng hàm phù hợp với giả định về mẫu hoặc tổng thể mà bạn đang áp dụng.
Đúng vậy – độ lệch chuẩn (SD) sử dụng cùng các đơn vị với các giá trị đo lường của bạn (cm, đô la Mỹ, giây). Độ lệch chuẩn tính bằng bình phương các đơn vị này, vì vậy nó dễ đọc hơn.
Độ lệch chuẩn mẫu được định nghĩa khi n ≥ 2. Khi n ≈ 30 trở xuống, nên sử dụng các khoảng tin cậy xung quanh độ lệch chuẩn hoặc áp dụng một phương pháp thay thế đáng tin cậy hơn.
Độ lệch chuẩn vẫn được định nghĩa như sau: Với tỷ lệ p, độ lệch chuẩn bằng √(p × (1 − p)). Đối với một mẫu có 60% giá trị là 1, độ lệch chuẩn sẽ bằng √(0,6 × 0,4) ≈ 0,49, bất kể số lượng quan sát là bao nhiêu.
Công cụ liên quan
Máy tính tuổi
Tính tuổi chính xác theo năm, tháng và ngày từ ngày sinh, kèm tổng số ngày, giờ và đếm ngược đến sinh nhật kế tiếp.
Máy tính BMI
Tính body mass index từ chiều cao và cân nặng. Hiển thị phân loại WHO, khoảng cân nặng khỏe mạnh và giới hạn của BMI.
Máy tính BMR
Ước tính basal metabolic rate — lượng calorie bạn đốt khi nghỉ hoàn toàn. Dùng phương trình Mifflin-St Jeor, chuẩn lâm sàng hiện tại.
Máy tính lượng calo
Ước tính nhu cầu calo hàng ngày cho mục tiêu của bạn bằng cách sử dụng Mifflin-St Jeor BMR và các yếu tố hoạt động. Bao gồm các mục tiêu thâm hụt và thặng dư.
Máy tính đĩa CD
Tính lãi và số dư cuối cùng trên Chứng chỉ tiền gửi. Xử lý tần suất gộp và hình phạt rút tiền sớm.
Bộ tính toán bê tông
Tính toán lượng bê tông cần thiết cho các tấm nền, móng, cột và tường. Xác định số yard khối, số túi bê tông và ước tính chi phí vật liệu.