Website hiện chỉ đăng tải bài viết và cung cấp dịch vụ, không hỗ trợ tư vấn các vấn đề ngoài dịch vụ. Mong bạn thông cảm!
😄

Chỉ số Skewness và Kurtosis đánh giá phân phối chuẩn trong SPSS

Trong thống kê, Skewness (độ lệch)Kurtosis (độ nhọn) là hai chỉ số quan trọng để đánh giá mức độ phù hợp của dữ liệu với phân phối chuẩn (Normal Distribution) trên SPSS.

1. Chỉ số độ lệch Skewness

a. Định nghĩa độ lệch Skewness

Chỉ số Skewness (độ lệch) là một thước đo thống kê mô tả tính bất đối xứng của phân phối dữ liệu. Nói cách khác, nó cho biết phân phối dữ liệu có bị lệch về bên trái hay bên phải so với giá trị trung bình hay không.

Chỉ số Skewness

Hình thái độ lệch khái quát chung sẽ gồm 3 dạng như đồ thị phía trên:

  • Skewness > 0 (Mean > Median): Hình dạng này được gọi là phân phối lệch dương hoặc phân phối lệch phải (positive skewness - right skewed). Phần đuôi bên phải của đồ thị phân phối sẽ trải dài hơn so với bên trái. Có xu hướng không đảm bảo phân phối chuẩn.
  • Skewness = 0 (Mean = Median = Mốt): Hình dạng này được gọi là phân phối đối xứng (symmetrical distribution). Phần đuôi bên phải và trái của đồ thị phân phối sẽ khá đồng đều và đối xứng nhau. Có xu hướng đảm bảo phân phối chuẩn.
  • Skewness < 0 (Mean < Median): Hình dạng này được gọi là phân phối lệch âm hoặc phân phối lệch trái (negative skewness - left skewed). Phần đuôi bên trái của đồ thị phân phối sẽ trải dài hơn so với bên phải. Có xu hướng không đảm bảo phân phối chuẩn.

b. Đánh giá phân phối chuẩn qua độ lệch Skewness

Độ lệch Skewness đo lường tính đối xứng của phân phối của biến. Nếu phân phối kéo dài về phía đuôi phải hoặc trái, thì phân phối bị lệch. Phân phối lệch âm biểu thị nhiều giá trị lớn hơn giá trị trung bình, trong khi độ lệch dương biểu thị nhiều giá trị nhỏ hơn giá trị trung bình.

Hair và cộng sự (2022), đưa ra tiêu chuẩn đánh giá phân phối chuẩn của dữ liệu dựa vào Skewness như sau:

  • Skewness từ -1 đến 1: mức lý tưởng để kết luận có phân phối chuẩn;
  • Skewness từ -2 đến 2: mức chấp nhận để kết luận có phân phối chuẩn;
  • Skewness vượt quá -2 và 2: dữ liệu không có phân phối chuẩn.

2. Chỉ số độ nhọn Kurtosis

a. Định nghĩa độ nhọn Kurtosis

Chỉ số Kurtosis (độ nhọn) là một thước đo thống kê mô tả hình dạng của phân phối dữ liệu dựa trên độ "nhọn" của đỉnh và độ "dày" của đáy. Nếu dữ liệu có hệ số kurtosis cao nghĩa là dữ liệu có xu hướng tập trung nhiều ở phần đáy. Nếu dữ liệu có hệ số kurtosis thấp nghĩa là dữ liệu có xu hướng tập trung nhiều ở phần đỉnh của đồ thị phân phối.

Chỉ số Kurtosis

Công thức ban đầu tính toán Kurtosis bằng 3 sẽ cho thấy dữ liệu có phân phối chuẩn. Tuy nhiên, trong nhiều tài liệu, giáo trình, phần mềm thống kê bao gồm cả SPSS đã quy Kurtosis về giá trị 0 cho dễ nhận xét. Hệ số Kurtosis sau khi quy đổi gọi là Excess Kurtosis (độ nhọn dư thừa). Cách thức quy đổi đó là Excess Kurtosis = Kurtosis - 3. 

Trên phần mềm SPSS, mặc dù phần mềm dùng tên gọi Kurtosis nhưng thực chất nó là giá trị Excess Kurtosis. Do vậy, khi đọc kết quả trị số này trên SPSS chúng ta đối chiếu với giá trị 0 chứ không phải giá trị 3.

Hình thái độ nhọn khái quát chung sẽ gồm 3 dạng như đồ thị phía trên:

  • Excess Kurtosis > 0: Hình dạng này được gọi là phân phối nhọn hơn chuẩn (Leptokurtic). Đồ thị phân phối có đỉnh nhọn, cao.
  • Excess Kurtosis = 0Hình dạng này được gọi là phân phối chuẩn (Mesokurtic). Đồ thị phân phối có độ nhọn trung bình.
  • Excess Kurtosis < 0Hình dạng này được gọi là phân phối bẹt hơn chuẩn (Platykurtic). Đồ thị phân phối có đỉnh rộng, thấp.

b. Đánh giá phân phối chuẩn qua độ nhọn Kurtosis

Độ nhọn Kurtosis biểu thị phân phối có quá nhọn hay bẹt hơn so với phân phối chuẩn. Độ nhọn dương có nghĩa là phân phối có đỉnh cao hơn, trong khi độ nhọn âm có nghĩa là phân phối phẳng hơn. 

Hair và cộng sự (2022), đưa ra tiêu chuẩn đánh giá phân phối chuẩn của dữ liệu dựa vào Kurtosis (đã trừ cho 3) như sau:

  • Kurtosis gần bằng 0: mức lý tưởng để kết luận có phân phối chuẩn;
  • Kurtosis từ -2 đến 2: mức chấp nhận để kết luận có phân phối chuẩn;
  • Kurtosis vượt quá -2 và 2: dữ liệu không có phân phối chuẩn.

3. Cách tính chỉ số Skewness và Kurtosis trong SPSS

Để tính Skewness và Kurtosis trong SPSS, chúng ta thực hiện tương tự thao tác như thống kê trung bình. Tại giao diện làm việc của SPSS, vào Analyze → Descriptive Statistics → Descriptives.

Chỉ số Skewness và Kurtosis SPSS

Cửa sổ Descriptives xuất hiện, đưa các biến cần kiểm tra skewness và kurtosis vào mục Variable(s). Sau đó nhấp vào tùy chọn Options.

Chỉ số Skewness và Kurtosis SPSS

Trong tùy chọn Options, tích chọn vào hai ô SkewnessKurtosis. Sau đó nhấp Continue quay về cửa sổ ban đầu rồi chọn OK để xuất kết quả ra output.

Chỉ số Skewness và Kurtosis SPSS

SPSS sẽ trả về hai chỉ số Skewness và Kurtosis trong bảng kết quả Descriptive Statistics như ảnh bên dưới.

Chỉ số Skewness và Kurtosis SPSS

 Giá trị Skewness và Kurtosis của các biến đều nằm trong khoảng từ -2 đến 2, như vậy, dữ liệu các biến này đều có phân phối xấp xỉ chuẩn.

Lưu ý: 

- Khi đánh giá phân phối chuẩn qua Skewness và Kurtosis chúng ta không nên kết luận là có phân phối chuẩn mà chỉ nên dùng "có phân phối xấp xỉ chuẩn".

- Việc đánh giá phân phối chuẩn dựa vào giá trị Skewness và Kurtosis thuần về mặt định tính. Chúng ta nên kết hợp với các kiểm định định lượng về phân phối chuẩn như Shapiro-Wilk và Kolmogorov-Smirnov. 

----------

Nguồn tham khảo:

Hair và cộng sự (2022). A Primer on Partial Least Squares Structural Equation Modeling (PLS-SEM) (3 ed.). Thousand Oaks, CA: Sage.

Đăng nhận xét