Sau bước phân tích nhân tố khám phá EFA để phục vụ cho CFA, việc đánh giá Model Fit trong CFA là cực kỳ quan trọng. Các thang đo và các biến tiềm ẩn tạo thành một mô hình đo lường các khái niệm sử dụng trong nghiên cứu. Với một tập dữ liệu thu thập được, chúng ta cần kiểm định xem mô hình đo lường này với dữ liệu đầu vào có đạt được yêu cầu không. Các thang đo có đạt được yêu cầu của một thang đo tốt không, có biến quan sát nào không đóng góp vào mô hình không.
3.1 Độ phù hợp mô hình Model Fit trong CFA
Khi vẽ diagram CFA, chúng ta tạo ra shortcut các chỉ số về độ phù hợp mô hình ngay trên sơ đồ biểu diễn các đối tượng CFA để đọc nhanh một số chỉ số model fit quan trọng.
Để xem đầy đủ các chỉ số về độ phù hợp mô hình, chúng ta mở output CFA.
Nhấp vào mục Model Fit ở bên trái. Giao diện bên phải sẽ hiển thị toàn bộ các bảng liên quan đến độ phù hợp mô hình. Các chỉ số hiện trên shortcut ngoài diagram đều được lấy từ các bảng này.
Có rất nhiều bảng, nhiều thông số, nhưng chúng ta sẽ chỉ chú ý tới những giá trị quan trọng. Ngưỡng chấp nhận chỉ số độ phù hợp mô hình Model Fit có những tiêu chí chung nhưng cũng có nhiều tiêu chí riêng tùy theo công trình nghiên cứu của các tác giả khác nhau. Do vậy, khi tra ngưỡng chấp nhận các chỉ số của Model Fit, bạn cần dẫn nguồn cụ thể là ngưỡng đó lấy từ tác giả nào. Dưới đây là 2 công trình nghiên cứu được trích dẫn nguồn phổ biến nhất hiện nay:
- Theo Hu & Bentler (1999), Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives, Structural Equation Modeling các chỉ số được xem xét để đánh giá Model Fit phổ biến gồm (các nhà nghiên cứu thường sử dụng nguồn này):
- CMIN/df ≤ 3 là tốt, CMIN/df ≤ 5 là chấp nhận được
- CFI ≥ 0.9 là tốt, CFI ≥ 0.95 là rất tốt, CFI ≥ 0.8 là chấp nhận được
- GFI ≥ 0.9 là tốt, GFI ≥ 0.95 là rất tốt (chỉ số này bạn cần đọc thêm phần lưu ý cuối bài viết)
- TLI ≥ 0.9 là tốt
- RMSEA ≤ 0.06 là tốt, RMSEA ≤ 0.08 là chấp nhận được
- PCLOSE ≥ 0.05 là tốt, PCLOSE ≥ 0.01 là chấp nhận được
- Theo Hair et al. (2010), Multivariate Data Analysis, 7th edition các chỉ số được xem xét để đánh giá Model Fit gồm:
- CMIN/df ≤ 2 là tốt, CMIN/df ≤ 5 là chấp nhận được
- CFI ≥ 0.9 là tốt, CFI ≥ 0.95 là rất tốt, CFI ≥ 0.8 là chấp nhận được
- GFI ≥ 0.9 là tốt, GFI ≥ 0.95 là rất tốt
- RMSEA ≤ 0.08 là tốt, RMSEA ≤ 0.03 là rất tốt
** Thông tin thêm: Cả Hair et al. (2010) và Hu & Bentler (1999) đều đồng ý rằng các ngưỡng chấp nhận chỉ số Model Fit trong CFA sẽ khác nhau dựa trên cỡ mẫu, số nhóm nhân tố, số biến quan sát,... Và cả 2 nghiên cứu cũng đều đưa ra cỡ mẫu N = 250 là điểm phân cách ngưỡng chấp nhận. Tuy nhiên, để tránh sự rối rắm, khó hiểu, các tác giả đã đưa ra ngưỡng chung có thể áp dụng cho nhiều trường hợp. Với Hair et al. (2010), các tác giả chia 2 trường hợp nhỏ, còn với Hu & Bentler (1999) cho tất cả các trường hợp.
Trường hợp riêng của GFI lớn hơn 0.8 và nhỏ hơn 0.9
Một số đề tài do sự giới hạn về cỡ mẫu nên trị số GFI khó đạt được mức 0.9 bởi chỉ số này phụ thuộc rất nhiều vào số thang đo, số biến quan sát và cỡ mẫu. Chính vì sự phụ thuộc đáng kể bởi số lượng biến quan sát, số lượng cấu trúc nhóm, cỡ mẫu mà GFI trở lên ít được đưa vào đánh giá độ phù hợp mô hình trong những năm gần đây, thậm chí là được khuyến cáo không nên sử dụng (Kline, 2005; Sharma et al., 2005).
Nếu bạn bắt buộc phải đánh giá chỉ số này trong bài luận, nhưng ngưỡng của nó dưới 0.9, bạn có thể chấp nhận ngưỡng 0.8 theo 2 công trình nghiên cứu của Baumgartner and Homburg (1995) và của Doll, Xia, and Torkzadeh (1994). Nguồn trích dẫn:
Với các trường hợp các chỉ số không đạt được các ngưỡng chấp nhận, để tăng độ phù hợp mô hình Model Fit trong CFA, chúng ta thường dùng mũi tên 2 chiều Covariance trong AMOS để nối các sai số có chỉ số MI (Modification Indices) cao trong cùng một thang đo lại với nhau. Điều này sẽ giúp giảm Chi-square và cải thiện các chỉ số Model Fit. Tuy nhiên, không nên lạm dụng nối quá nhiều các sai số sẽ dẫn đến những sai lệch về tính chính xác của dữ liệu.
3.2 Chất lượng biến quan sát trong CFA
Sau khi xem xét độ phù hợp tổng thể của mô hình CFA. Chúng ta sẽ đi tới phần đánh giá chất lượng biến quan sát (đánh giá mô hình đo lường) để xem biến quan sát nào phù hợp và biến quan sát nào không phù hợp cần loại bỏ.
Để đánh giá chất lượng biến quan sát trong CFA, chúng ta dựa vào hai bảng kết quả là Regression Weights và Standardized Regression Weights. Từ giao diện bên trái của output, nhấp vào Regression Weights.
Chúng ta sẽ xét giá trị P (p-value). Giá trị này cho biết biến quan sát có thể hiện tính chất của biến tiềm ẩn hay không.
- Nếu p-value < 0.05 (lấy mức ý nghĩa là 5%), biến quan sát có ý nghĩa trong mô hình. Ký hiệu 3 dấu *** trong AMOS là 0.000.
- Nếu p-value > 0.05, biến quan sát không có ý nghĩa trong mô hình, chúng ta sẽ quay lại diagram CFA và xóa biến quan sát này khỏi mô hình, thực hiện phân tích lại CFA và đánh giá chất lượng biến quan sát lại một lần nữa.
Kết quả trong ví dụ bên trên, toàn bộ các biến quan sát đều có p-value bằng 0.000 < 0.05, như vậy các biến quan sát đều có ý nghĩa trong mô hình.
Khi tất cả các biến quan sát đều có p-value trong bảng Regression Weights đều nhỏ hơn 0.05. Chúng ta sẽ đi xét tiếp giá trị Standardized Regression Weights. Từ giao diện bên trái của output, nhấp vào Standardized Regression Weights.
Theo Hair và cộng sự (2010), những biến quan sát có standardized regression weight tối thiểu từ 0.5 trở lên sẽ được giữ lại, lý tưởng nhất là từ 0.7 trở lên (standardized regression weight ở CFA AMOS trong một số tài liệu còn được gọi là factor loading). Những biến có standardized regression weight nhỏ hơn 0.5 cần được loại bỏ (khi có biến quan sát được loại bỏ, chúng ta sẽ quay lại diagram CFA xóa biến quan sát này khỏi mô hình, thực hiện phân tích lại CFA và đánh giá chất lượng biến quan sát lại một lần nữa).
Hệ số standardized regression weight còn được sử dụng như một giá trị đánh giá mức độ đóng góp của biến quan sát lên biến tiềm ẩn. Biến quan sát nào có standardized regression weight lớn hơn thì sẽ đóng góp vào biến mẹ nhiều hơn.
Kết quả trong ví dụ bên trên, toàn bộ các biến quan sát đều có standardized regression weight lớn hơn 0.5, thậm chí là lớn hơn 0.7. Như vậy, các biến quan sát đều có mức phù hợp cao.
Nếu bạn gặp khó khăn khi phân tích SPSS và AMOS khi data thu thập được không được tốt, các chỉ số Model Fit không đảm bảo. Các bạn có thể tham khảo qua dịch vụ hỗ trợ xử lý AMOS của Phạm Lộc Blog để tối ưu về kết quả và thời gian làm bài.