Trong phân tích EFA, chúng ta kỳ vọng rằng kết quả cho ra ở ma trận xoay đảm bảo được tính hội tụ và phân biệt ở mức độ khá trở lên. Các nhóm không bị phân tán mạnh và đảo lộn quá nhiều làm mất hoàn toàn tính chất các nhóm biến trên lý thuyết.
Tuy nhiên, việc tồn tại các biến quan sát không đạt yêu cầu, dữ liệu chưa làm sạch, đáp viên không hợp tác khi điền bảng câu hỏi... dẫn đến ma trận EFA không tốt, trong tình huống như vậy thì cách xử lý ma trận xoay nhân tố bị xáo trộn lộn xộn, không hội tụ sẽ như thế nào?
1. Như thế nào gọi là ma trận xoay xáo trộn, không hội tụ
Trước khi đi vào xử lý, chúng ta cần hiểu được thế nào là một ma trận xoay xáo trộn, lộn xộn. Bởi vì tình trạng lộn xộn không phải lúc nào cũng là xấu và cần phải khắc phục, xử lý.
VIDEO HƯỚNG DẪN PHẦN 1:
VIDEO HƯỚNG DẪN PHẦN 2:
Điều kiện thứ nhất với một ma trận xoay lộn xộn cần xử lý sẽ phải là dạng các nhân tố đã được xác định cấu trúc thang đo ngay từ lý thuyết. Nghĩa là, mô hình nghiên cứu gồm các nhân tố A, B, C, thì nhân tố A đã được xác định được đo lường bằng A1, A2, A3; nhân tố B đã xác định đo lường bằng B1, B2, B3, B4; nhân tố C đã xác định được đo lường bằng C1, C2, C3.
Điều kiện thứ hai là khi phân tích EFA, cấu trúc các nhân tố theo lý thuyết này sẽ bị phá vỡ làm giảm số nhân tố lý thuyết, tăng số nhân tố lý thuyết, biến quan sát nhân tố này nhảy sang nhân tố khác, hình thành nhân tố là hỗn hợp nhiều biến quan sát từ nhiều nhân tố. Dưới đây là một số ví dụ về ma trận xoay xáo trộn.
Ma trận xoay lộn xộn giữ đúng số nhân tố lý thuyết (4 nhân tố)
Ma trận xoay lộn xộn giảm số nhân tố lý thuyết (4 nhân tố chỉ còn 3)
Ma trận xoay lộn xộn tăng số nhân tố lý thuyết (4 nhân tố tăng thành 8)
2. Ma trận xoay lộn xộn là xấu hay bình thường?
Phân tích nhân tố EFA là một bước quan trọng để chúng ta khám phá các nhân tố và so sánh với nhân tố từ mô hình lý thuyết. Việc xuất hiện nhân tố mới, rút gọn số nhân tố hoặc cấu hình lại thang đo... làm thay đổi các thang đo lý thuyết là điều hoàn toàn bình thường, thậm chí trong nhiều trường hợp còn là điểm mới rất giá trị khi giúp người nghiên cứu khám phá ra các cấu trúc nhân tố ẩn mà những nghiên cứu trước chưa phát hiện ra được.
Tuy nhiên, một ma trận xoay nhân tố bị xáo trộn lộn xộn, không hội tụ ở phần lớn các thang đo gốc lý thuyết sẽ là một điểm xấu. Sự xuất hiện của quá nhiều nhân tố mới, cấu trúc hầu hết các nhân tố bị phá vỡ và có sự hội tụ hỗn hợp nhiều biến quan sát từ nhiều nhân tố lý thuyết là điển hình cho những ma trận xoay không phù hợp và cần phải xử lý, đánh giá lại chất lượng dữ liệu khảo sát.
2. Cách xử lý với ma trận xoay xáo trộn lộn xộn, không hội tụ
2.1 Xác định phương thức triển khai EFA chung/riêng cho phù hợp
Việc xác định vai trò biến trong một mô hình để xác định phương thức triển khai EFA là rất quan trọng. Bởi vì có nhiều trường hợp, trên cùng một bộ dữ liệu, chạy phân tích EFA riêng thì kết quả tốt nhưng chạy phân tích EFA chung lại cho ra kết quả cực kỳ xấu, thậm chí phải chấp nhận bỏ cả bộ dữ liệu.
Điển hình nhất là mối quan hệ nhân quả giữa biến độc lập với biến phụ thuộc trong mô hình. Biến độc lập khi có sự giải thích tốt cho biến phụ thuộc, nếu đưa cả hai loại biến này vào phân tích chung trong một lần EFA, khả năng rất cao sẽ không thể đảm bảo được cột nhân tố biến phụ thuộc tách ra với cột nhân tố biến độc lập trong ma trận xoay. Và chỉ vì cột nhân tố biến độc lập không tách được cột nhân tố biến phụ thuộc mà chúng ta kết luận đây là ma trận xoay xấu, dữ liệu không sử dụng được là hoàn toàn vô lý và không phù hợp.
Phần lý giải cách chạy chung/riêng EFA trên SPSS và một số quan điểm của các nhà nghiên cứu về vấn đề này mình đã đề cập tại bài viết này, các bạn có thể truy cập vào link để xem chi tiết.
2.2 Xác định dạng ma trận xoay lộn xộn có thể cải thiện được
Ma trận xoay trong EFA là kết quả phản ánh từ dữ liệu đầu vào. Kỹ thuật xử lý không làm thay đổi bản chất dữ liệu đầu vào kém chất lượng thành một dữ liệu tốt mà chỉ cải thiện dữ liệu hoặc kết quả EFA để thu về một ma trận xoay phù hợp nhất với tập dữ liệu.
Nếu chất lượng dữ liệu đầu vào quá tệ và rơi vào những tình huống không thể xử lý, cải thiện được. Bạn không nên mất thời gian để xử lý khắc phục ma trận xoay EFA nữa mà nên dành thời gian đó để điều chỉnh lại bảng câu hỏi, tiến hành khảo sát lại một cách kỹ lưỡng để có được một bộ dữ liệu mới phù hợp.
Vậy thì đâu sẽ là biểu hiện của một ma trận xoay xáo trộn có thể xử lý được và không xử lý được?
Dạng ma trận xoay lộn xộn có thể cải thiện:
- Số cấu trúc nhân tố mới giảm đi hoặc tăng lên rất ít so với số nhân tố lý thuyết;
- Số nhân tố giữ được cấu trúc biến quan sát theo lý thuyết nhiều hơn số nhân tố bị vỡ cấu trúc lý thuyết;
- Cấu trúc nhân tố lý thuyết bị phá vỡ nhẹ.
Dạng ma trận xoay lộn xộn không thể cải thiện:
- Trích ra quá nhiều nhân tố so với số nhân tố lý thuyết;
- Gộp lại chỉ còn 1, 2 nhân tố từ số nhiều nhân tố lý thuyết;
- Cấu trúc các nhân tố bị phá vỡ hoàn toàn;
- Quá nhiều nhân tố là hỗn hợp biến quan sát từ nhiều nhân tố.
→ Với dạng không thể cải thiện được này, dữ liệu đầu vào không đạt chất lượng, chúng ta cần tiến hành điều chỉnh bảng hỏi, thu thập lại dữ liệu mới.
Tham khảo: Tổng hợp 20 bộ dữ liệu SPSS mẫu kết quả tốt
2.3 Xử lý ma trận xoay xáo trộn, không hội tụ
Khi đã xác định ma trận xoay thuộc vào dạng có thể xử lý, cải thiện được. Chúng ta sẽ đánh giá tổng quan sự xáo trộn của ma trận xoay để đưa ra hướng xử lý.
Bước 1: Đảm bảo lại một lần nữa bước kiểm định độ tin cậy thang đo Cronbach's Alpha chúng ta đã loại bỏ đi các biến quan sát, các nhân tố không phù hợp. Các biến, nhân tố bị loại bỏ ở bước Cronbach's Alpha sẽ không đưa vào phân tích EFA nữa.
Bước 2: Thực hiện thống kê trung bình để xem có biến nào có giá trị bị lỗi không thuộc đáp án trong thang đo không hoặc biến nào có dấu hiệu bất thường về mean, min, max, độ lệch chuẩn không. Ví dụ như giá trị max là 55 trong khi thang đo chỉ từ 1-5, như vậy là chúng ta đã nhập sai. Hoặc độ lệch chuẩn lên tới 2 trong khi thang đo chỉ từ 1-5, đáp án quá chênh lệch, có khả năng có vấn đề ở biến này. Xem cách chạy thống kê trung bình tại đây.
Bước 3: Tiếp tục rà soát để loại bỏ các kết quả khảo sát chỉ đánh bao lô một đáp án giống nhau cho toàn bộ các câu hỏi. Ví dụ toàn bộ các câu hỏi khảo sát đáp viên chỉ chọn đáp án điểm 5 từ đầu đến cuối, đây là dấu hiệu các phiếu khảo sát kém chất lượng cần loại bỏ. Các phiếu này nếu tồn tại quá nhiều sẽ gây ra tình trạng CMB, đa cộng tuyến, vi phạm tính phân biệt trong dữ liệu dẫn đến ma trận xoay các yếu tố không thể tách biệt nhau.
Bước 4: Kiểm tra tính logic dữ liệu câu thông tin cá nhân để phát hiện và loại bỏ ra phiếu khảo sát không hợp tác khi điều tra. Ví dụ một đáp viên có độ tuổi dưới 18 nhưng học vấn là sau đại học chỉ ra đây là một phiếu khảo sát kém chất lượng, đáp viên chỉ đánh cho có chứ không đọc câu hỏi và trả lời cho phù hợp.
Bước 5: Tiến hành nhận diện các biến quan sát xấu và loại bỏ chúng ra khỏi kết quả EFA. Chi tiết về phần xác định và loại bỏ biến xấu bạn xem tại đây.
Như ví dụ ở trên, các biến quan sát xấu cần loại bỏ gồm:
- Biến DT3: biến này tải mạnh lên cả hai nhân tố DT và LD, đây là một biến không rõ ràng vì giải thích cùng lúc cho cả hai yếu tố, cần loại bỏ đi.
- Biến DN4: biến này theo lý thuyết thuộc về nhân tố DN nhưng khi phân tích EFA lại nằm tách riêng thành một nhân tố. Một biến quan sát tách làm một nhân tố sẽ không phù hợp về mặt đại diện cho ý nghĩa nhân tố, chúng ta sẽ loại đi biến quan sát này.
- Biến TL2: biến này vẫn hội tụ tốt về nhân tố TL. Tuy nhiên, nghiên cứu này tác giả chỉ chọn lọc các biến quan sát có hệ số tải tối thiểu từ 0.5 trở lên để đảm bảo chất lượng của đề tài. Biến quan sát TL2 có hệ số tải bằng 0.421 < 0.5, cho thấy biến này giải thích cho nhân tố TL khá yếu, do vậy sẽ cần loại bỏ đi.
Quá trình loại bỏ các biến quan sát xấu sẽ thực hiện loại đồng loạt một lần hoặc loại lần lượt từng biến rồi chạy lại. Chúng ta sẽ linh động và kết hợp hai phương thức loại lần lượt và loại đồng loạt để đảm bảo kết quả ma trận xoay cho ra cấu trúc nhân tố bám sát nhất với cấu trúc lý thuyết.
Bước 6: Sau khi loại đi biến quan sát xấu, những nhân tố giữ được cấu trúc lý thuyết (nhân tố chỉ gồm các biến quan sát gốc từ lý thuyết mà không có sự xáo trộn với biến quan sát ở nhân tố khác), chúng ta sẽ giữ tên nhân tố gốc từ lý thuyết và không cần xử lý gì thêm. Còn đối với những nhân tố mới hình thành có sự xáo trộn biến quan sát, chúng ta sẽ kiểm tra lại ý nghĩa nội dung câu hỏi của những biến xáo trộn này với nhau. Nếu sự hội tụ một cách lộn xộn này là hợp lý, các biến quan sát cùng thể hiện một ý nghĩa chung, chúng ta sẽ đặt tên nhân tố mới theo hướng dẫn ở bài viết này để kết luận các thang đo mới.
3. Kết luận chung về việc khắc phục ma trận xoay EFA xáo trộn
Dưới đây sẽ là một số nhận định, kết luận khi xử lý vấn đề ma trận xoay lộn xộn, không hội tụ:
1. Không phải ma trận xoay xáo trộn là biểu hiện của một kết quả nghiên cứu xấu. Hãy xem xét tính hợp lý của sự xáo trộn này, có thể sự xáo trộn này lại là điểm mới đáng giá của nghiên cứu.
2. Mặc dù bảng câu hỏi, hay các thang đo đo lường là kế thừa từ những nghiên cứu lớn đã được chứng minh. Khi chúng ta áp dụng nó vào một môi trường khác, những sự khác biệt về quốc gia, hoàn cảnh, thời điểm, đặc điểm đối tượng khảo sát... sẽ tạo ra nhiều độ chệch ảnh hưởng đến kết quả phân tích EFA. Do vậy, không nhất thiết một ma trận xoay EFA ở nghiên cứu thực nghiệm phải luôn giống với cấu trúc lý thuyết mới là đúng.
3. Hãy nhớ rằng, ma trận xoay ở EFA hay những kiểm định khác đều là phản ánh từ chất lượng dữ liệu đầu vào. Do vậy, hãy làm chuẩn chỉnh mọi khâu tiền khảo sát như lập bảng câu hỏi rõ ràng, bố cục bảng câu hỏi hợp lý, câu hỏi dễ hiểu, chọn lọc đáp viên chất lượng,.. để thu về một bộ dữ liệu phù hợp thì bước xử lý định lượng sau đó sẽ ít phát sinh vấn đề hơn.
Nếu bạn gặp khó khăn khi thực hiện phân tích nhân tố EFA như biến bị loại nhiều, không đảm bảo điều kiện hội tụ-phân biệt hoặc bạn chưa có dữ liệu khảo sát phù hợp, bạn có thể tham khảo dịch vụ hỗ trợ SPSS của Phạm Lộc Blog để bên mình có thể tư vấn và đưa ra giải pháp tối ưu nhất cho bạn nhé.