Website hiện chỉ đăng tải bài viết và cung cấp dịch vụ, không hỗ trợ tư vấn các vấn đề ngoài dịch vụ. Mong bạn thông cảm!
😄

Công thức tính kích thước mẫu tối thiểu trong EFA

Việc đảm bảo kích thước mẫu tối thiểu của EFA là rất quan trọng để phân tích này cho ra một kết quả đạt được độ tin cậy cao. Vậy tại sao cỡ mẫu lại đóng vai trò quyết định như vậy? Và cỡ mẫu bao nhiêu mới là phù hợp trong phân tích EFA?

công thức tính mẫu tối thiểu EFA

1. Tầm quan trọng của cỡ mẫu trong EFA

Cỡ mẫu là một yếu tố cực kỳ quan trọng trong phân tích nhân tố khám phá (EFA). Việc xác định một cỡ mẫu EFA phù hợp sẽ đảm bảo độ tin cậy và tính hợp lệ của kết quả nghiên cứu. Tuy nhiên, không có một con số cụ thể nào được coi là "cỡ mẫu lý tưởng" cho mọi nghiên cứu EFA, mà còn phụ thuộc vào nhiều yếu tố khác như số lượng biến quan sát, số lượng nhân tố, tính chất dữ liệu, độ phức tạp của mô hình...

Để EFA hay một số kiểm định định lượng khi xử lý số liệu trong SPSS cho ra kết quả chính xác và đáng tin cậy, việc đảm bảo cỡ mẫu đủ lớn là vô cùng quan trọng. Dưới đây là một số lý do giải thích tại sao:

a. Độ tin cậy của các ước lượng:

- Ổn định các tải trọng nhân tố: Cỡ mẫu EFA đủ lớn giúp đảm bảo các tải trọng nhân tố (factor loadings) ổn định hơn. Tải trọng nhân tố là các hệ số cho biết mức độ tương quan giữa các biến quan sát và các nhân tố tiềm ẩn. Khi cỡ mẫu nhỏ, các tải trọng nhân tố có thể thay đổi đáng kể khi thêm hoặc bớt một vài quan sát, dẫn đến kết quả không ổn định.

- Ước lượng chính xác các phương sai: Cỡ mẫu lớn giúp ước lượng chính xác hơn phương sai của các biến và các nhân tố. Phương sai là một thước đo mức độ phân tán của dữ liệu, và việc ước lượng chính xác phương sai là rất quan trọng để đánh giá độ tin cậy của các kết quả phân tích.

b. Khả năng khám phá cấu trúc:

- Phát hiện các nhân tố tiềm ẩn: Cỡ mẫu lớn tăng khả năng phát hiện các nhân tố tiềm ẩn thực sự tồn tại trong dữ liệu. Với cỡ mẫu nhỏ, một số nhân tố yếu hoặc các mối quan hệ phức tạp có thể bị bỏ qua.

- Đánh giá độ phù hợp của mô hình: Cỡ mẫu lớn giúp đánh giá độ phù hợp của mô hình EFA một cách chính xác hơn. Các chỉ số đánh giá độ phù hợp của mô hình như KMO và Bartlett's test of sphericity sẽ có độ tin cậy cao hơn khi cỡ mẫu lớn.

c. Giảm lỗi mẫu:

- Mẫu đại diện tốt hơn cho tổng thể: Cỡ mẫu lớn giúp đảm bảo mẫu nghiên cứu đại diện tốt hơn cho tổng thể dân số. Điều này giúp giảm thiểu lỗi mẫu và tăng tính khái quát của kết quả nghiên cứu.

- Giảm ảnh hưởng của các điểm dị biệt: Cỡ mẫu lớn giúp giảm thiểu ảnh hưởng của các điểm dị biệt (outliers) trong dữ liệu. Các giá trị dị biệt có thể làm sai lệch kết quả phân tích, đặc biệt là khi cỡ mẫu nhỏ.

2. Công thức xác định kích thước mẫu theo EFA

Nhiều nhà nghiên cứu đã đưa ra các khuyến nghị về cách xác định cỡ mẫu trong EFA. Dưới đây là một số quan điểm tiêu biểu:

  • Kaiser (1974): Kaiser đề cập rằng kích thước mẫu tối thiểu cần đạt để đảm bảo kết quả EFA đáng tin cậy là ít nhất 5 lần số biến quan sát.
  • MacCallum et al. (1999): Đã phân tích chi tiết mối quan hệ giữa kích thước mẫu, số lượng biến, và độ tin cậy của kết quả EFA. Họ nhận thấy rằng không chỉ số lượng mẫu mà cả cấu trúc nhân tố và độ mạnh của các hệ số tải đều ảnh hưởng đến tính chính xác.
  • Tabachnick và Fidell (2007): Hai tác giả này khuyến nghị rằng kích thước mẫu nên ít nhất từ 300 quan sát trở lên để EFA đạt được độ chính xác cao. Tuy nhiên, họ cũng lưu ý rằng nếu hệ số tải nhân tố (factor loadings) mạnh (≥ 0,6), mẫu nhỏ hơn vẫn có thể chấp nhận được.
  • Hair và cộng sự (2009): Theo Hair và cộng sự, cỡ mẫu tối thiểu cho EFA là 50, tốt nhất nên từ 100 trở lên. Ngoài ra, họ khuyến nghị kích thước mẫu ít nhất là 5 lần hoặc 10 lần số lượng biến quan sát đưa vào phân tích EFA.
  • Các nghiên cứu khác: Các nghiên cứu khác cũng đưa ra những gợi ý cỡ mẫu tối thiểu là 5 lần số biến quan sát đưa vào phân tích EFA, nhấn mạnh tầm quan trọng của cỡ mẫu đủ lớn để đảm bảo độ tin cậy của kết quả.

Như vậy công thức mẫu tối thiểu EFA được đề xuất nhiều nhất trong các nghiên cứu là:

N = 5 * số biến quan sát tham gia EFA

Ví dụ: Một nghiên cứu có 30 biến quan sát. Tác giả muốn phân tích EFA cho 30 biến quan sát này thì cỡ mẫu tối thiểu cần có là 5*30 = 150.

3. Giải thích công thức cỡ mẫu EFA trường hợp chạy nhiều EFA trong một mô hình

Trong công thức lấy mẫu EFA, chúng ta nói đến số lượng biến quan sát tham gia vào phép EFA đó chứ không phải số lượng biến quan sát của toàn bộ nghiên cứu. Bởi vì sẽ có một số trường hợp bài nghiên cứu chia nhỏ thành nhiều lần chạy EFA, số lượng biến quan sát tham gia vào một lần chạy EFA sẽ ít hơn số lượng biến quan sát của toàn nghiên cứu.

Ví dụ: Xét một mô hình nghiên cứu có 4 biến độc lập gồm 20 biến quan sát + 1 biến trung gian 5 biến quan sát  + 1 biến phụ thuộc 10 biến quan sát.

- Nếu chúng ta triển khai EFA chung toàn mô hình: N tối thiểu = (20+5+10)*5  = 175.

- Nếu chúng ta triển khai EFA riêng độc lập, riêng trung gian, riêng phụ thuộc: 

  • N tối thiểu độc lập = 20*5 = 100
  • N tối thiểu độc lập = 5*5 = 25
  • N tối thiểu độc lập = 10*5 = 50
    → Chọn N tối thiểu lớn nhất làm N tối thiểu của nghiên cứu là 100.

Tóm lại, việc xác định cỡ mẫu trong EFA là một quyết định phức tạp, đòi hỏi nhà nghiên cứu phải cân nhắc nhiều yếu tố. Tuy nhiên, các khuyến nghị của các nhà nghiên cứu phần lớn đều nhận định rằng, kích thước mẫu tối thiểu cần có của phân tích EFA là 5 lần số lượng biến quan sát tham gia phép phân tích EFA đó.

Xem thêm: Hướng dẫn phân tích nhân tố khám phá EFA trong SPSS

Xem thêm: Xử lý ma trận xoay nhân tố bị xáo trộn lộn xộn, không hội tụ

Đăng nhận xét