Công thức chọn cỡ mẫu trong EFA và hồi quy

Nghiên cứu với một kích thước mẫu càng lớn sẽ càng thể hiện được tính chất của tổng thể nhưng lại tốn nhiều thời gian và chi phí. Do vậy, việc chọn một kích thước mẫu phù hợp là rất quan trọng.

1. Yếu tố ảnh hưởng tới quyết định chọn cỡ mẫu

Kích thước mẫu (cỡ mẫu) của nghiên cứu càng lớn, sai số trong các ước lượng sẽ càng thấp, khả năng đại diện cho tổng thể càng cao. Tuy nhiên, việc thu thập cỡ mẫu lớn sẽ làm tiêu tốn nhiều thời gian, công sức, tiền bạc ở toàn bộ các khâu từ thu thập, kiểm tra, phân tích. Do đó việc chọn kích thước mẫu cần phải được xem xét một cách có cân nhắc để mọi thứ được cân bằng và hiệu quả. Sự lựa chọn cỡ mẫu sẽ phụ thuộc vào:

Độ tin cậy cần có của dữ liệu. Nghĩa là mức độ chắc chắn rằng các đặc điểm của cỡ mẫu được chọn phải khái quát được cho đặc điểm tổng thể.
Sai số mà nghiên cứu có thể chấp nhận được. Đó là độ chính xác chúng ta yêu cầu cho bất ký ước lượng được thực hiện trên mẫu.
Các loại kiểm định, phân tích sẽ thực hiện. Một số kỹ thuật thống kê yêu cầu cỡ mẫu phải đạt một ngưỡng nhất định thì các ước lượng mới có ý nghĩa.
Kích thước của tổng thể. Mẫu nghiên cứu sẽ cần chiếm một tỷ lệ nhất định so với kích thước của tổng thể.

2. Xác định cỡ mẫu theo phương pháp phân tích

Việc xác định cỡ mẫu theo ước lượng tổng thể thường yêu cầu cỡ mẫu lớn. Tuy nhiên, nhà nghiên cứu lại có quỹ thời gian giới hạn và nếu không có nguồn tài chính tài trợ thì khả năng lấy mẫu theo ước lượng tổng thể sẽ khó có thể thực hiện. Do đó, các nhà nghiên cứu thường sử dụng công thức lấy mẫu dựa vào phương pháp định lượng được sử dụng để phân tích dữ liệu. Hai phương pháp yêu cầu cỡ mẫu lớn thường là hồi quy và phân tích nhân tố khám phá (EFA).

a. Công thức lấy cỡ mẫu theo EFA

N = 5 * số biến đo lường tham gia EFA

Theo Hair và cộng sự (2014) , kích thước mẫu tối thiểu cho EFA là 50, tốt hơn là từ 100 trở lên. Tỷ lệ số quan sát trên một biến phân tích là 5:1 hoặc 10:1, một số nhà nghiên cứu cho rằng tỷ lệ này nên là 20:1. “Số quan sát” hiểu một cách đơn giản là số phiếu khảo sát hợp lệ cần thiết; “biến đo lường” là một câu hỏi đo lường trong bảng khảo sát.

Ví dụ, nếu bảng khảo sát của chúng ta có 30 câu hỏi sử dụng thang đo Likert 5 mức độ (tương ứng với 30 biến quan sát thuộc các nhân tố khác nhau), 30 câu này được sử dụng để phân tích trong một lần EFA. Áp dụng tỷ lệ 5:1, cỡ mẫu tối thiểu sẽ là 30 × 5 = 150, nếu tỷ lệ 10:1 thì cỡ mẫu tối thiểu là là 30 × 5 = 300. Kích thước mẫu này lớn hơn kích thước tối thiểu 50 hoặc 100, vì vậy chúng ta cần cỡ mẫu tối thiểu để thực hiện phân tích nhân tố khám phá EFA là 150 hoặc 300 tùy tỷ lệ lựa chọn dựa trên khả năng có thể khảo sát được.

Ví dụ: Một nghiên cứu xây dựng mô hình gồm các nhân tố và biến quan sát như sau:

Nhân tố A gồm 3 biến quan sát

Nhân tố B gồm 4 biến quan sát

Nhân tố C gồm 4 biến quan sát

Nhân tố D gồm 3 biến quan sát

Nghiên cứu này tác giả xác định tách hai phần chạy EFA, phần một chung A, B, C và phần hai chỉ phân tích cho D. Do có hai phần chạy EFA trong một mô hình, chúng ta sẽ xác định mẫu tối thiểu từng phần chạy và chọn ra mẫu tối thiểu lớn hơn để làm mẫu tối thiểu chung của phép EFA cho mô hình.

Phần chạy 1 gồm A,B,C, mẫu tối thiểu là (3+4+4) * 5 = 11*5 = 55

Phần chạy 2 gồm D, mẫu tối thiểu là 3*5 = 15

Vậy mẫu tối thiểu của phép EFA cho mô hình là 55.

Trường hợp nghiên cứu này tác giả xác định chỉ chạy một EFA cho tất cả các nhân tố A,B,C,D thì mẫu tối thiểu của mô hình là: (3+4+4+3)*5 = 70.

b. Công thức lấy cỡ mẫu theo hồi quy

N = 50 + 8*số biến độc lập tham gia hồi quy

Đối với kích thước mẫu tối thiểu cho phân tích hồi quy, Green (1991) đưa ra hai trường hợp. Trường hợp một, nếu mục đích phép hồi quy chỉ đánh giá mức độ phù hợp tổng quát của mô hình như R2, kiểm định F ... thì cỡ mẫu tối thiểu là 50 + 8m (m là số lượng biến độc lập hay còn gọi là predictor tham gia vào hồi quy).

Trường hợp hai, nếu mục đích muốn đánh giá các yếu tố của từng biến độc lập như kiểm định t, hệ số hồi quy … thì cỡ mẫu tối thiểu nên là 104 + m (m là số lượng biến độc lập). Lưu ý rằng, m là số biến độc lập chúng ta đưa vào phân tích hồi quy, không phải là số biến quan sát hay số câu hỏi của nghiên cứu.

Giả sử chúng ta xây dựng bảng khảo sát gồm 4 biến độc lập (4 thang đo), mỗi thang đo biến độc lập này được đo lường bằng 5 câu hỏi Likert (5 biến quan sát), như vậy tổng cộng chúng ta có 20 biến quan sát. Sau bước phân tích EFA, 4 thang đo này vẫn giữ nguyên như lý thuyết ban đầu, điều này đồng nghĩa có 4 biến độc lập sẽ được sử dụng cho phân tích hồi quy, tức m = 4 không phải m = 20.

Công thức chọn mẫu trong nghiên cứu khoa học

Harris (1985) cho rằng cỡ mẫu phù hợp để chạy hồi quy đa biến phải bằng số biến độc lập cộng thêm ít nhất là 50. Ví dụ, phép hồi quy có 4 biến độc lập tham gia, thì cỡ mẫu tối thiểu phải là 4 + 50 = 54. Hair và cộng sự (2014) cho rằng cỡ mẫu tối thiểu nên theo tỷ lệ 5:1, tức là 5 quan sát cho một biến độc lập. Như vậy, nếu có 4 biến độc lập tham gia vào hồi quy, cỡ mẫu tối thiểu sẽ là 5 x 4 = 20.

Tuy nhiên, 5:1 chỉ là cỡ mẫu tối thiểu cần đạt, để kết quả hồi quy có ý nghĩa thống kê cao hơn, cỡ mẫu lý tưởng nên theo tỷ lệ 10:1 hoặc 15:1. Riêng với trường hợp sử dụng phương pháp đưa biến vào lần lượt Stepwise trong hồi quy, cỡ mẫu nên theo tỷ lệ 50:1.

Nếu một bài nghiên cứu sử dụng kết hợp nhiều phương pháp xử lý thì sẽ lấy kích thước mẫu cần thiết lớn nhất trong các phương pháp. Ví dụ, nếu bài nghiên cứu vừa sử dụng phân tích EFA và vừa phân tích hồi quy. Kích thước mẫu cần thiết của EFA là 200, kích thước mẫu cần thiết của hồi quy là 100, chúng ta sẽ chọn kích thước mẫu cần thiết của nghiên cứu là 200 hoặc từ 200 trở lên. Thường chúng ta sử dụng phân tích EFA cùng với phân tích hồi quy trong cùng một bài luận văn, một bài nghiên cứu. EFA luôn đòi hỏi cỡ mẫu lớn hơn rất nhiều so với hồi quy, chính vì vậy chúng ta có thể sử dụng công thức tính kích thước mẫu tối thiểu cho EFA làm công thức tính kích thước mẫu cho nghiên cứu.

Cũng lưu ý rằng, đây là cỡ mẫu tối thiểu, nếu chúng ta sử dụng cỡ mẫu lớn hơn kích thước tối thiểu, nghiên cứu sẽ càng có giá trị.

Từ khóa: công thức tính cỡ mẫu, các tính cỡ mẫu, cách xác định mẫu nghiên cứu, xác định kích thước mẫu.

Phạm Lộc Blog

Công thức chọn cỡ mẫu trong EFA và hồi quy

1. Yếu tố ảnh hưởng tới quyết định chọn cỡ mẫu

2. Xác định cỡ mẫu theo phương pháp phân tích

a. Công thức lấy cỡ mẫu theo EFA

b. Công thức lấy cỡ mẫu theo hồi quy

Đăng nhận xét

Phân tích và đọc kết quả hồi quy tuyến tính bội trong SPSS

Link download các phiên bản SPSS 20, SPSS 21, SPSS 22, SPSS 26, SPSS 27 Full

Phân tích nhân tố khám phá EFA trong SPSS

Phân tích độ tin cậy Cronbach's Alpha trong SPSS

Phân tích tương quan Pearson trong SPSS

Phạm Lộc Blog