Bài viết này sẽ tóm tắt một quy trình phân tích dữ liệu SPSS cho luận văn thạc sĩ, cao học. Các bạn, anh/chị đang định hướng học cao học hoặc đang trong quá trình thực hiện đề tài có thể sử dụng như một nguồn tham khảo để xây dựng sườn bài cũng như trình bày bài nghiên cứu nhé.
Một bài luận văn thạc sĩ tiêu chuẩn chỉ sử dụng SPSS sẽ đi theo quy trình 6 bước kiểm định:
1. Thống kê mô tả: Gồm thống kê tần số + thống kê trung bình
2. Kiểm định độ tin cậy thang đo Cronbach's Alpha
3. Phân tích nhân tố khám phá EFA
4. Phân tích tương quan tuyến tính Pearson
5. Phân tích hồi quy tuyến tính
6. Phân tích khác biệt trung bình T Test/ One-way ANOVA
1. Thống kê mô tả (Descriptives statistics)
Trong SPSS, thống kê mô tả là một nhóm các công cụ dùng để mô tả và tóm tắt dữ liệu của bạn, bao gồm các chỉ số như giá trị trung bình, độ lệch chuẩn, tần suất, phần trăm, phạm vi (range), mode, trung vị ... Có nhiều loại mô tả như tần số, trung bình, chi bình phương, bảng kết hợp.... Tuy nhiên trong làm luận văn chúng hay sẽ dùng tới hai loại thống kê mô tả chủ yếu là thống kê tần số và thống kê trung bình.
a. Thống kê tần số (Frequency)
Thống kê tần số giúp người nghiên cứu mô tả tổng quát về đặc điểm của mẫu nghiên cứu và kết quả khảo sát có được. Ví dụ: mẫu khảo sát có bao nhiêu nam, bao nhiêu nữ; có bao nhiêu người tại TP. Hồ Chí Minh, bao nhiêu người ở Hà Nội, bao nhiêu ở các tỉnh khác... Xem chi tiết bài viết và video hướng dẫn thống kê tần số tại đây.
Kết quả trả về của thống kê tần số trên SPSS sẽ gồm bảng tần số, tỷ trọng đáp viên và biểu đồ tròn/cột tương ứng bảng tần số.
→ Trong thống kê tần số, chúng ta sẽ dựa vào bảng tần số, tỷ trọng đáp viên để mô tả đặc điểm đối tượng khảo sát. Đối tượng khảo sát thiên về nam hay về nữ, thiên về nhóm người trẻ tuổi hay trung niên hay người lớn tuổi, thiên về nhóm lao động phổ thông hay nhóm lao động văn phòng... Từ đây chúng ta có thể đánh giá xem là nhóm đối tượng có phù hợp với đặc điểm của đề tài hay không để đưa ra hướng điều chỉnh mẫu nghiên cứu cho phù hợp.
b. Thống kê trung bình (Descriptives)
Nếu như thống kê tần số mạnh về việc mô tả tần số, tỷ trọng đặc điểm đối tượng khảo sát thì thống kê trung bình thiên về cung cấp các giá trị tính toán tổng quát của biến như giá trị nhỏ nhất, giá trị lớn nhất, giá trị trung bình, độ lệch chuẩn... Xem chi tiết bài viết và video hướng dẫn thống kê trung bình tại đây.
Kết quả trả về của thống kê trung bình trên SPSS sẽ gồm bảng thống kê giá trị nhỏ nhất, lớn nhất, giá trị trung bình, độ lệch chuẩn,...
→ Dựa trên kết quả thống kê trung bình, chúng ta sẽ biết được phạm vi giá trị của biến thông qua giá trị nhỏ nhất/giá trị lớn nhất. Từ đó, chúng ta sẽ đánh giá khoảng giá trị đó có phù hợp với tính chất bài nghiên cứu hay không.
→ Giá trị trung bình Mean cho biết trung bình giá trị của biến nằm ở mức độ nào so với ngưỡng giá trị nhỏ nhất, lớn nhất từ đó đánh giá được yếu tố đó đang tốt cần phát huy hay đang không tốt cần cải thiện.
2. Phân tích độ tin cậy Cronbach's Alpha
Kiểm định độ tin cậy Cronbach's Alpha là một bước quan trọng khi phân tích dữ liệu trên SPSS giúp đánh giá độ tin cậy các thang đo đo lường cho từng yếu tố trong mô hình. Nhiệm vụ của Cronbach's Alpha sẽ gồm:
1. Xem xét các câu hỏi xây dựng để đo lường cho yếu tố đó có phù hợp hay chưa. Nếu câu hỏi nào không phù hợp sẽ cần loại bỏ ra, chỉ giữ lại những câu hỏi phù hợp và ý nghĩa.
2. Xem tổng thể bộ câu hỏi đo lường cho yếu tố đó có đủ độ tin cậy tiêu chuẩn không. Nếu đã loại đi các câu hỏi không phù hợp rồi mà bộ câu hỏi vẫn chưa đảm bảo được độ tin cậy, cần phải xem xét loại bỏ yếu tố đó ra khỏi nghiên cứu hoặc điều chỉnh lại bộ câu hỏi.
Xem chi tiết bài viết và video hướng dẫn thực hiện kiểm định độ tin cậy Cronbach's Alpha tại đây.
Kết quả trả về của phân tích Cronbach's Alpha trên SPSS sẽ gồm hai bảng quan trọng:
→ Bảng Reliability Statistics cung cấp giá trị hệ số Cronbach's Alpha cho biết độ tin cậy của thang đo nhân tố đó là bao nhiêu. Ngưỡng phổ biến chấp nhận là từ 0.7 trở lên.
→ Bảng Item – Total Statistics cung cấp giá trị hệ số tương quan biến-tổng cho biến biến quan sát trong thang đo có đạt độ tin cậy không. Giá trị Corrected Item – Total Correlation của các biến quan sát từ 0.3 trở lên nghĩa là biến quan sát đó đảm bảo độ tin cậy trong nhân tố.
3. Phân tích nhân tố khám phá EFA
Trong các bước chạy SPSS cho luận văn cao học, thì phần phân tích nhân tố EFA này sẽ tùy thuộc vào tính chất đề tài là lặp lại hay khám phá mà quyết định có tiến hành hay không. Với một số đề tài nghiên cứu lặp lại, giảng viên hướng dẫn có thể sẽ yêu cầu không thực hiện kiểm định EFA này mà đi trực tiếp vào phân tích tương quan, hồi quy sau bước Cronbach's Alpha.
Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp nhiều biến quan sát xây dựng trong bảng hỏi thành một tập số ít các nhân tố có ý nghĩa hơn để dùng cho bước phân tích tương quan, hồi quy về sau. Nhiệm vụ của EFA sẽ gồm:
1. Xem các biến quan sát đầu vào trích được thành bao nhiêu nhân tố
2. Đánh giá tính hội tụ, phân biệt của các thang đo nhân tố
3. Xác định các biến quan sát không phù hợp với nghiên cứu cần loại bỏ
Xem chi tiết bài viết và video hướng dẫn thực hiện phân tích nhân tố khám phá EFA tại đây.
Kết quả trả về của phân tích EFA trên SPSS sẽ gồm ba bảng quan trọng:
→ Bảng KMO and Barlett’s Test cung cấp giá trị hệ số KMO và sig kiểm định Bartlett nhằm đánh giá phép phân tích EFA có hợp lệ hay không. Trị số của KMO phải đạt giá trị từ 0.5 trở lên và sig Bartlett phải nhỏ hơn 0.05 cho thấy phép phân tích EFA này hợp lệ, sử dụng được.
→ Bảng Total Variance Explained cung cấp giá trị tổng phương sai trích mà các nhân tố trích được giải thích cho các biến quan sát đầu vào. Tổng phương sai trích từ 50% cho thấy các nhân tố được trích là phù hợp.
→ Bảng Rotated Component Matrix cung cấp thông tin về tính hội tụ, phân biệt các nhân tố để xem các nhân tố có phù hợp chưa; đồng thời cũng cho biết hệ số tải các biến quan sát là bao nhiêu để đánh giá xem biến quan sát có đảm bảo chất lượng hay không.
4. Phân tích tương quan Pearson
Tương quan Pearson thường là phần thực hiện trước hồi quy trong các bước phân tích dữ liệu với SPSS. Mục đích phân tích tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau.
Xem chi tiết bài viết và video hướng dẫn thực hiện phân tích tương quan Pearson tại đây.
Kết quả trả về của phân tích Pearson trên SPSS sẽ gồm hệ số tương quan và giá trị sig kiểm định ý nghĩa hệ số tương quan.
→ Thường sẽ kỳ vọng sig tương quan giữa độc lập với phụ thuộc nhỏ hơn 0.05 và hệ số tương quan cao để cho thấy các biến độc lập có sự liên kết tốt với biến phụ thuộc, làm tiền đề cho bước phân tích hồi quy.
→ Thường sẽ kỳ vọng hệ số tương quan không quá cao trên 0.5 để tránh tình trạng cộng tuyến và đa cộng tuyến giữa các biến độc lập. Sig mối quan hệ tương quan giữa các biến độc lập không quá quan trọng.
5. Phân tích hồi quy tuyến tính bội
Hồi quy là bước phân tích quan trọng nhất trong quy trình phân tích dữ liệu SPSS cho luận văn cao học, bởi đây là bước giải quyết các giả thuyết nghiên cứu, mô hình nghiên cứu của bài. Nhiệm vụ của hồi quy sẽ gồm:
1. Xem các biến độc lập trong mô hình biến nào sẽ có sự tác động lên biến phụ thuộc
2. Xem các biến độc lập trong mô hình biến nào sẽ có sự tác động mạnh, biến nào tác động yếu lên biến phụ thuộc
3. Xem các biến độc lập trong mô hình biến nào sẽ có sự tác động thuận chiều, biến nào tác động nghịch chiều lên biến phụ thuộc
4. Xem mức độ ảnh hưởng chung của toàn bộ các biến độc lập lên biến phụ thuộc nhiều hay ít
Xem chi tiết bài viết và video hướng dẫn thực hiện phân tích hồi quy tuyến tính bội tại đây.
Kết quả trả về của phân tích hồi quy trên SPSS sẽ gồm ba bảng quan trọng:
→ Bảng ANOVA cung cấp giá trị sig kiểm định F nhằm đánh giá phép phân tích hồi quy có hợp lệ hay không. Trị số sig Bartlett phải nhỏ hơn 0.05 cho thấy phép phân tích hồi quy này hợp lệ, sử dụng được.
→ Bảng Model Summary cung cấp giá trị R bình phương và R bình phương hiệu chỉnh nhằm đánh giá mức độ ảnh hưởng chung của các biến độc lập lên biến phụ thuộc là nhiều hay ít.
→ Bảng Coefficients cung cấp giá trị sig kiểm định t ý nghĩa của từng biến độc lập trong mô hình. Trị số sig nhỏ hơn 0.05 cho thấy biến độc lập có tác động lên biến phụ thuộc. Ngoài ra, bảng này còn cung cấp hệ số hồi quy B và Beta để đánh giá mức độ tác động mạnh yếu của các biến độc lập cũng như chiều tác động là thuận hay nghịch.
6. Phân tích khác biệt trung bình T Test/ One-way ANOVA
Với bước thứ 6 trong quy trình xử lý dữ liệu SPSS cho luận văn thạc sĩ, chúng ta sẽ đi đến phần phân tích chuyên sâu hơn một chút để hỗ trợ việc đưa ra các giải pháp, kiến nghị của đề tài.
Trong nhiều trường hợp chúng cần so sánh giá trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa hai hay nhiều đối tượng. Chúng ta có hai biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng để tính trung bình và 1 biến định tính có nhiều nhóm giá trị để so sánh.
→ Việc đánh giá khác biệt này giúp chúng ta nhận diện sự khác biệt về hành vi giữa các nhóm đáp viên có thông tin cá nhân khác nhau. Từ đó có các giải pháp, hướng xử lý vấn đề phù hợp cho từng nhóm đối tượng.
a. Independent Sample T Test
Kiểm định Independent-Samples T Test được sử dụng khi muốn so sánh trung bình một biến định lượng giữa hai nhóm đối tượng đáp viên khác nhau. Ví dụ so sánh trung bình số tiền chi tiêu hàng tháng giữa các gia đình chưa có con và có con dưới 6 tuổi. Biến định lượng là số tiền chi tiêu mỗi tháng, biến định tính gồm hai giá trị phân loại với 1 là chưa có con và 2 là có con dưới 6 tuổi.
Xem chi tiết bài viết và video hướng dẫn thực hiện phân tích Independent Sample T Test tại đây.
Kết quả trả về của phân tích Independent Sample T Test trên SPSS là giá trị sig kiểm định t:
→ Giá trị sig của kiểm định t nếu nhỏ hơn 0.05 cho thấy có sự khác biệt trung bình giữa hai nhóm đối tượng.
b. One-way ANOVA
Trong phần trước chúng ta đã biết đến kiểm định Independent-Samples T Test để so sánh giá trị trung bình. Tuy nhiên, hạn chế của kiểm định này là chỉ cho phép chúng ta so sánh trung bình giữa hai nhóm giá trị với nhau. Trường hợp biến định tính có nhiều hơn hai nhóm, chúng ta sẽ cần sử dụng đến một kỹ thống kê khác là One-Way ANOVA hay còn gọi với tên Tiếng Việt là ANOVA một chiều.
Xem chi tiết bài viết và video hướng dẫn thực hiện phân tích One-way ANOVA tại đây.
Kết quả trả về của phân tích One-way ANOVA trên SPSS là giá trị sig kiểm định F hoặc kiểm định Welch:
→ Giá trị sig của kiểm định F hoặc kiểm định Welch nếu nhỏ hơn 0.05 cho thấy có sự khác biệt trung bình giữa các nhóm đối tượng.
Trên đây là quy trình 6 kiểm định cơ bản thường sử dụng trong phân tích dữ liệu SPSS luận văn thạc sĩ, cao học. Một số tính chất đề tài sẽ phát sinh thêm những loại kiểm định khác như kiểm định Chi bình phương, bảng kết hợp, phân tích phi tham số hoặc bổ sung thêm phân tích CFA trên AMOS sau bước EFA... Các bạn nên làm việc theo sự hướng dẫn, góp ý từ phía giảng viên hướng dẫn để đưa ra được một quy trình nghiên cứu phù hợp nhất.
Nếu các bạn gặp khó khăn trong quá trình phân tích, xử lý dữ liệu cho luận văn của mình và không có nhiều kinh nghiệm để xử lý các vấn đề phát sinh. Các bạn có thể liên hệ qua dịch vụ phân tích SPSS của Phạm Lộc Blog hoặc nhắn zalo 093 395 1549 để bên mình có thể tư vấn và hỗ trợ một cách tốt nhất nhé.