Thống kê mô tả là kỹ thuật giúp người nghiên cứu mô tả tổng quát về đặc điểm của mẫu nghiên cứu và kết quả khảo sát có được. Ví dụ: mẫu khảo sát có bao nhiêu nam, bao nhiêu nữ; có bao nhiêu người tại TP. Hồ Chí Minh, bao nhiêu người ở Hà Nội, bao nhiêu ở các tỉnh khác...
1. Mục đích sử dụng thống kê tần số
Kết quả từ thống kê tần số giúp chúng ta đánh giá được tổng quát đặc điểm của mẫu nghiên cứu: đáp viên thiên về nữ giới hay nam giới, chủ yếu là người già hay trẻ, nghề nghiệp là gì, sinh sống ở đâu,… Thống kê tần số trả về kết quả là bảng tần số cho biết số lượng, tỷ lệ cơ cấu phần trăm của giá trị. Ví dụ, thống kê tần số cho biến Giới tính với 2 giá trị Nam/Nữ, chúng ta có được kết quả trong 150 người trả lời có 45 người là Nam chiếm tỷ lệ 30%, còn lại 105 người là Nữ chiếm tỷ lệ 70%.
Dựa trên kết quả thống kê tần số, chúng ta sẽ xem xét đối tượng nghiên cứu như vậy có phù hợp với mục đích và kế hoạch ban đầu hay không. Giả sử nghiên cứu chúng ta đang điều tra hành vi mua hàng của nữ giới, nhưng kết quả thống kê từ dữ liệu lại trả về đại đa số là nam giới, điều này đi ngược với kế hoạch đề ra. Hay nghiên cứu cần đánh giá mức độ quan tâm của giới trẻ đến việc sử dụng mạng xã hội nhưng kết quả thống kê lại cho thấy đáp viên có độ tuổi trên 45 chiếm tỷ trọng rất lớn, điều này là hoàn toàn không phù hợp với mục đích nghiên cứu.
2. Thống kê tần số trên SPSS 26
Chúng ta sẽ thực hiện thống kê tần số cho các biến thông tin cá nhân như ví dụ dưới đây bằng cách vào Analyze > Descriptive Statistics > Frequencies…
Tại cửa sổ Frequencies, đưa các biến cần thống kê tần số từ cột bên trái vào mục Variable(s) bên phải. Trong hướng dẫn này, tác giả sẽ thực hành mẫu với các biến định tính thông tin cá nhân, chúng ta hoàn toàn có thể linh động sử dụng cho các biến khác tùy vào mục đích thống kê tần số của mình. Nếu muốn xem xét tỷ lệ đáp viên chọn vào đáp án 1, 2, 3, 4, 5 trên thang đo Likert 5 mức độ, chúng ta sẽ đưa các câu này vào để thống kê tần số.
Sau khi đã đưa các biến cần thống kê tần số vào mục Variable(s), nhìn sang bên phải có các tùy chọn Statistics, Charts, Format, Style và Bootstrap, đây là các mục để chúng ta mô tả sâu hơn dữ liệu. Tuy nhiên, hai mục được sử dụng nhiều nhất là Statistics và Charts. Trong tùy chọn Statistics, SPSS cung cấp cho chúng ta các thông số thống kê tiêu chuẩn như mean, median, std. deviation,… và hai thông số phân phối dữ liệu skewness, kurtosis.
Tùy vào mong muốn cần đọc kết quả gì, chúng ta sẽ tích chọn vào các mục tương ứng. Cụ thể trong trường hợp này, tác giả chỉ muốn đánh giá cơ bản về thông tin mẫu nên để mặc định các thông số của phần mềm, không tích chọn gì thêm. Nhấp Continue để quay về cửa sổ ban đầu.
Tiếp đến là tùy chọn Charts. Tùy chọn này cho phép SPSS xuất ra biểu đồ cơ cấu cho các biến đưa vào thống kê tần số. Các dạng biểu đồ được tích hợp trong tùy chọn Charts gồm: Bar charts (biểu đồ cột), Pie charts (biểu đồ tròn), Histograms (biểu đồ phân phối tần suất). Mục Chart Values bên dưới sẽ sáng lên và cho phép chọn dạng hiển thị tần số Frequencies (số người trả lời) hay phần trăm Percentages (tỷ trọng số người trả lời) khi chúng ta chọn hai dạng biểu đồ Bar charts hoặc Pie charts. Với dạng thống kê tần số cho các biến thông tin cá nhân, tác giả sẽ tích vào biểu đồ Pie charts kèm với lựa chọn Chart Values là Percentages để xuất biểu đồ tròn tỷ lệ cơ cấu. Sau đó nhấp Continue để quay lại cửa sổ ban đầu, tiếp tục nhấp vào OK để xuất kết quả ra output.
Bảng đầu tiên chúng ta sẽ chú ý là Statistics. Bảng này cho chúng ta thông tin chung về biến đưa vào chạy thống kê. Valid cho biết số quan sát có giá trị hợp lệ (số người có trả lời), Missing cho biết số quan sát bị thiếu dữ liệu (số người không trả lời). Trường hợp có Missing, chúng ta cần kiểm tra lại giá trị trống đó là bản chất câu hỏi hay do chúng ta có sai sót trong khi nhập liệu để xử lý giá trị này một cách phù hợp.
Tiếp theo là bảng tần số của từng biến và biểu đồ tương ứng, mỗi biến đưa vào thực hiện thống kê tần số sẽ có một bảng riêng, ví dụ như biến Độ tuổi bên dưới. Ý nghĩa các thông số của bảng:
- Frequency: Tần số (Có 81 người thuộc nhóm Từ 18 - 25 tuổi; có 134 người thuộc nhóm Từ 26 - 35 tuổi,…).
- Percent: Tỷ lệ phần trăm (Nhóm Từ 18 - 25 tuổi chiếm tỷ lệ 23.1%; nhóm Từ 26 - 35 tuổi chiếm tỷ lệ 38.3%,…).
- Valid Percent: Tỷ lệ phần trăm chỉ tính trên các giá trị hợp lệ. Nếu không có Missing, giá trị cột Valid Percent sẽ bằng với giá trị cột Percent.
- Cumulative Percent: Tỷ lệ phần trăm tích lũy chỉ tính trên các giá trị hợp lệ. Tỷ lệ phần trăm sẽ cộng dồn tới khi đủ 100% (Nhóm Từ 18 - 25 tuổi chiếm tỷ lệ 23.1%; nhóm Từ 18 - 25 tuổi và Từ 26 - 35 tuổi chiếm tổng tỷ lệ 61.4%,…).
Trong tổng số 350 người tham gia trả lời phiếu khảo sát, có 81 người thuộc độ tuổi từ 18 đến 25 tuổi chiếm tỷ trọng 23.1%, 134 người thuộc độ tuổi từ 26 đến 35 tuổi chiếm tỷ trọng 38.3%, 89 người thuộc độ tuổi từ 36 đến 45 tuổi chiếm tỷ trọng 25.4% và có 46 người trên 45 tuổi chiếm tỷ trọng 13.1%. Từ kết quả này có thể thấy, nhân viên trong công ty đa phần có độ tuổi dưới 45, tập trung nhiều nhất ở độ tuổi 26 đến 35 tuổi. Đây là độ tuổi lao động lý tưởng, có sự kết hợp giữa nhóm lao động trẻ giàu năng lượng cùng với nhóm lao động có khá nhiều kinh nghiệm làm việc.