bai tap SPSS mau – PDFCOFFEE.COM
Citation preview
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
Chƣơng trình giảng dạy kinh tế Fulbright Học kỳ Thu, 2010 CÁC PHƢƠNG PHÁP PHÂN TÍCH ĐỊNH LƢỢNG GỢI Ý LỜI GIẢI BÀI TẬP 1 THỐNG KÊ MÔ TẢ và phụ lục thực hành thống kê mô tả với phân mềm SPSS Bài 1 (25 điểm) Số liệu thu nhập hàng tuần (đơn vị: ngàn đồng) của hai nhóm công nhân như sau: Nhóm 1: 510, 580, 600, 640, 670 Nhóm 2: 580, 595, 600, 605, 620 a. Dựa vào định nghĩa và công thức, hãy tính các giá trị trung bình và trung vị của thu nhập trong mỗi nhóm Khi chưa rõ số liệu là của mẫu hay của tổng thể, bạn có thể giả định! Giả sử, chúng ta hiểu rằng đây là dữ liệu của mẫu. Chúng ta sẽ tính trung bình, trung vị của thu nhập cho mỗi nhóm. Nếu bạn hiểu rằng tổng thể là 10 công nhân trong 2 nhóm trên thì cũng không sai, khi đó bạn cần áp dụng các công thức tính các tham số thống kê của tổng thể. Số trung bình Thu nhập trung bình của mỗi công nhân ở nhóm 1 được tính theo công thức 5
x
i 1
x Nhóm1
i
5
nhóm1
510 580 600 640 670 5
3000 5
600 ngàn đồng
Thu nhập trung bình của mỗi công nhân ở nhóm 2 được tính theo công thức 5
x
i 1 nhóm 2
x Nhóm2
i
5
580 595 600 605 620 5
3000 5
600 ngàn đồng
Số trung vị Số lượng số liệu có trong mỗi nhóm là số lẻ, và chúng đã được sắp xếp từ nhỏ nhất đến lớn nhất. Vì vậy, với mỗi nhóm, số trung vị chính là giá trị nằm ở vị trí chính giữa (trong trường hợp này là ở vị trí thứ (n+1)/2=(5+1)/2=3) Trung vị của thu nhập đối với Nhóm 1 là 600 ngàn đồng Trung vị của thu nhập đối với Nhóm 2 cũng là 600 ngàn đồng
Cao Hào Thi / Nguyễn Khánh Duy
1
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
b. Dựa vào định nghĩa và công thức, hãy tính các giá trị Min, Max, Range, phương sai và độ lệch chuẩn của thu nhập trong mỗi nhóm Min, Max, và khoảng biến thiên Nhìn vào dãy dữ liệu đã được sắp xếp từ nhỏ đến lớn của mỗi nhóm, chúng ta dễ dàng xác định được Min, Max của mỗi nhóm, và từ đó áp dụng công thức Range=Max-Min để tính ra khoảng biến thiên của mỗi nhóm Với Nhóm 1, giá trị nhỏ nhất của thu nhập là 510 ngàn đồng (Min=510 ngàn đồng), giá trị lớn nhất của thu nhập là 670 ngàn đồng (Max=670 ngàn đồng), khoảng biến thiên của thu nhập là 160 ngàn đồng (bằng 670-510). Với Nhóm2, giá trị nhỏ nhất của thu nhập là 580 ngàn đồng (Min=580 ngàn đồng), giá trị lớn nhất của thu nhập là 620 ngàn đồng (Max=620 ngàn đồng), khoảng biến thiên của thu nhập là 40 ngàn đồng (bằng 620-580) Phƣơng sai và độ lệch chuẩn của mỗi nhóm Nhóm 1: Chúng ta có thể áp dụng công thức, lập ra bảng sau để tính phương sai, độ lệch i
xi
1 2 3 4 5 Tổng Trung bình Phƣơng sai Độ lệch
2
s
2 Nhóm1
xi- x
510 580 600 640 670 3000 600 3750 61.24
2
2
( xi x ) (510 600) (580 600) n 1
5 1
(xi- x )2
-90 -20 0 40 70
8100 400 0 1600 4900 15000
…
(670 600)
2
15000 4
3750
ngàn đồng2
s
Nhóm1
s
2 Nhóm1
3750
Cao Hào Thi / Nguyễn Khánh Duy
61 .24 ngàn đồng
2
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
Nhóm 2:
Tổng Trung bình Phƣơng sai Độ lệch 2
s
580 595 600 605 620 3000 600 212.5 14.58
2
( x i x ) (580 600) (595 600)
2 Nhóm 2
n 1
(xi- x )2
xi – x
xi
i 1 2 3 4 5
5 1
-20 -5 0 5 20
2
…
400 25 0 25 400 850
(620 600)
2
850 4
212.5
ngàn đồng2
s
Nhóm 2
s
2 Nhóm 2
212 .5
14 .58 ngàn đồng
c. Dựa vào các hàm trong Excel, hãy tính các đại lượng thống kê ở câu a và câu b Bạn có thể sử dụng các hàm thống kê (Xem Hình 1.1); hoặc công cụ Tools\Data Analysis\Descriptive Statistics của Excel, sau đó khai báo tương tự như Hình 1.2 để tính toán các chỉ tiêu cho từng nhóm Hình 1.1 Sử dụng hàm số
Với các hàm như trên, và thao tác như Hình 1.2 bạn sẽ có được kết quả như Hình 1.3
Cao Hào Thi / Nguyễn Khánh Duy
3
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
Hình 1.2
Hình 1.3 Kết quả tính toán từ hàm thống kê, và công cụ Data Analysis
Cao Hào Thi / Nguyễn Khánh Duy
4
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
d. Anh/Chị có nhận xét gì về thu nhập của hai nhóm công nhân này. Trong mẫu, thu nhập trung bình của hai nhóm công nhân là bằng nhau, và đều bằng 600 ngàn đồng. Tuy nhiên, thu nhập của những công nhân ở nhóm 2 ít biến thiên hơn so với nhóm 1; thật vậy, thu nhập của công nhân ở nhóm 1 dao động từ 510 ngàn đồng đến 670 ngàn đồng với khoảng biến thiên là 160; trong khi đó thu nhập của công nhân ở nhóm 2 có khoảng biến thiên nhỏ hơn, và bằng 40 (dao động từ 580 ngàn đồng đến 620 ngàn đồng). Bạn cũng có thể sử dụng thêm chỉ tiêu độ lệch, phương sai, hay tính toán thêm hệ số biến thiên … để nói lên rằng thu nhập của công nhân ở nhóm 2 ổn định hơn so với thu nhập của các công nhân ở nhóm 1. Vì cỡ mẫu của hai nhóm đều bằng 5, thêm vào đó, trung bình của hai nhóm đều như nhau, nên có thể so sánh độ lệch chuẩn của mỗi nhóm. Độ lệch chuẩn của nhóm 2 là 14.58 ngàn đồng nhỏ hơn so với độ lệch chuẩn của nhóm 1 (độ lệch chuẩn của nhóm một là 61.24 ngàn đồng). Điều này càng cho thấy mức độ biến thiên về thu nhập của nhóm 2 ít hơn so với nhóm 1. Bài 2 (25 điểm) Tập tin DataRestaurant300.xls ghi nhận dữ liệu về chất lượng bữa ăn và giá bữa ăn tại 300 nhà hàng. Từ bảng dữ liệu này, hãy trả lời những câu hỏi sau: a. Phân biệt loại biến và loại thang đo cho 2 biến số chất lượng bữa ăn và giá bữa ăn Hình 2.1
Cao Hào Thi / Nguyễn Khánh Duy
5
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
-Biến Chất lượng bữa ăn (Quality Rating) hiện chỉ có 3 biểu hiện là Good, Very Good, và Excellent thể hiện tính chất của bữa ăn. Vì vậy, có thể được xem là biến định tính. Biến này có thang đo thứ tự (hay thứ bậc) -Biến giá bữa ăn (Meal Price) là biến định lượng, và có thang đo tỷ lệ (nếu bạn trả lời là thang đo khoảng thì cũng không sai!) Mở rộng (không tính vào điểm bài tập): Với biến định lượng bạn có thể nhận định thêm xem nó là biến định lượng rời rạc hay liên tục. Và cũng chú ý rằng, định lượng hay định tính cũng chỉ mang tính chất tương đối! b. Hãy phân nhóm nhà hàng theo chất lượng bữa ăn. Vẽ biểu đồ tần số theo chất lượng bữa ăn Sử dụng kỹ thuật Data\Pivot Table trong Excel, bạn dễ dàng tạo ra được bảng Kết quả Hình 2.2
Từ dữ liệu đã có, Sử dụng Excel bạn có thể vẽ được biểu đồ tần số như sau Hình 2.3 Biểu đồ tần số về chất lượng bữa ăn 160
150
140
Số nhà hàng
120 100 84 80
66
60 40 20 0 Tốt
Rất tốt
Tuyệt vời
Chất lƣợng bữa ăn
Cao Hào Thi / Nguyễn Khánh Duy
6
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
c. Tìm các giá trị cực đại, cực tiểu, trung bình, trung vị và yếu vị của giá tiền bữa ăn Với kỹ thuật Tools\Data Analysis\Descriptive Statistics bạn có thể dễ dàng tìm được các giá trị cực đại, cực tiểu, trung bình, trung vị, và yếu vị của giá tiền bữa ăn Hình 2.4
Bảng 2.1 Meal Price ($) Mean (Trung bình) 25.90 Standard Error (Sai số chuẩn của giá trị trung bình) 0.54 Median (Trung vị) 25.00 Mode (Yếu vị) 20.00 Standard Deviation (Độ lệch chuẩn) 9.29 Sample Variance (Phương sai) 86.26 Kurtosis (chỉ tiêu Kurtosis đo lường độ nhọn của phân phối; Trong Excel & Eviews, Kurtosis=3 thì phân phối bình thường, Kurtosis>3 thì phân phối nhọn) -0.58 Skewness (chỉ tiêu Skewness đo lường độ cân xứng của phân phối; Phân phối cân xứng khi Skewness=0, Phân phối lệch phải khi Skewness>0), 0.31 Range (Khoảng biến thiên) 38.00 Minimum (Giá trị nhỏ nhất) 10.00 Maximum (Giá trị lớn nhất) 48.00 Sum (Tổng) 7769.00 Count (Số quan sát) 300.00
Cao Hào Thi / Nguyễn Khánh Duy
7
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
Mở rộng (không tính vào điểm bài tập): Để nhận định về độ cân xứng của phân phối trong tổng thể, một cách thuận tiện, theo kinh nghiệm, nếu Skewness nằm trong đoạn [-1,1] thì có thể nhận định rằng phân phối cân xứng. d. Có bao nhiêu nhà hàng có chất lượng bữa ăn được xếp loại chất lượng “very good” và giá bữa ăn vào khoảng từ $30 đến $39 Bạn có thể sử dụng công cụ lọc dữ liệu, kỹ thuật Data\Pivot Table trong Excel; hàm countif; sử dụng các hàm đơn giản if và sum…; hay sử dụng hàm cơ sở dữ liệu DCOUNT để tính ra kết quả này. Hình 2.5
Với hàm DCOUNT bạn có thể làm như sau: (1)Tạo ra vùng điều kiện như E2:G3, (2) Tại một ô nào đó, ví dụ ô E6, gõ lệnh =DCOUNT(A1:C301,A1,E2:G3), bạn sẽ ra kết quả là 46. Nói cách khác có 46 nhà hàng có chất lượng bữa ăn là “Very Good” và giá nằm trong khoảng từ $30 đến $39. Bài 3 (25 điểm) Tập tin DataExamscores.xls ghi nhận dữ liệu về điểm thi (tính trên thang điểm 100) của hai trung tâm đào tạo A và B. Mỗi trung tâm có 30 sinh viên được thăm dò. Từ bảng dữ liệu này, hãy trả lời những câu hỏi sau: a. Hãy tìm trung bình và trung vị của điểm thi ở trung tâm A Sử dụng công cụ Tools\Data Analysis\Descriptive Statistics của Excel, chúng ta dễ dàng có được bảng kết quả như Bảng 31. Từ bảng này, ta thấy: -Trung bình điểm thi của sinh viên ở trung tâm A là 82 điểm -Trung vị điểm thi của sinh viên ở trung tâm A là 83 điểm
Cao Hào Thi / Nguyễn Khánh Duy
8
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
Bảng 3.1 Center A Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count
82.00 1.68 83.00 79.00 9.22 85.03 -0.12 -0.43 37.00 60.00 97.00 2460.00 30.00
b. So sánh các giá trị tính được trong câu a, Anh/Chị có kết luận rằng phân phối của điểm thi ở trung tâm A có bị lệch xiên không. Nếu lệch xiên thì lệch về trái hay phải. Hãy giải thích ngắn gọn câu trả lời của Anh/Chị Vị trí giữa trung bình, trung vị có thể cho chúng ta biết hình dạng phân phối của biến là lệch trái, lệch phải hay cân xứng. Điểm thi của sinh viên ở trung tâm A có số trung bình nhỏ hơn trung vị nên phân phối điểm thi của sinh viên ở trung tâm A bị lệch xiên về phía trái. c. Sử dụng hàm trong trong Excel, xác định độ lệch xiên ở câu b. Kết quả ở câu c có phù hợp với câu b hay không Hình 3.1
Hệ số Skewness được tính từ hàm Skew trong Excel có kết quả là -.433. Skew nhỏ hơn 0 nên hệ số này cũng chỉ ra rằng phân phối điểm của sinh viên ở trung tâm A bị lệch trái.
Cao Hào Thi / Nguyễn Khánh Duy
9
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
———————————————————————————————————–Mở rộng (không tính vào điểm bài tập): Chú ý rằng, những nhận định về hình dáng của phân phối ở câu b, câu c là xét cho mẫu được khảo sát. Khi muốn kết luận về hình dạng phân phối xét trên tổng thể, chúng ta cần thực hiện những kiểm định phức tạp hơn. Bạn có thể đọc thêm về kiểm định Jarque-Bera, kiểm định Kolmogorov-Smirnov … One-Sample Kolmogorov-Smirnov Test diemttA N Normal Parametersa
30 Mean
82.0000
Std. Deviation
9.22141
Most Extreme
Absolute
.100
Differences
Positive
.052
Negative
-.100
Kolmogorov-Smirnov Z
.548
Asymp. Sig. (2-tailed)
.925
a. Test distribution is Normal.
P-value của thống kê Kolmogorov-Smirnov Z bằng 0.128 (>0.05) nên ở độ tin cậy 95% có thể chấp nhận giả thuyết cho rằng biến điểm thi của trung tâm A có phân phối chuẩn. Nói cách khác, sự lệch xiên của phân phối là không đáng kể. Nếu dùng SPSS, bạn sẽ dễ dàng vẽ biểu đồ sau để có cái nhìn trực quan về phân phối của biến này
—————————————————————————————————————-
Cao Hào Thi / Nguyễn Khánh Duy
10
Chương trình giảng dạy kinh tế Fulbright Năm học 2010-2011
Các Phương Pháp Phân Tích Định Lượng
Bài tập 1
d. Tìm giá trị chuẩn hóa Z cho giá trị quan sát lớn nhất và nhỏ nhất của điểm thi ở trung tâm B. Các giá trị này có lớn hay nhỏ bất thường không Bảng 3.2 Center B Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count
78.23 1.92 78.00 78.00 10.50 110.25 -0.61 0.06 42.00 57.00 99.00 2347.00 30.00
Trước tiên, bạn tính độ lệch, trung bình, và xác định giá trị nhỏ nhất, giá trị lớn nhất của điểm thi ở trung tâm B. Điểm thi của trung tâm B có Max=99 điểm , Min=57 điểm , độ lệch chuẩn s=10.5 điểm, x =78.23 điểm. Giá trị chuẩn hoá Z-score của x ở quan sát thứ i được tính bởi công thức z i
Giá trị lớn nhất có giá trị chuẩn hoá là z
x
x
i
s
99 78.23 1.98 . Giá trị lớn nhất, số 99, có 10.05
|z|