(1)求出样本中的平均受教育程度。最低和最高受教育年数是多少?
(2)求出样本中的平均小时工资。它看起来是高是低?
(3)工资数据用 1976 年的美元报告。利用(2004 年或以后的)《总统经济报告》,求出并
报告 1976 年和 2003 年的消费者价格指数(CPI)。
(4)利用(3)部分的 CPI 值,求以 2003 年美元度量的平均小时工资。现在,平均小时工资
看起来合理了吗?
(5)样本中有多少女人和男人?
准备:
在 RStudio 中导入 WAGE1
attach(WAGE1) #绑定数据集 WAGE1
(1) 求出样本中的平均受教育程度。最低和最高受教育年数是多少?
mean(educ) #求均值
min(educ) #求最小值
max(educ) #求最大值
summary(educ) #我们还可以通过描述性统计一次性获得以上统计量
(2) 求出样本中的平均小时工资。它看起来是高是低?
mean(wage) #求均值
可得到均值为 5.896103 美元/小时,看上去比较低
(3) 工资数据用 1976 年的美元报告。利用(2004 年或以后的)《总统经济报告》,求出并
报告 1976 年和 2003 年的消费者价格指数(CPI)。
根据 2004 Economic Report of the President 的表 B-601, 1976 年的 CPI 是 56.9, 2003 的 CPI 是
184.0 。本小题不用计算,直接查表即可。
(4) 利用(3)部分的 CPI 值,求以 2003 年美元度量的平均小时工资。现在,平均小时工资
看起来合理了吗?
184/56.9* mean(wage) #用 2003 年美元度量平均小时工资。
sum(female) #由于 female 变量中是女性的观测赋值 1,男性为 0,所以直接求和即可得到女性
观测总量。
length(female)-sum(female) #length()可求得总共有多少个观测,总个体减去女性个体即为男性
个体总数。
detach(WAGE1) #解除绑定数据集 WAGE1
(5) 样本中有多少女人和男人?
暂无数据