401k.RAW 中的数据是帕普克(Papke, 1995)所分析数据的一个子集,帕普克是为了研究 401
(k)养老金计划的参与率和该计划的慷慨程度之间的关系。变量 prate 是有资格参与该计划
的员工中拥有活动账户的百分比,也是我们要解释的变量。慷慨程度指标是计划的匹配率
mrate。这个变量给出了员工每向这个账户存 1 美元,公司为该员工匹配的平均数量。例如,
mrate=0.50,则员工每投入 1 美元,公司就匹配 50 美分。
(1)求出该计划的样本中平均参与率和平均匹配率。
(2)现在估计下面这个简单回归方程
在 RStudio 中导入 401k
attach(X401K) #绑定数据集 x401k,由于 401k 文件由数字打头, R 自动将数据集 401k 的名称
改为了 X401K
library(mice) #载入检查缺失值的包 mice。
md.pattern(X401K) #检查一下是否有缺失值。结果是没有。
mean(salary) #计算平均年薪,结果是 865.8644(千美元)。
mean(ceoten) #计算平均任期,结果是 7.954802(年)。
(2)有多少 CEO 尚处于担任 CEO 的第一年(也就是说, ceoten=0) ?最长的 CEO 任期是多
少?
table(ceoten) #获得 CEO 任期变量 ceoten 的频数表:
ceoten
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 24 26 28 34 37
5 19 10 21 21 10 11 6 11 8 8 4 7 7 5 2 2 2 1 2 4 1 1 3 2 1 1 2
结果显示 ceoten 为 0 的人数有 5 个。任期最长为 37 年,有 2 人。
暂无数据