2018-11-29
阅读量:
917
拟合优度
def multiple_r_squared(x, y, beta):
sum_of_squared_errors = sum(error(x_i, y_i, beta) ** 2
for x_i, y_i in zip(x, y))
return 1.0 - sum_of_squared_errors / total_sum_of_squares(y)
但是不要忘了,只要向回归模型中添加新的变量就必然导致 R 的平方变大。归根结底,前
面的简单回归模型只是这里的多重回归模型的特例而已, 即“工作时间”和“博士”这两列的系数都等于 0。因此,最优的多元回归模型,其误差一定不会高于简单回归模型。
因此,对于多重回归分析而言,我们还要考察系数的标准误差,即衡量每个 βi 的估计值的
可靠程度。
总的来说,回归模型通常能够很好地拟合我们的数据,但是,如果某些自变量是相关的
(或不相关的), 那么其系数就未必有多大的意义了。
对于这些误差, 传统的度量方法通常都带有一个前提假设,即误差 εi 是独立的正态随机变
量,其平均值为 0,标准偏差为 σ(未知)。那样的话,我们(或者说我们的统计软件)就
可以使用线性代数来确定每个系数的标准误差了。 这个误差越大,说明模型的系数越不靠
谱。
0.0000
0
3
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论