热线电话:13121318867

登录
2018-11-29 阅读量: 917
拟合优度
def multiple_r_squared(x, y, beta):
sum_of_squared_errors = sum(error(x_i, y_i, beta) ** 2
for x_i, y_i in zip(x, y))
return 1.0 - sum_of_squared_errors / total_sum_of_squares(y)

但是不要忘了,只要向回归模型中添加新的变量就必然导致 R 的平方变大。归根结底,前

面的简单回归模型只是这里的多重回归模型的特例而已, 即“工作时间”和“博士”这两列的系数都等于 0。因此,最优的多元回归模型,其误差一定不会高于简单回归模型。

因此,对于多重回归分析而言,我们还要考察系数的标准误差,即衡量每个 βi 的估计值的

可靠程度。

总的来说,回归模型通常能够很好地拟合我们的数据,但是,如果某些自变量是相关的

(或不相关的), 那么其系数就未必有多大的意义了。

对于这些误差, 传统的度量方法通常都带有一个前提假设,即误差 εi 是独立的正态随机变

量,其平均值为 0,标准偏差为 σ(未知)。那样的话,我们(或者说我们的统计软件)就

可以使用线性代数来确定每个系数的标准误差了。 这个误差越大,说明模型的系数越不靠

谱。

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子