相关系数 R 描述了自变量 xi 对因变量 yi 的解释程度,反映数据与模型拟合的紧密程度。数值位于 [-1, 1] 区间,绝对值接近 1 表示强相关性。若 R 大于 0,代表正相关;若 R 小于 0,为负相关。
决定系数 R2 则综合了 R 的信息,同时考虑了模型中其他因素对预测变量的影响。它表示模型能解释的总变异比例。计算公式为 R2 = SSR / SST,其中 SSR 是残差平方和,SST 是总平方和。
R2 的值同样位于 [0, 1] 区间。数值接近 1 表示模型解释力强,能够较好地预测数据。反之,接近 0 则表示模型解释力弱,预测效果不佳。
在选择模型时,R2 被广泛应用于评估模型拟合优度。然而,需要注意的是,R2 自身并非完美,它可能会随模型复杂度增加而提高,即使模型并未实质改善解释能力。因此,合理选择模型需结合 R2 与其他评估指标综合考量。
相关系数 R 与决定系数 R2 分别从不同角度评价模型拟合程度,其中 R 描述变量间关联强度,R2 揭示模型解释数据变异的效率。合理利用二者,有助于深入理解模型性能及预测能力。