【总离差平方和】在统计学中,总离差平方和(Total Sum of Squares, 简称TSS) 是衡量数据点与数据均值之间差异程度的重要指标。它反映了数据整体的波动性,是回归分析、方差分析等统计方法中的基础概念之一。
一、定义
总离差平方和是指所有观测值与其平均值之差的平方和。数学表达式如下:
$$
\text{TSS} = \sum_{i=1}^{n}(y_i - \bar{y})^2
$$
其中:
- $ y_i $ 表示第 $ i $ 个观测值;
- $ \bar{y} $ 表示所有观测值的平均数;
- $ n $ 表示样本数量。
二、意义
总离差平方和主要用于:
- 衡量数据的总体变异性;
- 在回归分析中,作为计算决定系数(R²)的基础;
- 比较不同模型对数据解释能力的强弱。
三、与其他统计量的关系
| 概念 | 定义 | 公式 | 作用 |
| 总离差平方和(TSS) | 所有数据点与均值的偏差平方和 | $\sum (y_i - \bar{y})^2$ | 反映数据总体波动 |
| 回归平方和(ESS) | 回归模型解释的变异部分 | $\sum (\hat{y}_i - \bar{y})^2$ | 表示模型对数据的解释力 |
| 残差平方和(RSS) | 模型未能解释的变异部分 | $\sum (y_i - \hat{y}_i)^2$ | 表示误差大小 |
在回归分析中,有如下关系成立:
$$
\text{TSS} = \text{ESS} + \text{RSS}
$$
四、应用实例
假设某班级学生的数学成绩如下(单位:分):
| 学生 | 成绩($ y_i $) | 与均值的差($ y_i - \bar{y} $) | 差的平方($ (y_i - \bar{y})^2 $) |
| A | 80 | -5 | 25 |
| B | 85 | 0 | 0 |
| C | 90 | 5 | 25 |
| D | 75 | -10 | 100 |
| E | 90 | 5 | 25 |
计算过程:
- 均值 $ \bar{y} = \frac{80 + 85 + 90 + 75 + 90}{5} = 84 $
- TSS = 25 + 0 + 25 + 100 + 25 = 175
五、总结
总离差平方和是一个重要的统计指标,用于衡量数据的整体波动情况。通过与回归平方和和残差平方和的比较,可以评估模型对数据的拟合效果。理解TSS有助于深入掌握统计分析的基本原理,并为后续的建模与分析提供依据。
表格总结:
| 指标 | 公式 | 作用 |
| 总离差平方和 | $\sum (y_i - \bar{y})^2$ | 衡量数据总体波动 |
| 回归平方和 | $\sum (\hat{y}_i - \bar{y})^2$ | 模型解释的变异部分 |
| 残差平方和 | $\sum (y_i - \hat{y}_i)^2$ | 模型未解释的变异部分 |
如需进一步了解相关统计模型或实际应用场景,可继续探讨。


