8.2一元线性回归模型及其应用教学建议
重点:一元线性回归模型的含义,最小二乘估计的原理与方法,残差分析。
难点:一元线性回归模型参数最小二乘估计的推导,解释预测值的含义,理解刻画模型拟合效果的指标。
本节要研究在相关较强的情况下,如何刻画它们之间的具体关系。
首先通过与函数模型的比较,引入刻画两个变量之间随机关系的一元线性回归模型,然后用最小二乘法估计模型的参数得到经验回归方程,再利用经验回归方程模型进行预测,为了评价和改进模型,还引入残差和残差图,通过对不同模型拟合效果的比较,培养学生的数据分析素养。
分析发现,儿子身高与父亲身高之间不满足函数关系 ,需要引入新的模型刻画两者关系,发现成对数据对应的散点大致在一条直线附近的特点,在一次函数基础上,通过引入随机误差项,建立刻画两个变量之间随机关系的一元线性回归模型。
任何统计模型都有一定的假设条件,搞清楚模型的假设才能真正理解模型的含义。无论解释变量取什么值,随机误差的均值和方差都是确定的值。
如果散点图中的散点是在某个函数曲线附近,而不是所有的点都在曲线上,则可用回归模型刻画,特别地,如果散点图中的点是在一条直线附近,则可用一元线性回归模型刻画。
随机误差项是一元线性回归模型不同于一次函数的关键。在多数实际问题中,随机误差的分布近似服从正态分布。为了模型的简单,将影响响应变量的因素都放在随机误差中。随机误差可能是正的,也可能为负的,多次观测出现的正负误差会相互抵消,因为可以假设其期望为0,不然,如果为一个不为0的常数,则可将其合并到截距项中,否则模型无法识别,即参数没有唯一解,实际上,在统计建模中也不希望模型有系统误差,即模型不存在非
