线性回归是更常见的回归形式,通过一组数据点拟合线性模型。输出值 y 可预测为一条直线,且该直线可用如下表达式表示:
y = mixi + c + E
其中,xi 为输入变量,参数 mi、c 和 E 分别为回归系数、常数偏移量和误差。系数 mi 可解释为相应自变量每增加一个单位引起的因变量的增加量。普通线性回归模型中的参数是线性的,输入变量(自变量)和输出变量(因变量)通常以常数方差分布。
广义线性回归无需数据输入,也可具有正态分布。测试数据可具有任何分布。逻辑回归是广义线性回归的特例,其中响应变量须遵循 logit 函数。
logit 函数的输入为概率 p,值介于 0 和 1 之间。概率 p 的比值比定义为 p/(1-p),logit 函数定义为比值比或对数几率的对数。
Logit(p) = Log(odds) = Log (p/(1-p))