在统计学里, 我们经常需要对数据做线性回归, 画上一条最佳描述数据关系的直线. 假设此线的表达为: y = a0 + a1 x, 众所周知, 两个系数(a0, a1)通常是用最小二乘法而求得的.
假设我们有数据点(x_i , y_i), i = 1,2,...,n, 在最小二乘法里面, 我们设一个"惩罚函数"(penalty function): p(a0, a1) = sum_{i=1}^n (y_i - a0 - a1 x_i)^2 (平方差的和), 然后选择(a0, a1)令惩罚函数达到最小. 其实, 最小二乘法不是唯一的回归方法, 我们可以用另外一个惩罚函数:
p(a0, a1) = sum_{i=1}^n |y_i - a0 - a1 x_i | (不用平方差和, 而用绝对差和)
这种回归叫做"绝对差回归". 好了, 现在开始提问题了:
1. 求证: 如果用绝对差回归方法来画回归线的话, 那么所画的回归线必定要经过至少一个数据点.
2. 以上情况对于用最小二乘法来画来做回归显然是不成立的. 在什么条件下, 用最小二乘法做回归是, 也会得到1里面所说的情况?
|