原帖由 武骧金星 于 2015-3-3 01:11 发表
话说interpolate extrapolate有啥本质区别呢?公主都强调俩回了(不是问字典里的意思,而是公主为啥说extrapolate不靠谱呢)
反正是水泊我歪得更远点吧,公主提到量化基金啊,Convex Hull之类的概念。话说我 ...
假设你有已知数据点 x = 0, 0.1,...,1。通过参数估算(例如,最小二乘法)建模型 y = 2x + 1。这个模型的有效性,当 x 在 0 和 1 之间的时候相对最好,这个是 interpolate。当输入 x < 0 或 x > 1 的时候,效果一般更差,这是 extrapolate。
多元模型的情况,我们需要把区域判断改成 convex hull 判断。一个 n 维空间对 m 个数据点的 convex hull,是最小的 convex set C 使得所有 m 个数据点都在 C 之内。Convex set 的定义是,如果任何两点 p,q (n 维向量)都属于 C,则对于全部 a 属于 (0,1) ,r(a) = ap+(1-a)q 也属于 C。如果 prediction set 全部在 training set 的 convex hull 之内,这个属于 interpolate,否则就有一部分是 extrapolate。同理,interpolate 的准确性往往远高于 extrapolate,当然也有可能两个都不怎么样。
量化方式对基金的作用很大啊,但前提是你要交足学费。借孙子兵法一句话,不能尽知数学之害者,则不能尽得数学之利也。类似于在 convex hull 之外做 extrapolation,就是很多人必交的学费之一。量化方法的最大好处,在我看来是解决分歧。比如说 A 有一套炒股理论,B 有一套不同的理论,你经常会看到 A/B 两人骂到不行。但如果你拿一个数学模型,把 A, B 两人的理论作为因子,那么你是可以估算出最合理权重的。
[ 本帖最后由 潁潁 于 2015-3-3 01:35 编辑 ]