最小二乘法拟合线性曲线

2023-09-28 10:25:23

上一章采用梯度下降的方法拟合线性方程，经过10次迭代，仍然存在较大误差

本次采用最小二乘法的方法拟合线性方程，目的是提供不同视角，寻找最优解

根据《数值分析》[1] 提供的最小二乘法

设置一个函数 $y=S^*(x)$ 与所给出数据 ${(x_i,y_i),i=0,1,...,m\}$ 拟合，若记误差 $δ_i = S^*(x_i)-y_i(i=0,1,...,m),δ = (δ_0,δ_1,...,δ_m)^T$ ，设 $φ_0(x),φ_1(x),...,φ_n(x)$ 是 $C [a, b]$ 上线性无关的函数族，在 $φ=span\{φ_0(x),φ_1(x),...,φ_n(x)\}$ 中找一个函数 $S^*(x)$ ，使误差平方和

$||δ||_2^2 = ∑_{i=0}^m δ_i^2 = ∑_{i=0}^m [S^*(x_i) - y_i]^2 = min_{S(x) ∈ φ}∑_{i=0}^m [S(x_i) - y_i]^2 \tag{4.1}$
这里
$a_0φ_0(x) + a_1φ_1(x) +...+ a_nφ_n(x) (nS(x)=a0φ0(x)+a1φ1(x)+...+anφn(x)(n<m)(4.2)$

这就是一般的最小二乘逼近，用几何语言说，就称为曲线拟合的最小二乘法。

考虑不同点的比重 $ω(x_i)$ 不同，通常最小二乘法中 $δ||_2^2$ 都考虑加权平方和

$||δ||_2^2 = ∑_{i=0}^m ω(x_i)[S(x_i) - f(x_i)]^2 \tag{4.3}$
转换成函数求极值问题
$I(a_0,a_1,...,a_n) = ∑_{i=0}^m ω(x_i)[S(x_i) - f(x_i)]^2 \tag{4.4}$
$\frac{∂I}{∂a_k} = 2∑_{i=0}^m ω(x_i)[∑_{j=0}^m a_jφ_j(x_i)-f(x_i)]φ_k(x_i) = 0, k=0,1,...,n$
$(φ_j,φ_k) = ∑_{i=0}^m ω(x_i)φ_j(x_i)φ_k(x_i) \tag{4.5}$
令
$f,φ_k) = ∑_{i=0}^m ω(x_i)f(x_i)φ_k(x_i) = d_k,k=0,1,...,n$
则
$∑_{j=0}^n(φ_k,φ_j)a_j = d_k, k=0,1,...,n \tag{4.6}$

写成矩阵的形式

$G a = d$
$\begin{bmatrix} (φ_0,φ_0) (φ_0,φ_1) ... (φ_0,φ_n) \\ (φ_1,φ_0) (φ_1,φ_1) ... (φ_1,φ_n) \\ ... \\ (φ_n,φ_0) (φ_n,φ_1) ... (φ_n,φ_n) \\ \end{bmatrix}$

对于上一个实例，100 离散的点，每个点的权重相同，

$m=100, n=1, φ_0(x) = 1, φ_1(x)=x, ω_i = 1$
令
$S_1(x) = a_0 + a_1 x$
$φ_0,φ_0) = ∑_{i=0}^{100} 1 = 100 \\ (φ_0,φ_1) = (φ_1,φ_0) = ∑_{i=0}^{100} x_i \\ (φ_1,φ_1) = ∑_{i=0}^{100} x_i^2 \\ (φ_0,f) = ∑_{i=0}^{100} f_i \\ (φ_1,f) = ∑_{i=0}^{100} x_if_i \\$
$φ_0,φ_0)a_0 + (φ_0,φ_1)a_1 = (φ_0,f) \\ (φ_1,φ_0)a_0 + (φ_1,φ_1)a_1 = (φ_1,f)$
求解线性方程即可

import numpy as npdef get_line_ratio(points):φ_0_0 = len(points)  # ω =1φ_0_1 = 0.0φ_1_1 = 0.0φ_f_0 = 0.0  # φ0fφ_f_1 = 0.0for i in range(φ_0_0):φ_0_1 += points[i][0]φ_1_1 += points[i][0] * points[i][0]φ_f_0 += points[i][1]φ_f_1 += points[i][0] * points[i][1]return np.linalg.solve(np.array([[φ_0_0, φ_0_1], [φ_0_1, φ_1_1]]), np.array([φ_f_0, φ_f_1]))

在这里插入图片描述
绿色为原方程，蓝色线为最小二乘法拟合的线，红色为梯度下降训练得到的线

可以看出，使用最小二程拟合得到线与原来的线几乎重合，拟合效果较好

[ 1] 数值分析. 李庆扬,王能超,易大义.清华大学出版社.第五版.p73-p75

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 最小二乘法拟合圆c语言,最小二乘法拟合圆
下一篇 > 最小二乘法拟合曲线原理及其Matlab实现

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

最小二乘法拟合线性曲线

相关文章