
最小二乘法線性擬合和2次曲線擬合算法
最近由于項目要求,應用了最小二乘法線性擬合和2次曲線擬合算法,現總結如下:
最小二乘法線性擬合應用已有的采樣時間點,再現這些點所描述的線性變化,即求出一個線性方程y=ax+b(這個算法的主要問題也就是如何用給定的數據求線性方程系數a和b)
//最小二乘法線性擬合,線性方程求系數,Xval時間數據,Yval每個時間點上的值數據,n數據的個數,Aval線性方程系數a,Bval線性方程系數b
BOOL DlgDataAnalyse::TwoCurveCompose(double *Xval,double *Yval,long n,double *Aval,double *Bval)
{
double mX,mY,mXX,mXY;
mX=mY=mXX=mXY=0;
for (int i=0;i
mX+=Xval[i];
mY+=Yval[i];
mXX+=Xval[i]*Xval[i];
mXY+=Xval[i]*Yval[i];
}
if(mX*mX-mXX*n==0)return FALSE;
*Aval=(mY*mX-mXY*n)/(mX*mX-mXX*n);
*Bval=(mY-mX*(*Aval))/n;
return TRUE;
}
最小二乘法2次曲線擬合應用已有的采樣時間點,再現這些點所描述的2次曲線的變化,即求出一個二次曲線方程y=ax2+bx+c (這個算法的主要問題也就是如何用給定的數據求方程系數abc)
今天使用擬合的最小二乘法,求出了給定的一組坐標系上的點對最接近的直線的。
其具體理論如下:
在科學實驗數據處理中,往往要根據一組給定的實驗數據,求出自變量x與因變量y的函數關系
,這是
為待定參數,由于觀測數據總有誤差,且待定參數ai的數量比給定數據點的數量少(即n<m),因此它不同于插值問題.這類問題不要求
通過點
,而只要求在給定點
上的誤差
的平方和
最小.當
時,即
(5.8.1)
這里是線性無關的函數族,假定在
上給出一組數據
,
以及對應的一組權
,這里
為權系數,要求
使
最小,其中
(5.8.2)
這就是最小二乘逼近,得到的擬合曲線為y=s(x),這種方法稱為曲線擬合的最小二乘法.
(5.8.2)中實際上是關于
的多元函數,求I的最小值就是求多元函數I的極值,由極值必要條件,可得
(5.8.3)
根據內積定義(見第三章)引入相應帶權內積記號
(5.8.4)
則(5.8.3)可改寫為
這是關于參數的線性方程組,用矩陣表示為
(5.8.5)
(5.8.5)稱為法方程.當線性無關,且在點集
上至多只有n個不同零點,則稱
在X上滿足Haar條件,此時(5.8.5)的解存在唯一(證明見[3]).記(5.8.5)的解為
從而得到最小二乘擬合曲線
(5.8.6)
可以證明對,有
故(5.8.6)得到的即為所求的最小二乘解.它的平方誤差為
(5.8.7)
均方誤差為
在最小二乘逼近中,若取,則
,表示為
(5.8.8)
此時關于系數的法方程(5.8.5)是病態方程,通常當n≥3時都不直接取
作為基。
//最小二乘法二次曲線擬合算法,Xval時間數據,Yval每個時間點上的值數據,M代表幾次曲線(如:2次的話就是3),N數據的個數,A二次曲線方程的系數(A[2]代表a,A[1]代表b,A[0]代表c)
BOOL DlgDataAnalyse::CalculateCurveParameter(double *Xval,double *Yval,long M,long N,double *A)
{
//X,Y -- X,Y兩軸的坐標
//M -- 次數,表示幾次曲線
//N -- 采樣數目
//A -- 結果參數
register long i,j,k;
double Z,D1,D2,C,P,G,Q;
CDoubleArray B,T,S;
B.SetSize(N);
T.SetSize(N);
S.SetSize(N);
if(M>N)M=N;
for(i=0;i
Z=0;
B[0]=1;
D1=N;
P=0;
C=0;
for(i=0;i
P=P+Xval[i]-Z;
C=C+Yval[i];
}
C=C/D1;
P=P/D1;
A[0]=C*B[0];
if(M>1)
{
T[1]=1;
T[0]=-P;
D2=0;
C=0;
G=0;
for(i=0;i
Q=Xval[i]-Z-P;
D2=D2+Q*Q;
C=Yval[i]*Q+C;
G=(Xval[i]-Z)*Q*Q+G;
}
C=C/D2;
P=G/D2;
Q=D2/D1;
D1=D2;
A[1]=C*T[1];
A[0]=C*T[0]+A[0];
}
for(j=2;j
S[j]=T[j-1];
S[j-1]=-P*T[j-1]+T[j-2];
if(j>=3)
{
for(k=j-2;k>=1;k--)
S[k]=-P*T[k]+T[k-1]-Q*B[k];
}
S[0]=-P*T[0]-Q*B[0];
D2=0;
C=0;
G=0;
for(i=0;i
Q=S[j];
for(k=j-1;k>=0;k--)
Q=Q*(Xval[i]-Z)+S[k];
D2=D2+Q*Q;
C=Yval[i]*Q+C;
G=(Xval[i]-Z)*Q*Q+G;
}
C=C/D2;
P=G/D2;
Q=D2/D1;
D1=D2;
A[j]=C*S[j];
T[j]=S[j];
for(k=j-1;k>=0;k--)
{
A[k]=C*S[k]+A[k];
B[k]=T[k];
T[k]=S[k];
}
}
return TRUE;
}
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24