熱線電話:13121318867

登錄
首頁精彩閱讀sql中插值法完成缺失數據的填充
sql中插值法完成缺失數據的填充
2017-12-04
收藏

sql中插值法完成缺失數據的填充

從Excel中導入了一批數據到Sqlserver,但因為原始數據不全,中間有些數據漏掉了。比如下面這種情況。ID為2的so數據為0。ID為3,4的co1數據缺失了,暫時用0代替。
ID  so    co1
1   0.1   0.1
2   0     0.2
3   0.2   0
4   0.25  0
5   0.2   0.4
使用差值法將這些缺失的數據補齊。插值計算方法如下:(也可以不使用這兩個步驟,只要最后的結果一致就行)
步驟一:計算缺失值上下的已知值間的斜率:
k = (b2 - b1)/(n + 1)   n 為缺失數據的個數
步驟二:計算對應的缺失值
a(i) = b1 + k * i
經過處理后,得到的數據是這樣的:
ID  so    co1
1   0.1   0.1
2   0.15  0.2
3   0.2   0.27
4   0.25  0.33
5   0.2   0.4
現在希望在sqlserver中寫一個存儲過程,自動完成上述過程。
so,co1為原始表的字段,這樣的字段一共有七八個。所以一次可以只考慮一個字段的缺失值填充。
b2 b1是缺失數據前后的正常數據。比如
ID  co1 
1   0.1 
2   0.2 
3    0 
4    0 
5   0.4
這里b2為ID=5,b1為ID=2的數據。b2和b1需要在sql過程中去判斷。
k是插值的斜率
i為第幾個缺失數據。比如這里在填充ID為3,co1的數據時,i=1。填充ID為4,co1的數據時,i=2。
---------
SQL 語句
方法通過排序的方式求得的@NUM1和@NUM2,但缺失數據多的時候,不再適用了啊。
IF OBJECT_ID('TB') IS NOT NULL DROP TABLE TB
IF OBJECT_ID('FUN_SO') IS NOT NULL DROP FUNCTION FUN_SO
IF OBJECT_ID('FUN_CO1') IS NOT NULL DROP FUNCTION FUN_CO1
GO
CREATE TABLE TB(
ID INT,
SO NUMERIC(19,2),
CO1 NUMERIC(19,2)
)
INSERT INTO TB
SELECT 1,  0.1,  0.1 union all
SELECT 2,  0,    0.2 union all
SELECT 3,  0.2,  0 union all
SELECT 4,  0,    0 union all
SELECT 5,  0,    0.4 union all
SELECT 6,  0.1,  0.5 
GO
CREATE FUNCTION FUN_SO(@ID INT)
RETURNS NUMERIC(19,2)
AS
BEGIN

DECLARE @NUM1 NUMERIC(19,2),@ID1 INT,@NUM2 NUMERIC(19,2),@ID2 INT
SELECT TOP 1 @ID1=ID , @NUM1=SO  FROM TB WHERE ID<=@ID AND SO<>0 ORDER BY ID DESC

SELECT TOP 1 @ID2=ID , @NUM2=SO  FROM TB WHERE ID>=@ID AND SO<>0 ORDER BY ID ASC
IF @ID2<>@ID1
RETURN @NUM1+(((@NUM2-@NUM1)/(@ID2-@ID1))*(@ID-@ID1))

RETURN @NUM1
END
GO
CREATE FUNCTION FUN_CO1(@ID INT)
RETURNS NUMERIC(19,2)
AS
BEGIN

DECLARE @NUM1 NUMERIC(19,2),@ID1 INT,@NUM2 NUMERIC(19,2),@ID2 INT
SELECT TOP 1 @ID1=ID , @NUM1=CO1  FROM TB WHERE ID<=@ID AND CO1<>0 ORDER BY ID DESC

SELECT TOP 1 @ID2=ID , @NUM2=CO1  FROM TB WHERE ID>=@ID AND CO1<>0 ORDER BY ID ASC
IF @ID2<>@ID1
RETURN @NUM1+(((@NUM2-@NUM1)/(@ID2-@ID1))*(@ID-@ID1))

RETURN @NUM1
END
GO
SELECT ID,DBO.FUN_SO(ID),DBO.FUN_CO1(ID) FROM TB

/*
10.100.10
20.150.20
30.200.27
40.170.33
50.130.40
60.100.50
*/

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢