熱線電話:13121318867

登錄
首頁精彩閱讀SPSS編程在Ridit分析中的應用
SPSS編程在Ridit分析中的應用
2018-03-04
收藏

SPSS編程在Ridit分析中的應用

多樣本有序分類資料(或等級資料)我們一般采用非參數檢驗——H檢驗(Kruskal-Wallis法),但其結論只得出三組或多組間總的有差別,若要知道兩兩間是否有差別,則沒有Ridit分析只要一次就能得出兩兩比較結果那么方便。Ridit分析是一種關于等級資料進行對比組與標準組比較的假設檢驗方法,其基本思想是先確定一個標準組(常用以往積累資料或樣本含量相當大的資料)作為特定總體,求得各等級的R值,標準組平均R值理論上可以證明等于0.5,其它各組與標準組比較,看其可信區間是否與0.5重疊,來判斷組間的統計學顯著性[1],最后得出專業解釋。而Ridit分析在SPSS中卻沒有現成的模塊,但我們可以通過編程可以方便的實現之,茲介紹下:
1.  建立或調用SPSS數據文件
某醫生用三種方劑治療某婦科病,療效如表1,問三種方劑的療效有無差別[2]。首先建立表1的1~4列數據文件,EFFECT:療效(1:無效,2:好轉,3:顯效,4:控制);A:糖衣片頻數;B:黃酮片頻數;C:復方組頻數。
表1 三種方劑療效比較的SPSS數據文件(第1~4  列)及編輯后運行的各等級Ridit值計算表
療效 糖衣片 黃酮片
A EFFECT B
② ① ③
1 48 5
2 184 16
3 77 18
4 52 19
2.SPSS程序的編制和運行
(1)在數據編輯窗口(Data Editor),通過通過菜單選擇:File→New→Syntax,打開語句編輯窗口(Syntax Editor);若已經建立程序,可通過Open→Syntax直接打開。
(2)在語句編輯窗口,用鍵盤輸入表2的程序。
表2 Ridit分析的SPSS程序(不要輸入行號)
行號  程序  行號  程序
1  CREATE L=CSUM(A).  17  T-TEST
2  COMPUTE L1=LAG(L,1).  18   /TESTVAL=0
3  IF (effect=1) L1=0.  19   /VARIABLES=R
4  COMPUTE D=A/2.  20   /CRITERIA=CIN (.95) .
5  COMPUTE T=L1+D.  21  WEIGHT BY B .
6  IF (EFFECT=4) S=L.  22  T-TEST
7  SORT CASES BY EFFECT(D).  23   /TESTVAL=0
8  LOOP IF (EFFECT<4).  24   /VARIABLES=R_B
9  COMPUTE S1=LAG(S,1).  25   /CRITERIA=CIN (.95) .
10  COMPUTE S=S1.  26  WEIGHT BY C .
11  END LOOP IF (EFFECT=1).  27  T-TEST
12  COMPUTE R=T/S.  28   /TESTVAL=0
13  SORT CASES BY EFFECT(A).  29   /VARIABLES=R_C
14  COMPUTE R_B=R.  30   /CRITERIA=CIN (.95) .
15  COMPUTE R_C=R.  31  EXECUTE.
16  WEIGHT BY A .    
以上程序在語句編輯窗口輸入時,不要輸入行號,程序中的英文字母不分大、小寫。另外該程序也可在Word、記事本等其他文本編輯軟件中編輯,然后只要通過復制將程序粘貼到Syntax Editor窗口。
(3)在語句編輯窗口,通過菜單選擇:Run→All運行程序。
3.結果解釋
以上程序是以糖衣片(A)組作為標準組計算R值,L:累積頻數(為求L1的中間變量);L1:累積頻數下移一行;D:標準組各等級之半;T:為L1欄加上D欄的值;S:標準組的總例數;S1(為求S的中間變量);R:標準組的R值。程序運行后,還可在Output窗口中查看到A、B、C三組的平均R值及95%的可信區間:糖衣片的平均R值為0.5,與理論相符,說明計算正確;黃酮片:平均R值為0.6493,95%CI(0.5758,0.7228);復方片:平均R值為0.5045,95%CI(0.4371,0.5718)。根據可信區間是否與標準組(理論上為0.5)相交來決定各對比組間的顯著性水平,如圖1,糖衣片的R值對應于0.5,復方片95%的可信區間與糖衣片平均R值(理論上為0.5)重疊,所以P>0.05,故復方片與糖衣片之間的療效無統計學顯著性,尚不能認為兩者療效間有統計學差異;而黃酮片可信區間與理論R值0.5不重疊,則P<0.05,故黃酮片與糖衣片之間的療效存在統計學顯著性;同理可知,黃酮片與復方片的可信區間也不重疊,故兩者療效存在統計學差異。

圖2 標準組平均R值、對比組平均R值及95%可信區間
4.程序解釋
第1~3行:計算標準組累計頻數(移下一行)。CSUM(Cumulative sum)為計算標準組的累加和L,LAG(variable,ncases)為數值型函數或字符型函數[2],返回數據集中某一變量(variable)的ncases之前的觀測值所屬變量的值,對第1個觀察值來說,將返回缺失值(數值型變量)或空格(字符型變量)[3]。本例實際上是將變量L的值下移一行。
第4行:計算D標準組各頻數之半。
第5行:計算T,即標準組各頻數之半與累計頻數(移下一行)之和。
第6~11行:計算標準組總例數S,其中S1是為了計算S而設定的中間變量,LOOP和END LOOP為循環語句,必結合使用,可同時控制變量轉換的次數和條件,本例中的第一次循環,對EFFECT<4的個例進行變量轉換;第二次循環時,對EFFECT<3的個體進行變量變換,直至EFFECT=1,循環結束。
第12~15行:產生標準組及A組(變量A_R)和B組(變量B_R)的R值,這三組的R值是一樣,其中A組與B組的R值是為了計算A、B兩組的可信區間作準備。
第16~31行:分組計算糖衣片A(標準組)、黃酮片B及復方組C的95%的可信區間,可在Output窗口中查看。第16、21、26行分別對A、B、C各組的頻數進行加權(Weight),第17~20行是調用T-Test程序計算標準組的平均R值。第22~25行和第27~30行為分別計算黃酮片(B組)及復方組(C組)的平均R值及95%的可信區間。
5.組內不能確定標準組時SPSS的處理方法
若標準組數量很大時,可看作總體(如上例把糖衣片看成標準組),不必計算抽樣誤差,將對比組作為樣本進行檢驗。但有時相互比較的各組樣本中往往并無例數很多的組別,如仍將其中一組作為標準組依照上例方法處理是不適當,這時可將各組的等級合并,以其合計數作為各等級的標準分布,計算各等級的Ridit值。在以上程序中只要利用COMPUTE命令產生一個新的變量來表示各組的等級合并,如在第1行插入:COMPUTE Tf(合計頻數)=A+B+C;再將上面的程序作適當的修改,即可算出各組的平均R值。然后用u檢驗公式(兩組時用)或χ2檢驗公式(多組時用)進行假設檢驗[2],u值或χ2值計算可以在Transform→Compute菜單中利用軟件提供的各種函數和表達式來實現,同時也可利用其中的統計函數u值累積分布函數(CDF.NORM(u,0,1))或χ2累積分布函數(CDF.CHISQ(χ2,df))直接返回相應的P值,具體過程不多加詳述。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢