
SPSS編程在Ridit分析中的應用
多樣本有序分類資料(或等級資料)我們一般采用非參數檢驗——H檢驗(Kruskal-Wallis法),但其結論只得出三組或多組間總的有差別,若要知道兩兩間是否有差別,則沒有Ridit分析只要一次就能得出兩兩比較結果那么方便。Ridit分析是一種關于等級資料進行對比組與標準組比較的假設檢驗方法,其基本思想是先確定一個標準組(常用以往積累資料或樣本含量相當大的資料)作為特定總體,求得各等級的R值,標準組平均R值理論上可以證明等于0.5,其它各組與標準組比較,看其可信區間是否與0.5重疊,來判斷組間的統計學顯著性[1],最后得出專業解釋。而Ridit分析在SPSS中卻沒有現成的模塊,但我們可以通過編程可以方便的實現之,茲介紹下:
1. 建立或調用SPSS數據文件
某醫生用三種方劑治療某婦科病,療效如表1,問三種方劑的療效有無差別[2]。首先建立表1的1~4列數據文件,EFFECT:療效(1:無效,2:好轉,3:顯效,4:控制);A:糖衣片頻數;B:黃酮片頻數;C:復方組頻數。
表1 三種方劑療效比較的SPSS數據文件(第1~4 列)及編輯后運行的各等級Ridit值計算表
療效 糖衣片 黃酮片
A EFFECT B
② ① ③
1 48 5
2 184 16
3 77 18
4 52 19
2.SPSS程序的編制和運行
(1)在數據編輯窗口(Data Editor),通過通過菜單選擇:File→New→Syntax,打開語句編輯窗口(Syntax Editor);若已經建立程序,可通過Open→Syntax直接打開。
(2)在語句編輯窗口,用鍵盤輸入表2的程序。
表2 Ridit分析的SPSS程序(不要輸入行號)
行號 程序 行號 程序
1 CREATE L=CSUM(A). 17 T-TEST
2 COMPUTE L1=LAG(L,1). 18 /TESTVAL=0
3 IF (effect=1) L1=0. 19 /VARIABLES=R
4 COMPUTE D=A/2. 20 /CRITERIA=CIN (.95) .
5 COMPUTE T=L1+D. 21 WEIGHT BY B .
6 IF (EFFECT=4) S=L. 22 T-TEST
7 SORT CASES BY EFFECT(D). 23 /TESTVAL=0
8 LOOP IF (EFFECT<4). 24 /VARIABLES=R_B
9 COMPUTE S1=LAG(S,1). 25 /CRITERIA=CIN (.95) .
10 COMPUTE S=S1. 26 WEIGHT BY C .
11 END LOOP IF (EFFECT=1). 27 T-TEST
12 COMPUTE R=T/S. 28 /TESTVAL=0
13 SORT CASES BY EFFECT(A). 29 /VARIABLES=R_C
14 COMPUTE R_B=R. 30 /CRITERIA=CIN (.95) .
15 COMPUTE R_C=R. 31 EXECUTE.
16 WEIGHT BY A .
以上程序在語句編輯窗口輸入時,不要輸入行號,程序中的英文字母不分大、小寫。另外該程序也可在Word、記事本等其他文本編輯軟件中編輯,然后只要通過復制將程序粘貼到Syntax Editor窗口。
(3)在語句編輯窗口,通過菜單選擇:Run→All運行程序。
3.結果解釋
以上程序是以糖衣片(A)組作為標準組計算R值,L:累積頻數(為求L1的中間變量);L1:累積頻數下移一行;D:標準組各等級之半;T:為L1欄加上D欄的值;S:標準組的總例數;S1(為求S的中間變量);R:標準組的R值。程序運行后,還可在Output窗口中查看到A、B、C三組的平均R值及95%的可信區間:糖衣片的平均R值為0.5,與理論相符,說明計算正確;黃酮片:平均R值為0.6493,95%CI(0.5758,0.7228);復方片:平均R值為0.5045,95%CI(0.4371,0.5718)。根據可信區間是否與標準組(理論上為0.5)相交來決定各對比組間的顯著性水平,如圖1,糖衣片的R值對應于0.5,復方片95%的可信區間與糖衣片平均R值(理論上為0.5)重疊,所以P>0.05,故復方片與糖衣片之間的療效無統計學顯著性,尚不能認為兩者療效間有統計學差異;而黃酮片可信區間與理論R值0.5不重疊,則P<0.05,故黃酮片與糖衣片之間的療效存在統計學顯著性;同理可知,黃酮片與復方片的可信區間也不重疊,故兩者療效存在統計學差異。
圖2 標準組平均R值、對比組平均R值及95%可信區間
4.程序解釋
第1~3行:計算標準組累計頻數(移下一行)。CSUM(Cumulative
sum)為計算標準組的累加和L,LAG(variable,ncases)為數值型函數或字符型函數[2],返回數據集中某一變量(variable)的ncases之前的觀測值所屬變量的值,對第1個觀察值來說,將返回缺失值(數值型變量)或空格(字符型變量)[3]。本例實際上是將變量L的值下移一行。
第4行:計算D標準組各頻數之半。
第5行:計算T,即標準組各頻數之半與累計頻數(移下一行)之和。
第6~11行:計算標準組總例數S,其中S1是為了計算S而設定的中間變量,LOOP和END
LOOP為循環語句,必結合使用,可同時控制變量轉換的次數和條件,本例中的第一次循環,對EFFECT<4的個例進行變量轉換;第二次循環時,對EFFECT<3的個體進行變量變換,直至EFFECT=1,循環結束。
第12~15行:產生標準組及A組(變量A_R)和B組(變量B_R)的R值,這三組的R值是一樣,其中A組與B組的R值是為了計算A、B兩組的可信區間作準備。
第16~31行:分組計算糖衣片A(標準組)、黃酮片B及復方組C的95%的可信區間,可在Output窗口中查看。第16、21、26行分別對A、B、C各組的頻數進行加權(Weight),第17~20行是調用T-Test程序計算標準組的平均R值。第22~25行和第27~30行為分別計算黃酮片(B組)及復方組(C組)的平均R值及95%的可信區間。
5.組內不能確定標準組時SPSS的處理方法
若標準組數量很大時,可看作總體(如上例把糖衣片看成標準組),不必計算抽樣誤差,將對比組作為樣本進行檢驗。但有時相互比較的各組樣本中往往并無例數很多的組別,如仍將其中一組作為標準組依照上例方法處理是不適當,這時可將各組的等級合并,以其合計數作為各等級的標準分布,計算各等級的Ridit值。在以上程序中只要利用COMPUTE命令產生一個新的變量來表示各組的等級合并,如在第1行插入:COMPUTE
Tf(合計頻數)=A+B+C;再將上面的程序作適當的修改,即可算出各組的平均R值。然后用u檢驗公式(兩組時用)或χ2檢驗公式(多組時用)進行假設檢驗[2],u值或χ2值計算可以在Transform→Compute菜單中利用軟件提供的各種函數和表達式來實現,同時也可利用其中的統計函數u值累積分布函數(CDF.NORM(u,0,1))或χ2累積分布函數(CDF.CHISQ(χ2,df))直接返回相應的P值,具體過程不多加詳述。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25