
SPSS自帶案例數據文件介紹及說明
SPSS自帶案例數據文件介紹及說明SPSS初學者對案例數據文件的需求很大,其實在SPSS軟件包安裝過程中,這些文件已經自動放在你的電腦硬盤中了。那么如何找到它呢,我前面介紹過“SPSS自帶案例數據從哪里下載”,需要的同學可以自行查找或下載,今天分享SPSS自帶案例數據文件說明,詳見下文:
accidents.sav
該假設數據文件涉及某保險公司,該公司正在研究給定區域內汽車事故的年齡和性別風險因子。每個個案對應一個年齡類別和性別類別的交叉分類。
adl.sav
該假設數據文件涉及在確定針對腦卒中患者的建議治療類型的優點方面的舉措。醫師將女性腦卒中患者隨機分配到兩組中的一組。第一組患者接受標準的物理治療, 而第二組患者則接受附加的情緒治療。在進行治療的三個月時間里,將為每個患者進行一般日常生活行為的能力評分并作為原始變量。
advert.sav
該假設數據文件涉及某零售商在檢查廣告支出與銷售業績之間的關系方面的舉措。為此,他們收集了過去的銷售數字以及相關的廣告成本。
aflatoxin.sav
該假設數據文件涉及對谷物的黃曲霉毒素的檢測,該毒素的濃度會因谷物產量的不同(不同谷物之間及同種谷物之間)而有較大變化。谷物加工機從 8 個谷物產量的每一個中收到 16 個樣本并以十億分之幾 (PPB) 為單位來測量黃曲霉毒素的水平。
anorectic.sav
在研究厭食/暴食行為的標準癥狀參照時,研究人員1對 55 名已知存在進食障礙的青少年進行了調查。其中每名患者每年都將進行四次檢查,因此總觀測數為 220。在每次觀測期間,將對這些患者按 16 種癥狀逐項評分。但 71 號和 76 號患者的癥狀得分均在時間點 2 缺失,47 號患者的癥狀得分在時間點 3 缺失,因此有效觀測數為 217。
bankloan.sav
該假設數據文件涉及某銀行在降低貸款拖欠率方面的舉措。該文件包含 850 位過去和潛在客戶的財務和人口統計信息。前 700 個個案是以前曾獲得貸款的客戶。剩下的 150 個個案是潛在客戶,銀行需要按高或低信用風險對他們進行分類。
bankloan_binning.sav
該假設數據文件包含 5,000 位過去客戶的財務和人口統計信息。
behavior.sav
在一個經典示例中2,52 名學生被要求以 10 點的標度對 15 種情況和 15 種行為的組合進行評價,該 10 點的標度從 0 = “極得體”到 9 = “極不得體”。平均值在個人值之上,值被視為相異性。
behavior_ini.sav
該數據文件包含 behavior.sav的二維解的初始配置。
brakes.sav
該假設數據文件涉及某生產高性能汽車盤式制動器的工廠的質量控制。該數據文件包含對 8 臺專用機床中每一臺的 16 個盤式制動器的直徑測量。盤式制動器的目標直徑為 322 毫米。
breakfast.sav
在一項經典研究中3,21 名 Wharton School MBA 學生及其配偶被要求按照喜好程度順序對15 種早餐食品進行評價,從 1 =他們的喜好根據六種不同的情況加以記錄,從“全部喜歡”到“只帶飲料的快餐”。
breakfast-overall.sav
該數據文件只包含早餐食品喜好的第一種情況,即“全部喜歡”。
broadband_1.sav
該假設數據文件包含各地區訂制了全國寬帶服務的客戶的數量。該數據文件包含 4 年期間 85 個地區每月的訂戶數量。
broadband_2.sav
該數據文件和 broadband_1.sav一樣,但包含另外三個月的數據。
car_insurance_claims.sav
在別處被提出和分析的4關于汽車損壞賠償的數據集。平均理賠金額可以當作其具有伽瑪分布來建模,通過使用逆關聯函數將因變量的平均值與投保者年齡、車輛類型和車齡的線性組合關聯。提出理賠的數量可以作為刻度權重。
car_sales.sav
該數據文件包含假設銷售估計值、訂價以及各種品牌和型號的車輛的物理規格。訂價和物理規格可以從 edmunds.com和制造商處獲得。
car_sales_uprepared.sav
這是 car_sales.sav 的修改版本,不包含字段的任何已轉換版本。
carpet.sav
在一個常用示例 5中,一家公司非常重視一種新型地毯清潔用品的市場營銷,希望檢驗以下五種因素對消費者偏好的影響:包裝設計、品牌名稱、價格、優秀家用品標志和退貨保證。包裝設計有三個因子級別,每個因子級別因刷體位置而不同;有三個品牌名稱(K2R、Glory和Bissell);有三個價格水平;最后兩個因素各有兩個級別(有或無)。十名消費者對這些因素所定義的 22 個特征進行了排序。變量優選包含對每個概要文件的平均等級的排序。低等級與高偏好相對應。此變量反映了對每個概要文件的偏好的總體度量。
carpet_prefs.sav
該數據文件所基于的示例和在 carpet.sav中所描述的一樣,但它還包含從 10 位消費者的每一位中收集到的實際排列順序。消費者被要求按照從最喜歡到最不喜歡的順序對 22 個產品概要文件進行排序。carpet_plan.sav中定義了變量 PREF1到 PREF22包含相關特征的標識。
catalog.sav
該數據文件包含某編目公司出售的三種產品的假設每月銷售數據。同時還包括 5 個可能的預測變量的數據。
catalog_seasfac.sav
除添加了一組從“季節性分解”過程中計算出來的季節性因素和附帶的日期變量外,該數據文件和 catalog.sav是相同的。
cellular.sav
該假設數據文件涉及某便攜式電話公司在減少客戶流失方面的舉措??蛻袅魇A向分被應用到帳戶,分數范圍從 0 到 100。得到 50 分或更高分數的帳戶可能會更換提供商。
ceramics.sav
該假設數據文件涉及某制造商在確定新型優質合金是否比標準合金具有更高的耐熱性方面的舉措。每個個案代表對一種合金的單獨檢驗;個案中會記錄合金的耐熱極限。
cereal.sav
該假設數據文件涉及一份 880 人參于的關于早餐喜好的民意調查,該調查記錄了參與者的年齡、性別、婚姻狀況以及生活方式是否積極(根據他們是否每周至少做兩次運動)。每個個案代表一個單獨的響應者。
clothing_defects.sav
這是關于某服裝廠的質量控制過程的假設數據文件。檢驗員要對工廠中每次大批量生產的服裝進行抽樣檢測并清點不合格的服裝的數量。
coffee.sav
這是關于六種冰咖啡的認知品牌形象6的數據文件。對于 23 種冰咖啡特征屬性中的每種屬性,人們選擇了由該屬性所描述的所有品牌。為保密起見,六種品牌用 AA、BB、CC、DD、EE 和FF 來表示。
contacts.sav
該假設數據文件涉及一組公司計算機銷售代表的聯系方式列表。根據這些銷售代表所在的公司部門及其公司的等級來對每個聯系方式進行分類。同時還記錄了最近一次的銷售量、最近一次銷售距今的時間和所聯系公司的規模。
creditpromo.sav
該假設數據文件涉及某百貨公司在評價最新信用卡促銷的效果方面的舉措。為此,隨機選擇了500 位持卡人。其中一半收到了宣傳關于在接下來的三個月內降低消費利率的廣告。另一半收到了標準的季節性廣告。
customer_dbase.sav
該假設數據文件涉及某公司在使用數據倉庫中的信息來為最有可能回應的客戶提供特惠商品方面的舉措。隨機選擇客戶群的子集并為其提供特惠商品,同時記錄下他們的回應。
customer_information.sav
該假設數據文件包含客戶郵寄信息,如姓名和地址。
customer_subset.sav
來自 customer_dbase.sav的擁有 80 個個案的子集。
debate.sav
該假設數據文件涉及在某政治辯論前后對該辯論的參與者所做的調查的成對回答。每個個案對應一個單獨的響應者。
debate_aggregate.sav
該假設數據文件匯總了 debate.sav中的回答。每個個案對應一個辯論前后的偏好的交叉分類。
demo.sav
這是關于購物客戶數據庫的假設數據文件,用于寄出每月的商品。將記錄客戶對商品是否有回應以及各種人口統計信息。
demo_cs_1.sav
該假設數據文件涉及某公司在匯編調查信息數據庫方面的舉措的第一步。每個個案對應不同的城市,并記錄地區、省、區和城市標識。
demo_cs_2.sav
該假設數據文件涉及某公司在匯編調查信息數據庫方面的舉措的第二步。每個個案對應來自第一步中所選城市的不同的家庭單元格,并記錄地區、省、區、市、子區和單元格標識。還包括設計前兩個階段的抽樣信息。
demo_cs.sav
該假設數據文件包含用復雜抽樣設計收集的調查信息。每個個案對應不同的家庭單元格,并記錄各種人口統計和抽樣信息。
dmdata.sav
該假設數據文件包含直銷公司的人口統計學和購買信息。dmdata2.sav包含收到試驗郵寄的聯系人子集的信息,dmdata3.sav包含未收到試驗郵寄的其余聯系人的信息。
dietstudy.sav
該假設數據文件包含對 "Stillman diet" 7 的研究結果。每個個案對應一個單獨的主體,并記錄其在實行飲食方案前后的體重(磅)以及甘油三酸酯的水平(毫克/100 毫升)。
dvdplayer.sav
這是關于開發新的 DVD 播放器的假設數據文件。營銷團隊用原型收集了焦點小組數據。每個個案對應一個單獨的被調查用戶,并記錄他們的人口統計信息及其對原型問題的回答。
german_credit.sav
該數據文件取自加州大學歐文分校的 Repository of Machine Learning Databases 8中的"German credit" 數據集。
grocery_1month.sav
該假設數據文件是在數據文件 grocery_coupons.sav的基礎上加上了每周購物“累計”,所以每個個案對應一個單獨的客戶。所以,一些每周更改的變量消失了,而且現在記錄的消費金額是為期四周的研究過程中的消費金額之和。
grocery_coupons.sav
該假設數據文件包含由重視顧客購物習慣的雜貨連鎖店收集的調查數據。對每位顧客調查四周,每個個案對應一個單獨的顧客周,并記錄有關顧客購物地點和方式的信息(包括那一周里顧客在雜貨上的消費金額)。
guttman.sav
Bell 9創建了一個表,用來闡釋可能的社會群體。Guttman 10引 用了該表的一部分,其中包括五個變量,用于描述以下七個理論社會群體的社會交往、對群體的歸屬感、成員的物理親近度以及關系正式性:觀眾(比如在足球比賽 現場的人們)、聽眾(比如在劇院或聽課堂講座的人們)、公眾(比如報紙或電視觀眾)、組織群體(與觀眾類似但具有緊密的關系)、初級群體(關系密切)、次 級群體(自發組織)及現代社區(因在物理上親近而導致關系松散并需要專業化服務)。
health_funding.sav
該假設數據文件包含關于保健基金(每 100 人的金額)、發病率(每 10,000 人的比率)以及保健提供商拜訪率(每 10,000 的比率)的數據。每個個案代表不同的城市。
hivassay.sav
該假設數據文件涉及某藥物實驗室在開發用于檢測 HIV 感染的快速化驗方面的舉措?;灲Y果為八個加深的紅色陰影,如果有更深的陰影則表示感染的可能性很大。用 2,000 份血液樣本來進行實驗室試驗,其中一半受到 HIV 感染而另一半沒有受到感染。
hourlywagedata.sav
該假設數據文件涉及在政府機關和醫院工作的具有不同經驗水平的護士的時薪。
insurance_claims.sav
該假設數據文件涉及某保險公司,該公司希望構建一個模型用于標記可疑的、具有潛在欺騙性的理賠。每個個案代表一次單獨的理賠。
insure.sav
該假設數據文件涉及某保險公司,該公司正在研究指示客戶是否會根據 10 年的人壽保險合同提出理賠的風險因子。數據文件中的每個個案代表一副根據年齡和性別進行匹配的合同,其中一份記錄了一次理賠而另一份則沒有。
judges.sav
該假設數據文件涉及經過訓練的裁判(加上一個體操愛好者)對 300 次體操表演給出的分數。每行代表一次單獨的表演;裁判們觀看相同的表演。
kinship_dat.sav
Rosenberg 和 Kim 11 開始分析 15 個親屬關系項(伯母、兄弟、表兄妹、女兒、父親、孫女、祖父、祖母、孫子、母親、侄子或外甥、侄女或外甥女、姐妹、兒子和叔叔)。他們讓四組大學生(兩組 女同學,兩組男同學)根據相似程度將各項排序。他們讓其中的兩組同學(一組女同學,一組男同學)進行了兩次排序,第二次排序和第一次排序采取的標準不同。 這樣,一共得到六組“源”。每個源對應一個 15 x 15 的近似值矩陣,其單元格中的值等于源中的人數減去此源中對象被劃分的次數。
kinship_ini.sav
該數據文件包含 kinship_dat.sav的三維解的初始配置。
kinship_var.sav
該數據文件包含自變量 gender、gener(ation) 和 degree (of separation),這些變量可用于解釋 kinship_dat.sav的解的維數。具體而言,它們可用來將解的空間限制為這些變量的線性組合。
marketvalues.sav
該數據文件涉及 1999–2000 年間 Algonquin,Ill. 地區新的房屋開發中的住房銷售。這些銷售僅僅來自公眾記錄。
nhis2000_subset.sav
美國健康訪問調查 (NHIS) 是針對美國全體公民的大型人口調查。該調查對美國的具有全國代表性的家庭樣本進行了面對面的訪問,并獲取了每個家庭的成員的健康行為和健康狀態的人口統計 信息和觀察數據。該數據文件包含取自 2000 年調查信息的子集。國家健康統計中心。2000年美國健康訪問調查。公用數據文件和文檔。ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/Datasets/NHIS/2000/。2003 年發布。
ozone.sav
這些數據包含了用來根據其余變量預測臭氧濃度的六個氣象變量的 330 個觀察值。在以前的研究人員中,12和 13發現了這些變量之間的非線性,這妨礙了標準回歸方法。
pain_medication.sav
該假設數據文件包含用于治療慢性關節炎疼痛的抗炎藥的臨床試驗結果。我們感興趣的是該藥見效的時間以及它和現有藥物的比較。
patient_los.sav
該假設數據文件包含被醫院確診為疑似心肌梗塞(即 MI 或“心臟病發作”)的患者的治療記錄。每個個案對應一位單獨的患者,并記錄與其住院期有關的一些變量。
patlos_sample.sav
該假設數據文件包含在治療心肌梗塞(即 MI 或“心臟病發作”)期間收到溶解血栓劑的患者的樣本治療記錄。每個個案對應一位單獨的患者,并記錄與其住院期有關的一些變量。
poll_cs.sav
該假設數據文件涉及民意測驗專家在確定正式立法前公眾對法案的支持水平方面的舉措。個案對應注冊的選民。每個個案記錄選民居住的縣、鎮、區。
poll_cs_sample.sav
該假設數據文件包含在 poll_cs.sav中列出的選民的樣本。該樣本是根據 poll.csplan中指定的設計來選取的,而且該數據文件記錄包含概率和樣本權重。請注意,由于該抽樣計劃使用與大小成正比 (PPS) 方法,因此,還有一個文件 (poll_jointprob.sav) 包含聯合選擇概率。在選取了樣本之后,對應于選民人群統計信息及其對提交法案的意見的附加變量將被收集并添加到數據文件。
property_assess.sav
該假設數據文件涉及某縣資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應過去一年中縣里所出售的資產。數據文件中的每個個案記錄資產所在的鎮、最后評估資產的評估員、該次評估距今的時間、當時的估價以及資產的出售價格。
property_assess_cs.sav
該假設數據文件涉及某州資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應該州的資產。數據文件中的每個個案記錄資產所在的縣、鎮和區,最后一次評估距今的時間以及當時的估價。
property_assess_cs_sample.sav
該假設數據文件包含在 property_assess_cs.sav中列出的資產的樣本。該樣本是根據property_assess.csplan中指定的設計來選取的,而且該數據文件記錄包含概率和樣本權重。在選取了樣本之后,附加變量 Current value將被收集并添加到數據文件。
recidivism.sav
該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應先前的一名罪犯,并記錄其人口統計信息和第一次犯罪的詳細資料;如果在第一次被捕后兩年內又第二次被捕,則還將記錄兩次被捕間隔的時間。
recidivism_cs_sample.sav
該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應在2003 年 6 月期間第一次被捕釋放的先前的一名罪犯,并記錄其人口統計信息和第一次犯罪的詳細資料,及其第二次被捕的數據(如果發生在 2006 年 6 月底之前)。根據recidivism_cs.csplan中指定的抽樣計劃從抽樣部門選擇罪犯;該計劃使用與大小成正比 (PPS)方法,因此,還有一個文件 (recidivism_cs_jointprob.sav) 包含聯合選擇概率。
rfm_transactions.sav
此假設數據文件包含購買交易數據,即每筆交易的購買日期、購買商品和消費金額。
salesperformance.sav
這是關于評估兩個新的銷售培訓課程的假設數據文件。60 名員工被分成 3 組且都接受標準的培訓。另外,組 2 接受技術培訓;組 3 接受實踐教程。在培訓課程結束時,對每名員工進行測驗并記錄他們的分數。數據文件中的每個個案代表一名單獨的受訓者,并記錄其被分配到的組以及測驗的分 數。
satisf.sav
該假設數據文件涉及某零售公司在 4 個商店位置所進行的滿意度調查??偣矊?/span> 582 位客戶進行了調查,每個個案代表一位單獨客戶的回答。
screws.sav
該數據文件包含關于螺釘、螺栓、螺母和圖釘的特征的信息14。
shampoo_ph.sav
這是關于某發制品廠的質量控制的假設數據文件。在規定的時間間隔對六批獨立輸出的產品進行檢測并記錄它們的 pH 值。目標范圍是 4.5–5.5。
ships.sav
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
2025 年,數據如同數字時代的 DNA,編碼著人類社會的未來圖景,驅動著商業時代的運轉。從全球互聯網用戶每天產生的2.5億TB數據, ...
2025-05-27CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25