SPSS自帶案例數據文件介紹及說明-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀SPSS自帶案例數據文件介紹及說明

SPSS自帶案例數據文件介紹及說明

2015-12-24

收藏

SPSS自帶案例數據文件介紹及說明

SPSS自帶案例數據文件介紹及說明SPSS初學者對案例數據文件的需求很大，其實在SPSS軟件包安裝過程中，這些文件已經自動放在你的電腦硬盤中了。那么如何找到它呢，我前面介紹過“SPSS自帶案例數據從哪里下載”，需要的同學可以自行查找或下載，今天分享SPSS自帶案例數據文件說明，詳見下文：

accidents.sav

該假設數據文件涉及某保險公司，該公司正在研究給定區域內汽車事故的年齡和性別風險因子。每個個案對應一個年齡類別和性別類別的交叉分類。

adl.sav

該假設數據文件涉及在確定針對腦卒中患者的建議治療類型的優點方面的舉措。醫師將女性腦卒中患者隨機分配到兩組中的一組。第一組患者接受標準的物理治療，而第二組患者則接受附加的情緒治療。在進行治療的三個月時間里，將為每個患者進行一般日常生活行為的能力評分并作為原始變量。

advert.sav

該假設數據文件涉及某零售商在檢查廣告支出與銷售業績之間的關系方面的舉措。為此，他們收集了過去的銷售數字以及相關的廣告成本。

aflatoxin.sav

該假設數據文件涉及對谷物的黃曲霉毒素的檢測，該毒素的濃度會因谷物產量的不同（不同谷物之間及同種谷物之間）而有較大變化。谷物加工機從 8 個谷物產量的每一個中收到 16 個樣本并以十億分之幾 (PPB) 為單位來測量黃曲霉毒素的水平。

anorectic.sav

在研究厭食/暴食行為的標準癥狀參照時，研究人員1對 55 名已知存在進食障礙的青少年進行了調查。其中每名患者每年都將進行四次檢查，因此總觀測數為 220。在每次觀測期間，將對這些患者按 16 種癥狀逐項評分。但 71 號和 76 號患者的癥狀得分均在時間點 2 缺失，47 號患者的癥狀得分在時間點 3 缺失，因此有效觀測數為 217。

bankloan.sav

該假設數據文件涉及某銀行在降低貸款拖欠率方面的舉措。該文件包含 850 位過去和潛在客戶的財務和人口統計信息。前 700 個個案是以前曾獲得貸款的客戶。剩下的 150 個個案是潛在客戶，銀行需要按高或低信用風險對他們進行分類。

bankloan_binning.sav

該假設數據文件包含 5,000 位過去客戶的財務和人口統計信息。

behavior.sav

在一個經典示例中2，52 名學生被要求以 10 點的標度對 15 種情況和 15 種行為的組合進行評價，該 10 點的標度從 0 = “極得體”到 9 = “極不得體”。平均值在個人值之上，值被視為相異性。

behavior_ini.sav

該數據文件包含 behavior.sav的二維解的初始配置。

brakes.sav

該假設數據文件涉及某生產高性能汽車盤式制動器的工廠的質量控制。該數據文件包含對 8 臺專用機床中每一臺的 16 個盤式制動器的直徑測量。盤式制動器的目標直徑為 322 毫米。

breakfast.sav

在一項經典研究中3，21 名 Wharton School MBA 學生及其配偶被要求按照喜好程度順序對15 種早餐食品進行評價，從 1 =他們的喜好根據六種不同的情況加以記錄，從“全部喜歡”到“只帶飲料的快餐”。

breakfast-overall.sav

該數據文件只包含早餐食品喜好的第一種情況，即“全部喜歡”。

broadband_1.sav

該假設數據文件包含各地區訂制了全國寬帶服務的客戶的數量。該數據文件包含 4 年期間 85 個地區每月的訂戶數量。

broadband_2.sav

該數據文件和 broadband_1.sav一樣，但包含另外三個月的數據。

car_insurance_claims.sav

在別處被提出和分析的4關于汽車損壞賠償的數據集。平均理賠金額可以當作其具有伽瑪分布來建模，通過使用逆關聯函數將因變量的平均值與投保者年齡、車輛類型和車齡的線性組合關聯。提出理賠的數量可以作為刻度權重。

car_sales.sav

該數據文件包含假設銷售估計值、訂價以及各種品牌和型號的車輛的物理規格。訂價和物理規格可以從 edmunds.com和制造商處獲得。

car_sales_uprepared.sav

這是 car_sales.sav 的修改版本，不包含字段的任何已轉換版本。

carpet.sav

在一個常用示例 5中，一家公司非常重視一種新型地毯清潔用品的市場營銷，希望檢驗以下五種因素對消費者偏好的影響：包裝設計、品牌名稱、價格、優秀家用品標志和退貨保證。包裝設計有三個因子級別，每個因子級別因刷體位置而不同；有三個品牌名稱（K2R、Glory和Bissell）；有三個價格水平；最后兩個因素各有兩個級別（有或無）。十名消費者對這些因素所定義的 22 個特征進行了排序。變量優選包含對每個概要文件的平均等級的排序。低等級與高偏好相對應。此變量反映了對每個概要文件的偏好的總體度量。

carpet_prefs.sav

該數據文件所基于的示例和在 carpet.sav中所描述的一樣，但它還包含從 10 位消費者的每一位中收集到的實際排列順序。消費者被要求按照從最喜歡到最不喜歡的順序對 22 個產品概要文件進行排序。carpet_plan.sav中定義了變量 PREF1到 PREF22包含相關特征的標識。

catalog.sav

該數據文件包含某編目公司出售的三種產品的假設每月銷售數據。同時還包括 5 個可能的預測變量的數據。

catalog_seasfac.sav

除添加了一組從“季節性分解”過程中計算出來的季節性因素和附帶的日期變量外，該數據文件和 catalog.sav是相同的。

cellular.sav

該假設數據文件涉及某便攜式電話公司在減少客戶流失方面的舉措?？蛻袅魇A向分被應用到帳戶，分數范圍從 0 到 100。得到 50 分或更高分數的帳戶可能會更換提供商。

ceramics.sav

該假設數據文件涉及某制造商在確定新型優質合金是否比標準合金具有更高的耐熱性方面的舉措。每個個案代表對一種合金的單獨檢驗；個案中會記錄合金的耐熱極限。

cereal.sav

該假設數據文件涉及一份 880 人參于的關于早餐喜好的民意調查，該調查記錄了參與者的年齡、性別、婚姻狀況以及生活方式是否積極（根據他們是否每周至少做兩次運動）。每個個案代表一個單獨的響應者。

clothing_defects.sav

這是關于某服裝廠的質量控制過程的假設數據文件。檢驗員要對工廠中每次大批量生產的服裝進行抽樣檢測并清點不合格的服裝的數量。

coffee.sav

這是關于六種冰咖啡的認知品牌形象6的數據文件。對于 23 種冰咖啡特征屬性中的每種屬性，人們選擇了由該屬性所描述的所有品牌。為保密起見，六種品牌用 AA、BB、CC、DD、EE 和FF 來表示。

contacts.sav

該假設數據文件涉及一組公司計算機銷售代表的聯系方式列表。根據這些銷售代表所在的公司部門及其公司的等級來對每個聯系方式進行分類。同時還記錄了最近一次的銷售量、最近一次銷售距今的時間和所聯系公司的規模。

creditpromo.sav

該假設數據文件涉及某百貨公司在評價最新信用卡促銷的效果方面的舉措。為此，隨機選擇了500 位持卡人。其中一半收到了宣傳關于在接下來的三個月內降低消費利率的廣告。另一半收到了標準的季節性廣告。

customer_dbase.sav

該假設數據文件涉及某公司在使用數據倉庫中的信息來為最有可能回應的客戶提供特惠商品方面的舉措。隨機選擇客戶群的子集并為其提供特惠商品，同時記錄下他們的回應。

customer_information.sav

該假設數據文件包含客戶郵寄信息，如姓名和地址。

customer_subset.sav

來自 customer_dbase.sav的擁有 80 個個案的子集。

debate.sav

該假設數據文件涉及在某政治辯論前后對該辯論的參與者所做的調查的成對回答。每個個案對應一個單獨的響應者。

debate_aggregate.sav

該假設數據文件匯總了 debate.sav中的回答。每個個案對應一個辯論前后的偏好的交叉分類。

demo.sav

這是關于購物客戶數據庫的假設數據文件，用于寄出每月的商品。將記錄客戶對商品是否有回應以及各種人口統計信息。

demo_cs_1.sav

該假設數據文件涉及某公司在匯編調查信息數據庫方面的舉措的第一步。每個個案對應不同的城市，并記錄地區、省、區和城市標識。

demo_cs_2.sav

該假設數據文件涉及某公司在匯編調查信息數據庫方面的舉措的第二步。每個個案對應來自第一步中所選城市的不同的家庭單元格，并記錄地區、省、區、市、子區和單元格標識。還包括設計前兩個階段的抽樣信息。

demo_cs.sav

該假設數據文件包含用復雜抽樣設計收集的調查信息。每個個案對應不同的家庭單元格，并記錄各種人口統計和抽樣信息。

dmdata.sav

該假設數據文件包含直銷公司的人口統計學和購買信息。dmdata2.sav包含收到試驗郵寄的聯系人子集的信息，dmdata3.sav包含未收到試驗郵寄的其余聯系人的信息。

dietstudy.sav

該假設數據文件包含對 "Stillman diet" 7 的研究結果。每個個案對應一個單獨的主體，并記錄其在實行飲食方案前后的體重（磅）以及甘油三酸酯的水平（毫克/100 毫升）。

dvdplayer.sav

這是關于開發新的 DVD 播放器的假設數據文件。營銷團隊用原型收集了焦點小組數據。每個個案對應一個單獨的被調查用戶，并記錄他們的人口統計信息及其對原型問題的回答。

german_credit.sav

該數據文件取自加州大學歐文分校的 Repository of Machine Learning Databases 8中的"German credit" 數據集。

grocery_1month.sav

該假設數據文件是在數據文件 grocery_coupons.sav的基礎上加上了每周購物“累計”，所以每個個案對應一個單獨的客戶。所以，一些每周更改的變量消失了，而且現在記錄的消費金額是為期四周的研究過程中的消費金額之和。

grocery_coupons.sav

該假設數據文件包含由重視顧客購物習慣的雜貨連鎖店收集的調查數據。對每位顧客調查四周，每個個案對應一個單獨的顧客周，并記錄有關顧客購物地點和方式的信息（包括那一周里顧客在雜貨上的消費金額）。

guttman.sav

Bell 9創建了一個表，用來闡釋可能的社會群體。Guttman 10引用了該表的一部分，其中包括五個變量，用于描述以下七個理論社會群體的社會交往、對群體的歸屬感、成員的物理親近度以及關系正式性：觀眾（比如在足球比賽現場的人們）、聽眾（比如在劇院或聽課堂講座的人們）、公眾（比如報紙或電視觀眾）、組織群體（與觀眾類似但具有緊密的關系）、初級群體（關系密切）、次級群體（自發組織）及現代社區（因在物理上親近而導致關系松散并需要專業化服務）。

health_funding.sav

該假設數據文件包含關于保健基金（每 100 人的金額）、發病率（每 10,000 人的比率）以及保健提供商拜訪率（每 10,000 的比率）的數據。每個個案代表不同的城市。

hivassay.sav

該假設數據文件涉及某藥物實驗室在開發用于檢測 HIV 感染的快速化驗方面的舉措?；灲Y果為八個加深的紅色陰影，如果有更深的陰影則表示感染的可能性很大。用 2,000 份血液樣本來進行實驗室試驗，其中一半受到 HIV 感染而另一半沒有受到感染。

hourlywagedata.sav

該假設數據文件涉及在政府機關和醫院工作的具有不同經驗水平的護士的時薪。

insurance_claims.sav

該假設數據文件涉及某保險公司，該公司希望構建一個模型用于標記可疑的、具有潛在欺騙性的理賠。每個個案代表一次單獨的理賠。

insure.sav

該假設數據文件涉及某保險公司，該公司正在研究指示客戶是否會根據 10 年的人壽保險合同提出理賠的風險因子。數據文件中的每個個案代表一副根據年齡和性別進行匹配的合同，其中一份記錄了一次理賠而另一份則沒有。

judges.sav

該假設數據文件涉及經過訓練的裁判（加上一個體操愛好者）對 300 次體操表演給出的分數。每行代表一次單獨的表演；裁判們觀看相同的表演。

kinship_dat.sav

Rosenberg 和 Kim 11 開始分析 15 個親屬關系項（伯母、兄弟、表兄妹、女兒、父親、孫女、祖父、祖母、孫子、母親、侄子或外甥、侄女或外甥女、姐妹、兒子和叔叔）。他們讓四組大學生（兩組女同學，兩組男同學）根據相似程度將各項排序。他們讓其中的兩組同學（一組女同學，一組男同學）進行了兩次排序，第二次排序和第一次排序采取的標準不同。這樣，一共得到六組“源”。每個源對應一個 15 x 15 的近似值矩陣，其單元格中的值等于源中的人數減去此源中對象被劃分的次數。

kinship_ini.sav

該數據文件包含 kinship_dat.sav的三維解的初始配置。

kinship_var.sav

該數據文件包含自變量 gender、gener(ation) 和 degree (of separation)，這些變量可用于解釋 kinship_dat.sav的解的維數。具體而言，它們可用來將解的空間限制為這些變量的線性組合。

marketvalues.sav

該數據文件涉及 1999–2000 年間 Algonquin，Ill. 地區新的房屋開發中的住房銷售。這些銷售僅僅來自公眾記錄。

nhis2000_subset.sav

美國健康訪問調查 (NHIS) 是針對美國全體公民的大型人口調查。該調查對美國的具有全國代表性的家庭樣本進行了面對面的訪問，并獲取了每個家庭的成員的健康行為和健康狀態的人口統計信息和觀察數據。該數據文件包含取自 2000 年調查信息的子集。國家健康統計中心。2000年美國健康訪問調查。公用數據文件和文檔。ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/Datasets/NHIS/2000/。2003 年發布。

ozone.sav

這些數據包含了用來根據其余變量預測臭氧濃度的六個氣象變量的 330 個觀察值。在以前的研究人員中，12和 13發現了這些變量之間的非線性，這妨礙了標準回歸方法。

pain_medication.sav

該假設數據文件包含用于治療慢性關節炎疼痛的抗炎藥的臨床試驗結果。我們感興趣的是該藥見效的時間以及它和現有藥物的比較。

patient_los.sav

該假設數據文件包含被醫院確診為疑似心肌梗塞（即 MI 或“心臟病發作”）的患者的治療記錄。每個個案對應一位單獨的患者，并記錄與其住院期有關的一些變量。

patlos_sample.sav

該假設數據文件包含在治療心肌梗塞（即 MI 或“心臟病發作”）期間收到溶解血栓劑的患者的樣本治療記錄。每個個案對應一位單獨的患者，并記錄與其住院期有關的一些變量。

poll_cs.sav

該假設數據文件涉及民意測驗專家在確定正式立法前公眾對法案的支持水平方面的舉措。個案對應注冊的選民。每個個案記錄選民居住的縣、鎮、區。

poll_cs_sample.sav

該假設數據文件包含在 poll_cs.sav中列出的選民的樣本。該樣本是根據 poll.csplan中指定的設計來選取的，而且該數據文件記錄包含概率和樣本權重。請注意，由于該抽樣計劃使用與大小成正比 (PPS) 方法，因此，還有一個文件 (poll_jointprob.sav) 包含聯合選擇概率。在選取了樣本之后，對應于選民人群統計信息及其對提交法案的意見的附加變量將被收集并添加到數據文件。

property_assess.sav

該假設數據文件涉及某縣資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應過去一年中縣里所出售的資產。數據文件中的每個個案記錄資產所在的鎮、最后評估資產的評估員、該次評估距今的時間、當時的估價以及資產的出售價格。

property_assess_cs.sav

該假設數據文件涉及某州資產評估員在利用有限的資源不斷更新資產價值評估方面的舉措。個案對應該州的資產。數據文件中的每個個案記錄資產所在的縣、鎮和區，最后一次評估距今的時間以及當時的估價。

property_assess_cs_sample.sav

該假設數據文件包含在 property_assess_cs.sav中列出的資產的樣本。該樣本是根據property_assess.csplan中指定的設計來選取的，而且該數據文件記錄包含概率和樣本權重。在選取了樣本之后，附加變量 Current value將被收集并添加到數據文件。

recidivism.sav

該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應先前的一名罪犯，并記錄其人口統計信息和第一次犯罪的詳細資料；如果在第一次被捕后兩年內又第二次被捕，則還將記錄兩次被捕間隔的時間。

recidivism_cs_sample.sav

該假設數據文件涉及某政府執法機構在了解其管轄區域內的屢犯率方面的舉措。每個個案對應在2003 年 6 月期間第一次被捕釋放的先前的一名罪犯，并記錄其人口統計信息和第一次犯罪的詳細資料，及其第二次被捕的數據（如果發生在 2006 年 6 月底之前）。根據recidivism_cs.csplan中指定的抽樣計劃從抽樣部門選擇罪犯；該計劃使用與大小成正比 (PPS)方法，因此，還有一個文件 (recidivism_cs_jointprob.sav) 包含聯合選擇概率。

rfm_transactions.sav

此假設數據文件包含購買交易數據，即每筆交易的購買日期、購買商品和消費金額。

salesperformance.sav

這是關于評估兩個新的銷售培訓課程的假設數據文件。60 名員工被分成 3 組且都接受標準的培訓。另外，組 2 接受技術培訓；組 3 接受實踐教程。在培訓課程結束時，對每名員工進行測驗并記錄他們的分數。數據文件中的每個個案代表一名單獨的受訓者，并記錄其被分配到的組以及測驗的分數。

satisf.sav

該假設數據文件涉及某零售公司在 4 個商店位置所進行的滿意度調查?？偣矊?/span> 582 位客戶進行了調查，每個個案代表一位單獨客戶的回答。

screws.sav

該數據文件包含關于螺釘、螺栓、螺母和圖釘的特征的信息14。

shampoo_ph.sav

這是關于某發制品廠的質量控制的假設數據文件。在規定的時間間隔對六批獨立輸出的產品進行檢測并記錄它們的 pH 值。目標范圍是 4.5–5.5。

ships.sav

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

特征字段數據倉庫

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統競選大戲開鑼，川普當選的奇跡會再發生嗎？

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊