
SPSS = 數據測量的類型
數據測量類型
查看IBM SPSS Modeler 幫助文檔,解釋如下:
? 默認值。具有未知存儲類型和值的數據(例如,由于其尚未被讀取)將顯示為<默認值>。
? 連續。用于描述數字值,如范圍 0 - 100 或 0.75 - 1.25。連續值可以是整數、實數或日期/時間。
? 分類。用于字符串值(可取的值的確切數量未知時)。這是一種非實例化數據類型,表示有關數據存儲類型和用法的所有可用信息均未知。讀取數據后,測量級別將為標志、名義或無類型,具體取決于“流屬性”對話框中指定的最大名義字段數量。
? 標志。標志字段用于顯示具有兩個不同值的數據。
表示存在或不存在一個特性,如 true 和 false、Yes 和 No 或 0 和 1。所用值可能有所不同,但其中總會有個值代表“真”值,另一個代表“假”值。標志的存儲類型數據可表示為文本、整數、實數、日期、時間或時間戳。
真。指定條件成立時字段的標志值。假。指定條件不成立時字段的標志值。
標簽。為標志字段中的每個值指定標簽。這些標簽將按照您在“流屬性”對話框中選擇的選項出現在多個位置,如圖形、表格、輸出和模型瀏覽器中。
擴展:“字段選項”—“導出”設置導出為“標志”選項
Derive Flag 節點用于指明特定條件,如高血壓或客戶帳戶停用。對于每條記錄都會創建一個標志字段,當條件為真時,會在字段中添加代表真的標志值。
真值。指定針對滿足以下指定條件的記錄要在標志字段中包括的值。缺省值為 T。
假值。對于那些不滿足以下指定條件的記錄,指定其標志字段中的值。 缺省值為 F。
以下情況時為真。指定某個 CLEM 條件,用于評估每條記錄的某些值,并為記錄賦予真值或假值(定義如上)。請注意,對于非假數字值,會將真值賦予記錄。
注意:要返回空字符串,您應該輸入一對引號,并且中間不包含任何內容,如 ""。例如,空字符串通??捎米骷僦?,以使真值在表中更為明顯。類似地,如果希望某個字符串值在其他情況下被視為數值,應使用引號
? 名義。用于描述具有多個不同值的數據,其中的每個值都被視為集合的一個成員,如 small/medium/large。名義數據可具有任何存儲—數值、字符串或日期/時間。請注意,將測量級別設置為名義不會自動將值更改為字符串存儲。
擴展:設置派生名義選項
Derive Nominal 節點用于執行一組 CLEM 條件,以確定每條記錄滿足的條件。當每條記錄滿足某個條件時,會將一個值(指示滿足哪組條件)添加到新的導出字段。
缺省值。指定不滿足任何條件時要使用的值。
將字段設置為。指定滿足某個特定條件時要在新字段中輸入的值。列表中的每個值都有一個關聯條件,該條件由用戶在相鄰列中指定。
若此條件為真。為集合字段中要列出的每個成員指定條件。使用表達式構建器在可用的函數和字段中進行選擇??梢允褂眉^和刪除按鈕對條件進行重新排序或刪除。
條件的工作原理是對數據集中特定字段的值進行檢驗。檢驗每個條件時,都會為新字段分配上述指定值,以指示滿足哪個條件(如果有)。如果不滿足任何條件,則會使用缺省值。
? 有序。用于描述具有順序固定的不同值的數據。例如,工資類別或滿意度排序可以歸類為有序數據。順序由數據元素的自然排列順序定義。例如,1, 3, 5 是某個整數集合的默認排列順序,而 HIGH, LOW, NORMAL(按字母升序)是某個字符串集合的順序。使用有序測量級別可以將一組分類數據定義為有序數據,以進行可視化處理、模型構建以及導出到將有序數據識別為不同類型的其他應用程序(如 IBM? SPSS? Statistics)。您可以在任何能夠使用名義字段的位置使用有序字段。此外,可以將任何存儲類型(實數、整數、字符串、日期、時間等等)的字段定義為有序。
? 無類型。用于不屬于任何上述類型的數據,具有單個值的字段,或集合的成員數超過定義的最大值的名義數據。當測量級別為包含許多成員(如帳號)的集合時,這種類型也將十分有用。當您為字段選擇無類型時,角色將自動設為無,記錄 ID 作為唯一的替代項。默認的集合最大容量為 250 個唯一值??稍凇傲鲗傩浴睂υ捒颍赏ㄟ^“工具”菜單訪問)的“選項”選項卡上調整或禁用該數字。
可以手動指定測量級別,也可以由軟件讀取數據并根據所讀取的值確定其測量級別。
此外,如果有多個連續數據字段需視為類別數據,可以選擇一個選項來轉換它們。請參閱 主題 轉換連續數據 詳細信息。
字段角色設置:
字段的角色用于指定其在模型構建過程中的用法 - 例如,字段是輸入還是目標(預測的對象)。
注意:“分區”、“頻率”和“記錄標識”角色只能分別應用到單個字段。
可用的角色如下:
目標。字段將用作機器學習的輸出或目標(模型將嘗試預測的字段之一)。
兩者。字段將被 Apriori 節點同時用作輸入和輸出。所有其他建模節點都將忽略該字段。
無。機器學習將忽略該字段。測量級別已設置為無類型的字段將在角色列中自動設置為無。
分區。指明字段用于將數據分區為單獨的樣本(用于訓練、測試,也可用于驗證)。該字段必須屬于實例化集合類型,具有兩個或三個可能值(在“字段值”對話框中定義)。第一個值表示訓練樣本,第二個值表示測試樣本,第三個值(如果存在)表示驗證樣本。所有其他值都將被忽略,且不能使用標志字段。請注意,要在分析中使用分區,必須在相應的模型構建或分析節點的“模型選項”選項卡中啟用分區。啟用分區時,會將對于分區字段具有空值的記錄從分析中排除。如果已在流中定義多個分區字段,那么必須在每個相應建模節點的“字段”選項卡中指定單一分區字段。如果數據中不存在適合的字段,您可以使用“分區”節點或“派生”節點進行創建。請參閱主題分區節點,了解更多信息。
分割。(僅名義、有序和標志字段)指定為字段的每個可能值構建一個模型。
頻率。(僅數字字段)設置此角色允許將字段值用作記錄的頻率加權因子。僅 C&R 樹、CHAID、QUEST 和線性模型支持此功能;所有其他節點將忽略此角色。在支持此功能的建模節點的“字段”選項卡上,選擇使用頻率權重以啟用頻率加權。
記錄標識。此字段將用作唯一記錄標識。大多數節點都會忽略此特征;但它受線性模型支持,并且是 IBM Netezza 數據庫內挖掘節點所必需的。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25