熱線電話:13121318867

登錄
首頁精彩閱讀注意這兩點,你的數據挖掘工作成功率翻一番
注意這兩點,你的數據挖掘工作成功率翻一番
2019-04-23
收藏

我們在進行數據挖掘工作的時候,我們需要使用一些模型,而模型中還需要對數據類型進行處理,我們一定要重視模型的使用,這樣我們的數據挖掘模型的成功率就能夠大增。我們在這篇文章中給大家介紹一下預測模型,同時也給大家介紹一下數據挖掘中使用的內容類型。

1.預測模型

在預測模型中,所有預測工具都要求我們預測連續數值。無法預測已保存為文本的數字。如果數據包含數據類型錯誤的數字列,可以使用Excel函數創建數字數據類型正確的列的副本。如果執行此操作,請務必刪除包含文本數字的列的副本,以便值不會重復。當然,如果要創建回歸模型的散點圖,則輸入變量也必須是連續數字。這樣我們可以根據使用內容類型生成更好的模型。所謂“內容類型”是應用于列的屬性,用來指定模型使用列數據的方式。執行分析時,算法可以使用內容類型作為說明或提示。如果使用在此外接程序中提供的向導和工具,則不必擔心內容類型。但是,如果使用將模型添加到結構建模選項將新模型添加到現有數據,則可能會得到與內容類型相關的錯誤。

得到錯誤的原因我們就必須清楚導致錯誤的原因是,某些類型的模型要求某種類型的數據。這些工具根據特定要求處理這些列,并且還添加內容類型屬性。因此,如果對完全不同的算法重復使用數據,則可能需要更改數據類型或內容類型。

2.數據挖掘中內容類型

我們現在給大家介紹一下數據挖掘中使用的內容類型,數據挖掘中使用的內容類型有離散、鍵、鍵序列、鍵時間。首先說一下離散,該列包含各值之間沒有連續體的有限數量的值。例如,性別列是一個典型的離散屬性列,這是因為該數據表示特定數量的類別。然后我們給大家說一下鍵,該列唯一標識某一行。通常,鍵列是數值或文本標識符,不應該用于分析,只應用于跟蹤記錄。時序鍵和序列鍵是例外。接著說一下鍵序列,該列包含表示事件序列的值。這些值是有序值,但不必按等差排列。鍵時間就是該列包含按順序排列并表示時間刻度的值。僅當模型為時序模型或順序分析和聚類分析模型時才能使用鍵時間內容類型。

數據挖掘工作中我們需要重視的有預測模型的內容以及數據挖掘中使用的內容類型,大家在做數據挖掘工作的時候切莫忽視這兩個細節,只有這樣我們才能夠處理好當下的工作。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢