熱線電話:13121318867

登錄
首頁精彩閱讀關聯分析算法:fp-growth算法的簡單介紹
關聯分析算法:fp-growth算法的簡單介紹
2020-05-19
收藏
FP-Growth使用了一種特殊的分治策略,將提供頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP-tree),但仍保留項集關聯信息。

這種關聯分析算法的概念由韓嘉煒等人在2000年提出,在FP-Growth算法中使用了一種稱為頻繁模式樹(Frequent Pattern Tree)的數據結構。

FP-tree是一種特殊的前綴樹,由頻繁項頭表和項前綴樹構成。FP-Growth算法基于以上的結構加快整個挖掘過程。

有關FP-Growth算法的知識點:

FP-Tree:將事務數據表中的各個事務數據項按照支持度排序后,把每個事務中的數據項按降序依次插入到一棵以 NULL為根結點的樹中,同時在每個結點處記錄該結點出現的支持度。

條件模式基:包含FP-Tree中與后綴模式一起出現的前綴路徑的集合

條件樹:將條件模式基按照FP-Tree的構造原則形成的一個新的FP-Tree

FP-Growth算法的基本思路:不斷地迭代FP-tree的構造和投影過程

FP-Growth算法的分解:

1、對于每個頻繁項,構造它的條件投影數據庫和投影FP-tree。

2、對每個新構建的FP-tree重復這個過程,直到構造的新FP-tree為空,或者只包含一條路徑。

3、當構造的FP-tree為空時,其前綴即為頻繁模式;當只包含一條路徑時,通過枚舉所有可能組合并與此樹的前綴連接即可得到頻繁模式。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢