
作者 | Alexander Felfernig, Seda Polat Erdeniz
編譯 | CDA數據科學研究院
Recommender systems in the Internet of Things
物聯網是一種聯網的基礎架構,是物聯網、互聯網和語義學領域之間融合的結果,為隨時隨地連接不同設備提供了基礎。在物聯網場景中,開發了大量的服務和應用程序,這使識別相關的服務和應用程序成為用戶的一項復雜任務。在這種情況下,推薦系統便成了一項關鍵的技術,這些技術使大部分服務和應用程序的識別變得可行。比如在物聯網等場景下可以在網關上安裝一些應用程序,附加設備由網關部署和管理,同時在公共顯示器上顯示的信息文本,會被用于在網關上完成特定任務相關的數據傳輸協議,并應包括IoT相關場景中相關的硬件和軟件組件。
推薦技術在IoT上下文中的進一步應用包括工作流程的推薦(例如,應將哪些軟件功能包含在IoT應用程序的工作流程定義中),食品的推薦(例如,根據食品的狀況,可以調整提供條件),在個性化店內購物場景中進行推薦(例如,根據實體店中顧客的位置,應推薦哪些商品)以及健康監控(例如,根據一個人當前的飲食行為和身體狀況,推薦食物和體育鍛煉)。在許多情況下,靈活的物聯網網關基礎設施都扮演著核心角色。
IoT網關是基于硬件和軟件的解決方案,其主要作用是實現設備到設備中心/或設備到云的通信。它是一個平臺,用于支持不同數據源(具有各種通信協議的傳感器)與目的地(本地或遠程數據管理實體以及各種執行器)之間的連接。物聯網網關位于設備的邊緣和附近,也可能在服務執行中發揮關鍵作用。典型的物聯網網關平臺由設備管理器,通信/數據協議管理器,應用程序管理器和數據管理器組成(請參見下圖)。先進的IoT網關包含其他功能,其中可以包括配置器和推薦器引擎,以幫助用戶配置網關或基于給定的網關設置和用戶交互協議推薦有用的應用程序。
如圖1所示,可以使用5G,BLE,LORA和ZigBee等各種連接協議將IoT傳感器連接到IoT網關。網關用戶可以通過WAN / LAN連接其網關,以管理或監視其數據和服務。他們還可以通過將云應用程序與其IoT網關鏈接來管理或監視收集的數據。
推薦技術可用于多種目的,以支持不同的物聯網場景。在本節中,我們將會介紹協同過濾,基于內容的過濾,基于知識的推薦和組合推薦這四項基本推薦技術,如何根據不同場景去實現推薦的功能。
基于“口口相傳”的想法,即朋友(最近鄰居– NN)對物品的意見或看法被用作計算推薦算法的主要信息來源。然后,使用k個最近鄰居的偏好(等級)來推斷當前用戶的偏好。例如,將安裝在與當前用戶具有類似應用程序庫的用戶的網關上的應用程序,安裝在當前用戶的網關上。物聯網環境中協同過濾的其他應用示例是物聯網環境提升中的設備推薦和組件部分推薦。支持協同過濾的不同場景的推薦庫的示例是Apache Mahout。
表1:根據其他網關的安裝信息,基于協同篩選的設備(d1..d4)和應用程序(app1..app4)推薦。與本地網關相比,網關1的配置文件是最相似的配置文件。由于app3未安裝在本地網關上,因此可以將其解釋為推薦候選。推薦的應用程序用√表示。
基于穩定的首選項的想法,即過去的首選項在將來不會發生重大變化。使用基于內容的過濾時,有關物品的基于關鍵字的信息與從當前用戶過去已經消費過的項目中提取的關鍵字匹配。例如,如果用戶安裝了特定的應用程序,則可以在可用時推薦類似的應用程序或對現有應用程序的更新。在IoT上下文中應用基于內容篩選的其他示例是設備和工作流程的推薦。支持基于內容過濾的不同場景的推薦庫示例是Apache Lucene。
表2:使用本地網關上已安裝的應用程序的關鍵字(key)對應用程序進行基于內容過濾的推薦。與本地網關的配置文件相比,app1的關鍵字是最相似的關鍵字。由于app1未安裝在本地網關上(假設),因此可以將其選擇為推薦候選。推薦的應用程序用√表示。
基于使用以顯式方式(即在規則約束方面)定義的推薦知識的思想。使用基于知識的推薦時,當前用戶明確定義的首選項將轉發到知識庫,該知識庫用于確定推薦(搜索問題的解決方案)。例如,如果IoT網關解決方案的用戶更喜歡節電的網關配置,則與其他協議相比,將首選使用特定的通信協議。在物聯網環境中,應用基于知識的推薦技術的其他示例包括整個網關配置的推薦,以及野生動物監測中數據收集策略的推薦。
基于組的推薦系統,是基于對用戶小組的偏好,使用不同算法的匯總結果去推薦。在基于算法集成的推薦中,基本算法(例如協同過濾,基于內容的過濾和基于知識的推薦)用于確定針對單個用戶的推薦。然后將這些建議匯總為該組的最終推薦(基于匯總預測的方法)。相關聚合函數的示例是平均值(推薦用戶評分平均值最高的商品)和風險最少(推薦所有最低評分指標最高的商品)。另外,小組資料可以從小組成員的個人偏好中得出(*基于聚合模型的方法,根據小組資料,可以使用上述基本方法確定推薦。團體推薦系統的實現通?;趩斡脩?a href='/map/tuijianxitong/' style='color:#000;font-size:inherit;'>推薦系統的庫,也就是上述提到的Apache Mahout、Apache Lucene等。
本文討論的推薦方法使用了不同的知識來源,并且還具有不同的優點,這些優點使它們(或更少)適用于特定的推薦方案。在下文中,我們將簡單討論推薦算法選擇的主要標準,并針對這些標準分析所討論的每種算法。
基于內容的篩選和基于協同的篩選的原理都比較簡單,實現方式也比較快,只需獲得有關評分方面的用戶偏好的知識(在基于內容的過濾中,自動提取的關鍵字)就可以得出推薦。由于基于組的推薦系統大部分是使用這些基本算法,所以基于組的推薦系統的實現也比較容易。相比之下,基于知識的推薦方法需要更多的設置投資,由于領域專家和知識工程師之間的通信開銷,知識庫的構建通常是一個容易出錯且繁瑣的過程。
在推薦復雜的產品和服務時,主要支持在用戶和系統之間進行對話的會話方法。在這種情況下,使用基于知識的推薦器,即在基于知識的推薦的上下文中支持對話方法。協同過濾和基于內容的過濾不支持推薦對話框。在小組推薦系統的背景下,由于部分小組推薦系統是基于知識的推薦,因此可以支持會話過程。
協同過濾和基于內容的推薦有較好的適應性,因為每一個新的等級更高程度的適應性可以改變推薦的項目清單。如果將協同過濾或基于內容的推薦用作基礎推薦,這也適用于組推薦方案方法?;谥R的推薦方法顯示出較低的適應性,因為知識庫是比較穩定的,因為單個用戶的偏好習慣不會一時間去改變。
如果用戶喜歡某項推薦,并同時對此推薦感到完全出乎意料,就會產生驚喜度,一般這種效果主要可以通過協同推薦方法來實現?;趦热莸耐扑]一般會假定其偏好保持穩定,并在已經購買的商品列表中提供建議。因此,這種方法提供了非常低的偶然性。同時,基于知識的推薦算法中的偶然性程度取決于編碼的偶然性程度?;谛〗M推薦中的偶然性程度取決于所選擇的基礎基本推薦方法。
協同過濾和基于內容的過濾都存在冷啟動問題:如果在協同過濾中沒有特定用戶的用戶評級,或者到目前為止,當使用基于內容的推薦系統時用戶沒有購買任何商品時,也就是無法獲取相似的推薦。此外,如果某個商品沒有獲得評級,則協同過濾系統很難將其考慮在內。由于基于內容的過濾基于商品的關鍵字,因此即使沒有商品的評級也可以進行推薦?;谥R的推薦不存在冷啟動問題,因為推薦知識被編碼在一個知識庫中,且假定該知識庫在可以開始推薦會話之前就已經存在。
透明度可以視為推薦結果可解釋的程度。協同過濾和基于內容的過濾中的結果具有較低的解釋性,因為如果要解釋的話,只能基于內容的推薦中的相似鄰居和相似關鍵字。在基于知識的推薦中,可以更細化解釋。相關說明可以考慮推薦的原因(由用戶偏好列表表示),但也可以考慮為什么找不到解決方案以及哪些偏好矛盾的原因。在小組推薦系統中,可解釋性取決于所選的基本推薦方法。
由于次優決策的負面影響很大,因此在大多數情況下,此類商品非常復雜,并且需要做出相關決策。其示例是選擇特定的服務器基礎結構或智能家居解決方案。相反,低參與度商品的例子是低價應用程序或傳感器。在大多數情況下,基于知識的方法用于推薦高參與度的商品,而基于內容的協作過濾則用于推薦低參與度的商品。按照先前的論點,如果選擇的基本推薦方法是基于知識的,則可以將小組推薦系統用于高度參與的商品。
在本文中,我們提供了對現有推薦方法的簡短概述,并討論了它們在物聯網場景中的應用的不同方面。在這種情況下,我們還針對可用于選擇推薦算法的一組標準討論了不同方法的優缺點。同時,也有一些與推薦技術在物聯網場景中的應用有關的開放研究問題需要我們關注,尤其是在推薦復雜的IoT配置的情況下,必須開發搜索機制,以便在面對龐大而復雜的配置知識庫時也可以進行高效且個性化的解決方案搜索。此外,必須以有效的方式測試和更新有關產品可變性的知識。這項要求與軟件工程的當前發展相吻合,后者在開發,測試,部署和生產使用之間相繼實現了強大的耦合。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25