熱線電話:13121318867

登錄
首頁精彩閱讀機器學習在電商文本挖掘中的應用淺析
機器學習在電商文本挖掘中的應用淺析
2016-04-27
收藏
機器學習在電商文本挖掘中的應用淺析


電商平臺中有海量的非結構化文本數據,如商品描述、用戶評論、用戶搜索詞、用戶咨詢等。這些文本數據不僅反映了產品特性,也蘊含了用戶的需求以及使用反饋。通過深度挖掘,可以精細化定位產品與服務的不足。下面描述了電商平臺下機器學習文本挖掘的應用例子。

1、用戶評論分類

場景

用戶評論能反映出用戶對商品、服務的關注點和不滿意點。評論從情感分析上可以分為正面與負面。細粒度上也可以將負面評論按照業務環節進行分類,便于定位哪個環節需要不斷優化。

機器學習 模型

主題聚類、詞向量計算。傳統的機器學習分類模型在評論分類上的精度表現一般,但基于語義的角度進行分類可以有效提高精度。即便如此,在語義類別描述的特征挖掘時,機器學習中的主題聚類、詞向量挖掘技術也不可或缺。

2、搜索詞的需求識別

場景

用戶搜索行為是電商平臺上用戶購物的常用入口,是用戶需求的強體現。將用戶搜索詞分別歸一到具體的品類需求,這是對搜索詞的需求分類。

機器學習模型

基于用戶點擊模型和文本語義關聯的模型,在整個過程中應用到回歸預測、文本分類等。

3、商品標簽挖掘

場景

通常電商平臺需要對商品的功能或風格加上直觀的標簽,便于用戶查找。那么如何從海量的商品描述去挖掘標簽并給商品打上合適的標簽呢。

機器學習模型

聚類與分類技術能大幅減輕人工上的操作。先對商品描述文本預處理,然后進行標簽主題聚類,找出標簽主題的詞分布概率作為特征庫。再根據主題標簽對應的詞分布概率,利用機器學習分類模型去預測商品所屬的標簽。

4、商品咨詢挖掘

場景

商品咨詢可以體現用戶對商品的需求點,有利于需求與服務精確定位。

機器學習模型

不管是咨詢語料的特征詞庫挖掘,還是咨詢短文本的意圖識別,始終要以機器學習與自然語言處理技術作為基礎。

另外,深度學習作為機器學習中的熱門分支,不僅在圖像和語音上有卓越的表現,在自然語言處理上也有應用亮點。

以用戶的負面評論分類為例,淺析深度學習在自然語言處理上的應用。電商平臺上,用戶的負面評論的是千千萬萬細微而散落的點,但我們要將這些點聚集成若干個團,這是一個聚類問題。聚類處理后的點與團,如何直觀的展示出來,這是個 數據可視化問題。

如圖所示,我們抽取負面評論中與業務環節相關的語料進行訓練,用WORD2VECTOR生成詞向量,再通過PCA降維,將高維詞向量低維化,然后將詞在二維圖上展示出來??梢灾庇^的看出物流、售后、促銷環節是關注點。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢