熱線電話:13121318867

登錄
首頁精彩閱讀R語言分析老九門到底誰是主角
R語言分析老九門到底誰是主角
2016-08-03
收藏

R語言分析老九門到底誰是主角

本人最近看了老九門,兩大男主角都是顏值擔當,我的朋友中有喜歡佛爺(陳偉霆),有的喜歡二爺(張藝興)。從我的朋友中發現更多人傾向于張藝興扮演的二爺,他們認為二爺(張藝興)是男1號。但是從出場次數和演員表排名佛爺(陳偉霆)都在二爺(張藝興)之前。我一直認為佛爺(陳偉霆)是主演,也讓我對這二位誰是主角產生的好奇,于是決定用R語言進行文本統計一下,證明誰是男1,誰是男2。目前關于R文本挖掘的方法已經有很多了,這里再簡單介紹一下。進而論述結果。代碼如下:

#####首先,加載所需要的工具包

######注意rJava需要jdk環境

##########接下來要自定義加載詞,因為二月紅并不是傳統意義的詞語,如果不單獨加載會被分成二月,紅。兩個詞。

##########加載方法有很多,本人選擇最簡單的加載單個詞語方法insertWords,deleteWords為刪除該詞

####insertWords(“二月紅”)

###deleteWords(“二月紅”)

#接下來就是正常的統計詞頻,小說數據在附件

#####從統計結果,可以看出佛爺出現的次數的確大于二月紅

##將統計結果在畫出詞云展現一下,目前詞云的形狀可視化多種多樣,本人用最簡單的方式進行展現

#畫圖

可視化展現看出佛爺字體大小大于二月紅。

因此,從原著來講,佛爺為男1,二月紅為男2。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢