
最近這部《隱秘的角落》徹底火了,目前在豆瓣高達8.9分,有45萬余人進行了評論。
一時間劇中張東升那句「爬山」、「你說我還有機會嗎」 承包了6月份的梗。各種表情包和段子齊飛。
作為主演秦昊當年的同學,章子怡都出來打call。
刷完劇,那首「小白船」簡直成了新的恐怖童謠,讓人在腦海中無限循環,太上頭了。
那么這部制作精良的國產劇為何能收獲到觀眾的一致好評?大家在看劇時都在討論些什么?今天我們就用數據來帶你看看。
01拿拍電影的態度拍網劇 ,不好看才怪
該劇改編自紫金陳推理小說《壞小孩》 ,講述了沿海小城的三個孩子在景區游玩時無意拍攝記錄了一次謀殺,他們的冒險也由此展開。撲朔迷離的案情,將幾個家庭裹挾其中,帶向不可預知的未來......
劇剛開始的畫面就是,文質彬彬的男青年帶著一對老人在山頂拍照,二老坐在石頭上,背后就是萬丈深淵,男青年上前親自指導姿勢,而就在一瞬間,他眼神一冷,兩只手同時發力,將二老從山頂推了下去,甚至在推完還在佯作驚慌失措的樣子大喊:“爸!媽!”而這一切卻被三個游玩的小孩無意拍了下來。
這一開場就把觀眾嚇了一跳,甚至都起了雞皮疙瘩。同時也讓人欲罷不能想看看接下來會發生什么故事。
劇情不拖沓,演技全員在線
不同于國產劇一般動輒四五十集的篇幅,《隱秘的角落》只有短短的12集,故事緊湊,劇情毫不拖泥帶水。
而整部劇中,無論是從挑大梁的秦昊,到三位小演員,還是王景春、張頌文等一眾演員都奉獻出了無可挑剔的演技。
令人印象深刻的配樂
配樂也是《隱秘的角落》中的亮點之一。配合影視劇的懸疑劇情,這些配樂聽起來確實分外驚悚恐怖,也給大家留下了不可磨滅的陰影,被網友調侃:“能不能整點陽間的音樂?”如果問為什么本劇配樂這么講究,要知道《隱秘的角落》的導演辛爽可是樂隊音樂人出身的。
02豆瓣8.9分 年度國劇之光!
首先,我們看到豆瓣的數據。這部劇一開播在豆瓣評分就沖上9.0分,一度沖到9.2分,隨著劇集完結,目前穩定在8.9分,已經有45萬余人進行了評分。
總體評分
細看評分的分布可以發現,有54.4%的人都給出了五星好評,其次23.4%的人給出四星。這個成績還是很不錯的。
評論熱度走勢圖
從評論走勢圖可以看到,《隱秘的角落》在6月16日首播,評論熱度最高。之后不同于其他劇,隨著播出時間評論數量趨于平緩,這部劇再播出后也不時帶來熱度,引發觀眾的評論潮。
評論中提及主演
大家在評論時都提到哪些角色了呢?
分析發現,主演張東升的討論度果然是最高的,其次是三個小演員之一的朱朝陽。演技派演員王景春和張頌文飾演的陳警官和朝陽爸爸討論度也很高。
主演評價分布
我們分析了豆瓣短評中用戶關于主演的好評/一般/差評分布占比。
細致到個人表演來看,小演員們的表現相當突出,比如朱朝陽的扮演者榮梓杉,有超過9成的觀眾肯定了他的表現。秦昊、王景春兩位的表現自然也是很厲害的。他們在劇中的表現,分別獲得了88.08%和89.29%的好評率。
0320萬條彈幕告訴你
追劇時大家都在說些什么?
接下來我們分析一下《隱秘的角落》在愛奇藝的彈幕數據,我們分析整理了全部12集的彈幕,共200672條。下面看到分析結論:
用戶使用的彈幕角色
觀眾在愛奇藝追劇發彈幕時,可以選擇自己喜歡的角色頭像。那么觀眾都最喜歡用哪些用人物角色發彈幕呢?
可以看到,這方面張東升在這方面是榜首。其次是朱朝陽,然后可愛的小妹妹普普位居第三。
彈幕字數分布
在彈幕的字數上我們可以看到,5-10個字的是最多的,共有11萬余條彈幕。其次是10-15個字,48032條彈幕。0-5個字的彈幕也有不少,共25420條??梢娫谧穭“l彈幕時,大家還是傾向多說點,表達自己的想法。
整體彈幕詞云
在整體彈幕詞云中,「孩子」、「嚴良」、「普普」被提到的頻率很高??吹饺恍≈餮莸囊慌e一動還是牽動著觀眾的心的。
接下來,我們分別看到幾位主演的人物彈幕詞云吧。
張東升
首先就是張東升了,不同于一般臉譜化的反派角色。在張東升的身上,大家既看到他的冷酷,兇殘,也看到他的無奈和隱忍。在彈幕中,關于他,提到「爬山」、「機會」的特別多,這幾句張東升的話實在太出圈了。
有意思的是,張東升的「頭發」也被頻頻提及,畢竟這個禿頭造型實在是太令人印象深刻了。
朱朝陽
下面再看到三位小主演中最受關注的朱朝陽。品學兼優的他,因為父母離異性格有些內向和孤僻。在詞云中,他與「爸爸」、「媽媽」的感情也是大家討論最多的。其次他與「張東升」間的對手戲,以及后面他角色的「黑化」也是討論焦點。
普普
劇中的小妹妹普普也是很多人喜歡的角色了,在詞云中可以看到觀眾對她的「喜歡」,以及對她「演技」的肯定。此外,「善良」等詞也常被提到。
嚴良
劇中的另一位小演員角色——嚴良也是彈幕中關注度很高的。關于他,大家經常會提到跟他形影不離的「普普」,此外「演技不錯」「厲害」等詞也頻出。
04教你用Python分析愛奇藝彈幕數據
我們使用Python獲取并分析愛奇藝的彈幕數據,整個數據分析的流程分為以下三個部分:
下面看到具體步驟:
首先導入所需包,其中pandas用于數據讀入和數據處理,os用于文件操作,jieba用于中文分詞,pyecharts和stylecolud用于數據可視化。
# 導入庫 import pandas as pd import os import jieba from pyecharts.charts import Bar, Pie, Line, WordCloud, Page from pyecharts import options as opts from pyecharts.globals import SymbolType, WarningType WarningType.ShowWarning = False import stylecloud from IPython.display import Image
我們將爬取的數據存放在data文件夾下,使用os操作獲取需要讀取的csv文件列表。
# 文件列表 data_list = os.listdir('../data/') data_list
['df_第一集.csv', 'df_第七集.csv', 'df_第三集.csv', 'df_第九集.csv', 'df_第二集.csv', 'df_第五集.csv', 'df_第八集.csv', 'df_第六集.csv', 'df_第十一集.csv', 'df_第十二集.csv', 'df_第十集.csv', 'df_第四集.csv']
然后使用pandas將csv文件讀入并循環追加到總表df_all中,打印以下數據集大小看一下,一共有200672條。
# 存儲數據 df_all = pd.DataFrame() # 循環寫入 for i in data_list: df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0) df_all = df_all.append(df_one, ignore_index=False) # 打印數據集大小 print(df_all.shape)
(200672, 6)
再預覽一下前五行數據。
# 預覽數據 df_all.head()
數據讀入之后,接下來簡單對數據集進行預處理的工作,我們針對name字段進行以下處理:使用strip操作去除字符串前后的空格;定義一個轉換函數,根據name字段新增name_level字段,標注用戶等級,效果如下:
# 字符串處理 df_all['name'] = df_all.name.str.strip() def transform_name(x): if x=='張東升' or x=='朱朝陽' or x=='普普' or x=='嚴良' or x=='陳冠聲' or x=='周春紅' or x=='朱永平' or x=='葉軍': return 'VIP用戶' elif x=='未知用戶': return '未知用戶' else: return '普通用戶' # 新增列 df_all['name_level'] = df_all.name.apply(transform_name) df_all.head()
接下來使用pyecharts進行數據可視化。主要分析內容包含:
首先統計不同等級用戶的數量。
level_num = df_all.name_level.value_counts() level_num
未知用戶 157722 VIP用戶 41127 普通用戶 1823 Name: name_level, dtype: int64
使用pyecharts中的Pie類繪制餅圖,效果如下:
data_pair = [list(z) for z in zip(level_num.index.tolist(), level_num.values.tolist())] # 繪制餅圖 pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px')) pie1.add('', data_pair, radius=['35%', '60%']) pie1.set_global_opts(title_opts=opts.TitleOpts(title='彈幕發送人群等級分布'), legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%')) pie1.set_series_opts(label_opts=opts.LabelOpts(formatter=":{d}%")) pie1.set_colors(['#3B7BA9', '#6FB27C', '#FFAF34']) pie1.render()
name字段中標注了用戶發送彈幕時候使用的彈幕角色,統計并篩選不同彈幕角色的使用頻次。
role_num = df_all.name.value_counts()[1:9] role_num
張東升 18734 朱朝陽 8742 普普 4688 嚴良 2595 陳冠聲 2122 周春紅 1879 朱永平 1333 葉軍 1034 Name: name, dtype: int64
然后使用pyecharts中的Bar類繪制一張餅圖。
# 柱形圖 bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) bar1.add_xaxis(role_num.index.tolist()) bar1.add_yaxis("", role_num.values.tolist(), category_gap='5%') bar1.set_global_opts(title_opts=opts.TitleOpts(title="VIP用戶最喜歡使用的彈幕角色"), visualmap_opts=opts.VisualMapOpts(max_=18734), ) bar1.render()
content字段記錄了用戶評論的彈幕信息,此處根據這個字段計算字數并按照步長5進行分箱處理,得到不同字數段下的頻次分布。
word_num = df_all.content.apply(lambda x:len(x)) # 分箱 bins = [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50] word_num_cut = pd.cut(word_num, bins, include_lowest=False).value_counts() word_num_cut = word_num_cut.sort_index() word_num_cut
(0, 5] 25420 (5, 10] 113834 (10, 15] 48032 (15, 20] 9864 (20, 25] 2385 (25, 30] 645 (30, 35] 274 (35, 40] 109 (40, 45] 49 (45, 50] 46 Name: content, dtype: int64
同樣使用Bar類繪制一張條形圖。
# 柱形圖 bar2 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px')) bar2.add_xaxis(word_num_cut.index.astype('str').tolist()) bar2.add_yaxis("", word_num_cut.values.tolist(), category_gap='4%') bar2.set_global_opts(title_opts=opts.TitleOpts(title="彈幕發送字數分布"), visualmap_opts=opts.VisualMapOpts(max_=113834), ) bar2.render()
接下來我們定義一個分詞函數get_cut_words,這個函數的功能是傳入一列數據,得到使用jieba分詞之后的列表。
# 定義分詞函數 def get_cut_words(content_series): # 讀入停用詞表 stop_words = [] with open(r"C:\Users\wzd\Desktop\CDA\CDA_Python\Python文本分析\10.文本摘要\stop_words.txt", 'r', encoding='utf-8') as f: lines = f.readlines() for line in lines: stop_words.append(line.strip()) # 添加關鍵詞 my_words = ['秦昊', '張東升', '王景春', '陳冠聲', '榮梓杉', '朱朝陽', '史彭元', '嚴良', '王圣迪', '普普', '岳普', '張頌文', '朱永平', '十二集', '十二萬', '十二時辰'] for i in my_words: jieba.add_word(i) # 自定義停用詞 my_stop_words = ['真的', '這部', '這是', '一種', '那種', '哈哈哈'] stop_words.extend(my_stop_words) # 分詞 word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False) # 條件篩選 word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2] return word_num_selected
將角色張東升的彈幕數據傳入函數,得到分詞之后的列表。
text1 = get_cut_words(content_series=df_all[df_all.name=='張東升']['content']) text1[:5]
Building prefix dict from the default dictionary ... Dumping model to file cache C:\Users\wzd\AppData\Local\Temp\jieba.cache Loading model cost 1.280 seconds. Prefix dict has been built successfully. ['爬山', '老弟', '十二集', '知足', '伊能靜']
然后使用stylecloud工具包繪制一張心形的詞云圖,效果如下:
# 繪制詞云圖 stylecloud.gen_stylecloud(text=' '.join(text1), max_words=1000, collocations=False, font_path=r'?C:\Windows\Fonts\msyh.ttc', icon_name='fas fa-heart', size=653, output_name='./詞云圖/彈幕角色-張東升詞云圖.png') Image(filename='./詞云圖/彈幕角色-張東升詞云圖.png')
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25