
如果說最近最熱門的綜藝,那《乘風破浪的姐姐》(下文簡稱《姐姐》)可謂實至名歸。30位出道多年的姐姐輩女藝人,一個個風格各異、個性鮮明。她們將通過合宿生活與舞臺競演,最終選出5位組成逆齡女團。
《乘風破浪的姐姐》就這樣突然定檔、突然播出、播出前無宣發的情況下爆了,一經播出就搶占各大熱搜榜。
今天,我們帶大家就用
來盤一盤這些
主要從以下幾點展開:
乘風破浪的姐姐?NO!是興風作浪的姑奶奶
出道時長十年起,這些姐姐們都有誰?
豆瓣8.3分,姐姐們的實力妥妥的
Python分析9萬條彈幕,誰才是真正的C位?
01乘風破浪的姐姐?
NO!是興風作浪的姑奶奶
既然是選最特別的女團,哪些人參加自然是關注的焦點。寧靜、伊能靜、鐘麗緹、張雨綺、萬茜、黃圣依…光是聽到這些選手的名字就讓人太期待了!
姐姐們很“任性”
不同于一般的女團選秀,漂亮妹妹們都得聽從節目組的安排,而這次的姐姐們普遍很“不服管教”,畢竟都是在自己領域出道多年的資深前輩,她們非常有底氣,知道自己想要什么。
節目組讓做自我介紹,寧靜霸氣的回復:“還要介紹我是誰?那我這幾十年不是白干了?”
節目組導演讓伊能靜擋一下膝蓋,伊能靜說:“這是褲子,我擋不了。你配合我一下,別讓我配合你們”。
問萬茜為何來參加節目,萬茜回答:“經紀人逼我來的”。這也太真性情了吧,簡直不是乘風破浪的姐姐,而是興風作浪的姑奶奶們呀。
端水大師——黃曉明
這些姐姐們,也讓在中餐廳里“我不要你覺得 我要我覺得”的霸道總裁黃教主秒變暖心的小明同學——“我不要你覺得,我要您覺得”人送稱號端水大師,滿滿的求生欲。
憑實力挨罵——杜華
在點評環節中,作為評審之一杜華也是各種憑實力挨罵。依然以評選20多歲女團的刻板標準評價姐姐們,讓不少觀眾都看得滿頭問號,越看越氣。
02出道時長十年起,唱跳演樣樣精通
姐姐們到底有多強?
下面讓我們看到數據部分。我們搜集了百度百科和維基百科的選手數據。
姐姐們年齡分布
先看到年齡分布,可以看到29-33這個年齡段的姐姐最多共有11位,占比36.67%。其次是34-37歲,共10位,占比33.33%。
姐姐們都來自哪兒?
然后是地區分布,姐姐們都來自哪里呢?其中來自湖南和上海的最多,各有五位。阿朵、萬茜、劉蕓、沈夢辰、孟佳都是我們湖南湘妹子。然后四川、遼寧、山東的各兩位。
姐姐們都是哪些職業
在職業方面呢,我們可以看到,她們大多數演員和歌手出身,藝人中身兼數職的情況比較普遍,30人中至少有17人身兼多職,其中13人既是演員、也是歌手。
初舞臺得分的關鍵因素
《乘風破浪的姐姐》初評分數由個人特質、成團潛力、聲樂表現力和舞臺表現構成,每項25分,總分100分。
我們通過Python計算數值型變量之間的pearson相關系數。對于系數r的取值,根據經驗可將相關程度分為以下幾種情況,|r|>=0.8時,可視為高相關,0.5<=|r|<0.8.可視為中度相關,0.3<=|r|<0.5時,可視為低度相關,|r|<0.3.可視為不相關。根據相關系數數值,在95%的置信程度水平情況下:
控制其他影響因素的情況下,個人特質打分對初舞臺分數的影響最大。
初評舞臺分數和年齡、出道年數沒有顯著相關關系。
年齡和個人特質、成團潛力的分數間存在低度負相關關系,年齡越大,個人特質和成團潛力的得分也就越低;
個人特質和成團潛力的打分之間存在高度正相關,即兩者得分存在高則同高,低則同低的情況。
03豆瓣8.3分,姐姐們的實力妥妥的
目前這部綜藝在豆瓣的評分為8.3分,很不錯的成績,已有7萬2千余人進行評價。
豆瓣總體評分分布
看到具體評分分布,給出四星的最多,為38.2%;其次是5星 占比25%??磥碛^眾普遍還是十分認可姐姐們的表現的。
短評詞云圖
可以看到詞云主要圍繞的是"姐姐"、"節目"、"女團"展開。其中在需選手中寧靜、萬茜被提到的頻率最高。
當然也有不少吐槽的點,大家的吐槽主要集中在:
評委杜華:不公平;30+的女性歲月積淀了魅力,評審卻按照20歲女團的標準來;給丁當打分真是要氣炸。
黃曉明:從霸道總裁秒慫變小明,讓人感覺尷尬不已
節目組:場景布置令人寒酸,攝影差,燈光差,布景差。
也有吐槽選手的
黃圣依:等黃圣依淘汰了我再改成五星,謝謝。
04Python分析9萬條彈幕
誰才是真正的C位一姐?
我們統計了芒果tv第一期的彈幕數據,共94575條。
下面展示芒果Tv彈幕爬蟲部分代碼,分析部分代碼暫略。數據獲取的具體思路如下:
分析網頁,彈幕數據是動態加載的,因此通過Chrome瀏覽器進行抓包分析并獲取真實的URL請求地址;
使用selenium請求網頁數據;
使用正則表達式re將文本中的HTML提取出來,使用json進行解析;
使用pandas進行數據的保存。
1. 彈幕在哪里找?
打開《乘風破浪的姐姐》選取一集,觀看我們要抓取的彈幕,可以看出彈幕是在視頻播放之后才滾動加載的,所以我們可以判斷視頻是通過JS異步加載的。
按照經驗,我們切換到network-XHR下面查看,如下圖所示,很容易發現了彈幕請求的地址:
https://bullet-ws.hitv.com/bullet/2020/06/21/104556/8337559/0.json
其中:2020/06/21代表日期,104556和8337559參數每集不一樣,通過抓包獲取即可。
2. 獲取并解析數據
具體代碼如下:
# 導入包
import pandas as pd
import time
import re
import json
from selenium import webdriver
# 打開Chrome(需配置webdriver)
browser = webdriver.Chrome()
def get_mgtv_danmu(month_num, day_num, num1. num2):
step = 1
df_all = pd.DataFrame()
while True:
try:
# 第一集URL
danmu_url = 'https://bullet-ws.hitv.com/bullet/2020/{}/{}/{}/{}/{}.json'.format(month_num, day_num, num1. num2. step)
# 打印進度
print('正在獲取第{}頁的信息'.format(step))
step += 1
# 獲取彈幕
browser.get(danmu_url)
# 休眠3秒
time.sleep(3)
# 提取數據
pattern1 = re.compile(r'
')
pattern2 = re.compile(r'')
data1 = re.sub(pattern1. '', browser.page_source)
data2 = re.sub(pattern2. '', data1)
# 解析數據
js_data = json.loads(data2)
# 獲取數據
all_data = js_data['data']['items']
# id
danmu_id = [i.get('id') for i in all_data]
# uname
uname = [i.get('uname') for i in all_data]
# 內容
content = [i.get('content') for i in all_data]
# 時間
danmu_time = [i.get('time') for i in all_data]
# 點贊
up_count = [i.get('v2_up_count') for i in all_data]
# 分鐘
danmu_minites = step-1
# 保存數據
df_one = pd.DataFrame({
'danmu_id': danmu_id,
'uname': uname,
'content': content,
'danmu_time': danmu_time,
'up_count': up_count,
'danmu_minites': danmu_minites
})
# 循環追加
df_all = df_all.append(df_one, ignore_index=True)
except Exception as e:
print(e)
print('沒有此頁面, 爬蟲結束')
break
return df_all
if __name__ == '__main__':
#
df_1 = get_mgtv_danmu(month_num='06', day_num='21', num1=104556. num2=8337559)
獲取的數據以數據表的形式存儲,如下所示:
df.head()
03 結論部分
選手彈幕熱度排名
在排名數據上,占據前四位的分別是寧靜、萬茜、吳昕和張雨綺。
下面,分別看到她們的個人彈幕詞云圖。
寧靜-彈幕詞云
喜歡寧靜的,都喜歡她那種強大的大姐大氣場,感覺靜姐這哪里是來出道當女團的,明明是來選妃的。
萬茜-彈幕詞云
再看到萬茜,淡雅的性格配上努力勤奮換來的過硬實力,在節目里,萬茜也堪稱人氣王,除了觀眾愛她,姐姐們也都愛她。關于她的彈幕都是各種"喜歡"、"可愛"、"性格圈粉"等等。
吳昕-彈幕詞云
吳昕這次在節目中給了人眼前一亮的感覺,不再是快樂家族中沒啥臺詞的小透明,從用心準備的節目,到談吐性格都讓人感覺十分舒服,非常圈粉。
張雨綺-彈幕詞云
最后再看到張雨綺,她真的是反差萌擔當了,以為是高冷霸總,結果卻是個可愛憨憨,從賽前采訪就開始搞笑。帶來的節目是《粉紅色的回憶》,理由是這是自己唯一能唱完的歌,也是十分可愛了。
結語:
這么多個性十足的姐姐們真是讓人愛了愛了,特別是《乘風破浪的姐姐》的開場旁白,非常讓人印象深刻:
三十而勵!三十而立!三十而驪!
30歲以后,人生的見證者越來越少,但還可以自我見證!
30歲以后,所有的可能性不斷褪卻,但還可以越過時間,越過自己!
不要輕易用年齡定義自己,只要有追逐夢想的心,無論什么年齡段都有屬于自己的精彩!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25