熱線電話:13121318867

登錄
首頁大數據時代python分析6625條視頻,揭秘“打工人”憑啥刷爆全網!
python分析6625條視頻,揭秘“打工人”憑啥刷爆全網!
2020-11-02
收藏

?CDA數據分析師 出品??

作者:Mika

數據:真達??

后期:Mika

【導讀】

Show me data,用數據說話!今天我們聊一聊 python分析“打工人”

最近,“打工?!痹谂笥讶Τ掷m爆火,沒有人能避開來自工友的貼心問候——“早安,打工人”,與此同時“打工人”的表情包也席卷全網,鋪天蓋地,到處吟唱著積極向上的打工人語錄。

“累嗎?累就對了,舒服是留給有錢人的。早安,打工人!冷嗎?冷就對了,溫暖是留給開小轎車的人。早安,打工人!”

相比于先前帶點“喪”的社畜梗,打工梗用昂揚積極的心態去對抗工作的焦慮,這些打工人語錄帶著自嘲,也是認清生活本質的解壓方式,用較為輕松接地氣的玩梗心態,迎接每一天的新工作。

打工梗究竟為什么突然這么火呢?之前小z在《打工人分析簡報》中已經分析了各個平臺打工人話題的相關數據,我們從中也受到了些啟發。?

今天我們就來主要分析一下B站上“打工人”的相關視頻,看看這6625個視頻的背后,打工梗憑什么突然刷屏網絡。

我們使用python獲取,技術分析流程分為以下三個步驟:

爬蟲部分代碼暫略,首先導入分析所需的包并讀入數據集,原數據集一共包含6625個樣本,7個字段,字段含義為:分區標簽、視頻標題、上傳時間、觀看數、彈幕數、up主、視頻url。

01、數據讀入

#?導入包
import?numpy?as?np?
import?pandas?as?pd?
import?matplotlib.pyplot?as?plt?
#?讀入數據
df?=?pd.read_excel('./data/B站打工人視頻10-28.xlsx')
df.head()
print(df.shape)?
(6625,?7)

02、數據預處理

此部分我們初步對原始數據進行處理,其中包含:

  • 去除重復值
  • view_num和danmu:單位轉換
  • 篩選數據

處理之后的數據如下所示:

def?transform_unit(x_col):
????"""
????功能:轉換數值型變量的單位
????"""
????#?提取數值
????s_num?=?df[x_col].str.extract('(d+.*d*)').astype('float')
????#?提取單位
????s_unit?=?df[x_col].str.extract('([u4e00-u9fa5]+)')?
????s_unit?=?s_unit.replace('萬',?10000).replace(np.nan,?1)?
????s_multiply?=?s_num?*?s_unit
????return?s_multiply
#?去重
df?=?df.drop_duplicates()

#?刪除列
df.drop('video_url',?axis=1,?inplace=True)

#?轉換單位
df['view_num']?=?transform_unit(x_col='view_num')?
df['danmu']?=?transform_unit(x_col='danmu')

#?篩選時間
df?=?df[(df['upload_time']?>=?'2020-09-01')?&?(df['title'].astype('str').str.contains('打工人'))]?
df.head()?

03、數據可視化分析

首先導入所需包,其中jieba用于中文分詞,pyecharts用于繪制動態可視化圖形,stylecloud包用于繪制詞云圖。關鍵部分代碼如下:

import?jieba?
from?pyecharts.charts?import?Bar,?Line,?Pie,?Map,?Scatter,?Page
from?pyecharts?import?options?as?opts?
from?pyecharts.globals?import?SymbolType,?WarningType
WarningType.ShowWarning?=?False

01 打工人視頻發布熱度走勢圖

可以看到“打工人”相關視頻首先出現在2020年9月5日,最初的一個月還沒有引起太大的水花。在一個月后,隨著打工梗逐漸深入人心,B站相關視頻也出現了爆點。

10月16日,up主“老摸魚藝術家”的《加油!打工人!》播放量突破350萬。幾天后,10月22日,up主“三Lu有毒”的視頻《早安,打工人!》更是加上了各種打工人優秀語錄,同時配上魔性的畫面和聲音,直接在B站爆火,目前該視頻播放量已突破913萬。

隨后“打工人”的視頻如雨后春筍般涌現,單10月27日一天就有292條視頻發布。

time_num?=?df.upload_time.value_counts().sort_index()?
time_num[:5]?
2020-09-05????1
2020-09-08????1
2020-09-09????1
2020-09-12????1
2020-09-13????1
Name:?upload_time,?dtype:?int64
#?條形圖
line1?=?Line(init_opts=opts.InitOpts(width='1350px',?height='750px'))
line1.add_xaxis(time_num.index.tolist())?
line1.add_yaxis('',?time_num.values.tolist(),?
????????????????markpoint_opts=opts.MarkPointOpts(data=[opts.MarkPointItem(type_='min'),?
????????????????????????????????????????????????????????opts.MarkPointItem(type_='max')])
???????????????)?
line1.set_global_opts(title_opts=opts.TitleOpts(title='打工人視頻發布熱度走勢圖',?pos_left='40%'),?
??????????????????????xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate='90')),
??????????????????????visualmap_opts=opts.VisualMapOpts(max_=int(time_num.max()),?is_show=False),
????????????????????)?
line1.set_series_opts(linestyle_opts=opts.LineStyleOpts(width=3),?
??????????????????????label_opts=opts.LabelOpts(is_show=False)
?????????????????????)
line1.render()?

02 不同分區的視頻發布數量

從視頻分區中可以看到,生活區以56.6%的比重占據了半壁江山。

03 不同分區的視頻發布播放量

播放量方面也是生活區一枝獨秀,累計達到1393萬。

04 最高播放的Top10視頻

那么都是哪些“打工人”視頻播放量最高呢?

我們分析整理了播放量前十的視頻,播放量第一是up主“三Lu有毒”的《早安,打工人!》,截止到發稿播放量已達到913萬。第二是up主“老摸魚藝術家”的《加油!打工人!》,截止到發稿播放量已達到357萬。

接下來我們對播放量第一第二的“打工人”視頻彈幕進行分析,看看大家都在說些什么。

05 早安,打工人!彈幕詞云

彈幕中出現最多的就是“淚目”、“工人”。其中那句魔性的“靠恁娘是河南人”,也是引起了不少彈幕。魔性的狗子,激昂的語調也是讓人聽著十分上頭,讓人忍不住每天一遍,對自己說上一聲“早安,打工人!”

06 《加油,打工人!》彈幕詞云

“加油”、“打工人”、“真實”等都是妥妥的高頻詞。配上最近常被up用來二次創造的動畫片《校園小子》,有“文藝復興”那味兒了。

07 打工人標題詞云圖

我們最后對打工人視頻出現的標題也進行了詞云整理。發現標題中除了“打工人”,“早安”、“晚安”、“加油”、“日?!钡日芰康脑~特別多,同時“快樂”、“人上人”等詞也在標題中常常出現。

結語

人人都不愛打工,但人人都是打工人。

雖然這些打工人的段子里多少帶著些對生活壓力的自嘲和調侃,而最火的那句“早安打工人”里,懷著的也還是對新一天的期望。

加油吧,打工人!


 

——熱門課程推薦:

想從事務型數據分析師,您可以點擊>>>“數據分析師”了解課程詳情;

想從事數據分析師,您可以點擊>>>“大數據就業”了解課程詳情;

想成為人工智能工程師,您可以點擊>>>“人工智能就業”了解課程詳情;

想了解Python數據分析,您可以點擊>>>“Python數據分析師”了解課程詳情;

想咨詢互聯網運營,你可以點擊>>>互聯網運營就業班”了解課程詳情;

想了解更多優質課程,請點擊>>>

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢