熱線電話:13121318867

登錄
首頁精彩閱讀高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?
高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?
2019-06-26
收藏
高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

從前兩天開始,各省市關于高考成績放榜和各批次錄取分數線都陸續出爐,教育部也發布了最新的全國高等學校名單。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

于是乎,所謂的野雞大學也就無處躲藏了。

也給廣大的高考生在填報志愿的時候,提供了一個參考。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

當然本次不討論這個...

最新發布的名單沒有本科院校的數量,于是小F找了2018年的數據。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

1243所本科院校,和本次獲取到的數據「1281個」基本差不多。

下面展示一下數據。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

包含了專業名稱,開設此專業的院校數量,及每年的就業率,最后是每年畢業生數量。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

5萬多條院校開通專業的數據,涵蓋11大類,582個專業,1281個本科院校。

接下來就來分析一波,先對學科進行分組。

from wordcloud import WordCloud, ImageColorGenerator

import matplotlib.pyplot as plt

import pandas as pd

import jieba

# 設置列名與數據對齊

pd.set_option('display.unicode.ambiguous_as_wide', True)

pd.set_option('display.unicode.east_asian_width', True)

# 顯示15行

pd.set_option('display.max_rows', 15)

# 讀取數據

df = pd.read_csv('message.csv', encoding='gbk', header=None, names=['subject', 'major', 'school'])

# 學科分類

df_subject = df.groupby('subject').count.reset_index.sort_values(by='school')

print(df_subject)

# 獲取列表數據

list1, list2 = ,

for i in df_subject['subject']:

list1.append(i)

for j in df_subject['school']:

list2.append(j)

print(list1)

print(list2)

獲得數據如下:

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

利用獲取的兩個列表數據進行可視化。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

這里「工學」位居第一,也和當下時代的發展相契合。

傳統點的就是工業4.0,智能點的就是人工智能。

無不和「工學」息息相關。

接下來對專業進行分析。

# 專業分類

df_major = df.groupby('major').count.reset_index.sort_values(by='school')

print(df_major)

# 獲取列表數據

list1, list2 = ,

for i in df_major['major'][-10:]:

list1.append(i)

print(list1)

for j in df_major['school'][-10:]:

list2.append(j)

print(list2)

得到結果如下:

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

專業TOP10出爐,也能以供參考。

照例還是使用現成的模板,方便多了...

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

最終結果如下。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

開設英語的本科院校達到了1001所,接近院??倲档?0%了。

不過網上對英語的評價就是:英語==失業。

所以對于英語專業,需要慎重考慮。

尾隨其后的是計算機科學與技術,目前的大熱門。

當然是不是修電腦我就不清楚了,相信關注小F公眾號的小伙伴們,都能感受到計算機的魅力。

令人失望的是,小F就讀的大機械居然沒上榜,慚愧呀。

想當初「機械機械,壓倒一切」,真不是瞎吹的。

一入機械深似海,從此妹子是路人。

這句也不假,說多了都是淚~

下面統計院??倲?,并獲取校名包含學院的院校數量。

# 對學校進行分組

df_name = df.groupby('school').count.reset_index.sort_values(by='subject')

print(df_name)

# 輸出包含學院的校名

print(df_name[df_name['school'].str.contains('學院')])

得到院??倲狄约澳乃鶎W校的專業最多:

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

嗯,1281所本科院校。

其中貴州大學以164個本科專業位居榜首。

接下來看一下校名包含學院的學校有多少所。

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

829所,占比64.7%,那么剩下的差不多都是大學了。

學院變大學(校名),這也是每年好多高校一直在做的事情。

畢竟一個霸氣的校名,也能吸引不少考生報名。

最后生成一個校名詞云圖。

其中需要去掉「大學」和「學院」這兩個關鍵詞。

def create_wordcloud(df):

"""

生成校名詞云

"""

# 分詞

text = ''

for line in df['name']:

text += ' '.join(jieba.cut(line, cut_all=False))

text += ' '

backgroud_Image = plt.imread('school.jpg')

wc = WordCloud(

background_color='white',

mask=backgroud_Image,

font_path='C:WindowsFonts華康儷金黑W8.TTF',

max_words=1000,

max_font_size=150,

min_font_size=15,

prefer_horizontal=1,

random_state=50,

)

wc.generate_from_text(text)

img_colors = ImageColorGenerator(backgroud_Image)

wc.recolor(color_func=img_colors)

# 看看詞頻高的有哪些

process_word = WordCloud.process_text(wc, text)

sort = sorted(process_word.items, key=lambda e: e[1], reverse=True)

print(sort[:50])

plt.imshow(wc)

plt.axis('off')

wc.to_file("校名詞云.jpg")

print('生成詞云成功!')

# 去除大學

df_name = df_name['school'].str.replace('大學', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

df_name = pd.DataFrame(dict_name)

# 去除學院

df_name = df_name['name'].str.replace('學院', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

# 生成校名詞云圖

create_wordcloud(df_name)

得到結果如下:

高考志愿怎么報?582個專業,1281個本科院校,你會如何選擇?

師范和科技,妥妥的扛把子。

講了半天,最后該如何選擇呢?

當然是想去哪就去哪(分數高),冥冥之中,自有天意~

最后祝大家都能選到理想的大學和心儀的專業!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢