高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

2019-06-26

从前两天开始，各省市关于高考成绩放榜和各批次录取分数线都陆续出炉，教育部也发布了最新的全国高等学校名单。

于是乎，所谓的野鸡大学也就无处躲藏了。

也给广大的高考生在填报志愿的时候，提供了一个参考。

当然本次不讨论这个...

最新发布的名单没有本科院校的数量，于是小F找了2018年的数据。

1243所本科院校，和本次获取到的数据「1281个」基本差不多。

下面展示一下数据。

包含了专业名称，开设此专业的院校数量，及每年的就业率，最后是每年毕业生数量。

5万多条院校开通专业的数据，涵盖11大类，582个专业，1281个本科院校。

接下来就来分析一波，先对学科进行分组。

from wordcloud import WordCloud, ImageColorGenerator

import matplotlib.pyplot as plt

import pandas as pd

import jieba

# 设置列名与数据对齐

pd.set_option('display.unicode.ambiguous_as_wide', True)

pd.set_option('display.unicode.east_asian_width', True)

# 显示15行

pd.set_option('display.max_rows', 15)

# 读取数据

df = pd.read_csv('message.csv', encoding='gbk', header=None, names=['subject', 'major', 'school'])

# 学科分类

df_subject = df.groupby('subject').count.reset_index.sort_values(by='school')

print(df_subject)

# 获取列表数据

list1, list2 = ,

for i in df_subject['subject']:

list1.append(i)

for j in df_subject['school']:

list2.append(j)

print(list1)

print(list2)

获得数据如下：

利用获取的两个列表数据进行可视化。

这里「工学」位居第一，也和当下时代的发展相契合。

传统点的就是工业4.0，智能点的就是人工智能。

无不和「工学」息息相关。

接下来对专业进行分析。

# 专业分类

df_major = df.groupby('major').count.reset_index.sort_values(by='school')

print(df_major)

# 获取列表数据

list1, list2 = ,

for i in df_major['major'][-10:]:

list1.append(i)

print(list1)

for j in df_major['school'][-10:]:

list2.append(j)

print(list2)

得到结果如下：

专业TOP10出炉，也能以供参考。

照例还是使用现成的模板，方便多了...

最终结果如下。

开设英语的本科院校达到了1001所，接近院校总数的80%了。

不过网上对英语的评价就是：英语==失业。

所以对于英语专业，需要慎重考虑。

尾随其后的是计算机科学与技术，目前的大热门。

当然是不是修电脑我就不清楚了，相信关注小F公众号的小伙伴们，都能感受到计算机的魅力。

令人失望的是，小F就读的大机械居然没上榜，惭愧呀。

想当初「机械机械，压倒一切」，真不是瞎吹的。

一入机械深似海，从此妹子是路人。

这句也不假，说多了都是泪~

下面统计院校总数，并获取校名包含学院的院校数量。

# 对学校进行分组

df_name = df.groupby('school').count.reset_index.sort_values(by='subject')

print(df_name)

# 输出包含学院的校名

print(df_name[df_name['school'].str.contains('学院')])

得到院校总数以及哪所学校的专业最多：

嗯，1281所本科院校。

其中贵州大学以164个本科专业位居榜首。

接下来看一下校名包含学院的学校有多少所。

829所，占比64.7%，那么剩下的差不多都是大学了。

学院变大学(校名)，这也是每年好多高校一直在做的事情。

毕竟一个霸气的校名，也能吸引不少考生报名。

最后生成一个校名词云图。

其中需要去掉「大学」和「学院」这两个关键词。

def create_wordcloud(df):

"""

生成校名词云

"""

# 分词

text = ''

for line in df['name']:

text += ' '.join(jieba.cut(line, cut_all=False))

text += ' '

backgroud_Image = plt.imread('school.jpg')

wc = WordCloud(

background_color='white',

mask=backgroud_Image,

font_path='C:WindowsFonts华康俪金黑W8.TTF',

max_words=1000,

max_font_size=150,

min_font_size=15,

prefer_horizontal=1,

random_state=50,

)

wc.generate_from_text(text)

img_colors = ImageColorGenerator(backgroud_Image)

wc.recolor(color_func=img_colors)

# 看看词频高的有哪些

process_word = WordCloud.process_text(wc, text)

sort = sorted(process_word.items, key=lambda e: e[1], reverse=True)

print(sort[:50])

plt.imshow(wc)

plt.axis('off')

wc.to_file("校名词云.jpg")

print('生成词云成功!')

# 去除大学

df_name = df_name['school'].str.replace('大学', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

df_name = pd.DataFrame(dict_name)

# 去除学院

df_name = df_name['name'].str.replace('学院', '')

dict_name = {'name': df_name.values, 'numbers': df_name.index}

# 生成校名词云图

create_wordcloud(df_name)

得到结果如下：

师范和科技，妥妥的扛把子。

讲了半天，最后该如何选择呢？

当然是想去哪就去哪(分数高)，冥冥之中，自有天意~

最后祝大家都能选到理想的大学和心仪的专业！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

matplotlib DataFrame pandas 人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇25道题检测你对支持向量机算法的掌握程度

下一篇大数据分析完28个省会城市后发现，存在感最低的省会城市竟是······

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

高考志愿怎么报？582个专业，1281个本科院校，你会如何选择？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少涵谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

【CDA干货】MySQL查询不包含指定列的实现方法、实操 ...

【CDA干货】Python中content属性的核心特性、实操应 ...

从零基础到数据科学家：CDA三本官方教材全解读 ...

【CDA干货】资金财务领域本体模型与业务领域模型的 ...

【CDA干货】数字经济下企业数据战略的落地实践与案 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：刘伟谈金融行业数据分析实践与转岗 ...

【CDA干货】SQL LEFT JOIN查询耗时过长的成因分析与 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】产品生命周期理论及经典案例应用分析 ...

【CDA干货】数据透视表数据批量对应匹配其他工作表 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载