【65 Pandas+Pyecharts | 山东省2025年高考志愿投档数据分析可视化】

发布于:2025-07-29 ⋅ 阅读:(33) ⋅ 点赞:(0)

大家好,我是 👉【Python当打之年(点击跳转)】

本期将利用Python分析山东省教育考试院发布的「山东省2025年普通类常规批第1次志愿投档情况表、2025年山东高考成绩一分一段表」,看看:2025年山东高考各选科考生成绩分布,双一流/非双一流高校投档数,双一流/非双一流高校投档数最多的专业,山东考生在全国各地区投档数,各办学类型投档数等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

山东省2025高考批次线:

图片

涉及到的库:

  • Pandas— 数据处理
  • Pyecharts— 数据可视化

🏳️‍🌈 1. 导入模块

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df0 = pd.read_excel('./2025年山东高考成绩一分一段表.xls')

图片

df1 = pd.read_excel('./山东省2025年普通类常规批第1次志愿投档情况表.xlsx')

图片

2.2 数据信息

df0.info()

图片

df.info()

图片

2.3 一分一段数据处理

df0.loc[0] = df0.loc[0].fillna(method = 'ffill')
df0.iloc[:,0] = df0.iloc[:,0].fillna('')
df0.columns = df0.loc[0] + df0.loc[1]
df0 = df0[2:]

2.4 投档情况数据处理

df['院校标签'] = df['院校标签'].fillna('无')

🏳️‍🌈 3. Pyecharts数据可视化

3.1 2025年山东高考各选科考生成绩分布

def get_p1():
    L1 = (
        Line()
        .add_xaxis(x_data)
        .add_yaxis("所有考生本段人数",y_data1,symbol_size=0.5,)
        .set_series_opts(
            areastyle_opts=opts.AreaStyleOpts(opacity=1, color=colors[0]),
            label_opts=opts.LabelOpts(is_show=False),
            markarea_opts=opts.MarkAreaOpts(
                data=[
                    opts.MarkAreaItem(
                        name="一段线", x=x_line,y=(0,y_data1.max()*0.8),
                        label_opts=opts.LabelOpts(color=colors[1]),
                        itemstyle_opts=opts.ItemStyleOpts(color=colors[1])
                    )
                ]
            )
        )
        .set_global_opts(
            legend_opts=opts.LegendOpts(is_show=False),
            tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
            title_opts=opts.TitleOpts(title="所有考生总分分布",pos_bottom="92%",pos_left="center",
                                      title_textstyle_opts=opts.TextStyleOpts(color=colors[2], font_size=18),
            ),
            xaxis_opts=opts.AxisOpts(min_=df2['分数段'].min(),
                                    axislabel_opts=opts.LabelOpts(font_size=12, color=colors[3]),
                                    axisline_opts=opts.AxisLineOpts(
                                         is_show=False,linestyle_opts=opts.LineStyleOpts(width=2, color=colors[3]))
                                    ),
            yaxis_opts=opts.AxisOpts(
                axislabel_opts=opts.LabelOpts(font_size=12, color=colors[3]),
                axisline_opts=opts.AxisLineOpts(
                    is_show=False,
                    linestyle_opts=opts.LineStyleOpts(width=2, color=colors[3])
                ),
            ),
        )
    )

图片

  • 所有考生的成绩基本呈正太分布,本科线附近考生数量基本靠近最大值。
  • 理科(物理/化学/生物)考生的成绩分布与所有考生的成绩分布基本一致。

3.2 双一流高校投档数

图片

  • 投档数前10高校:吉林大学(105)、新疆大学(76)、石河子大学(76)、太原理工大学(72)、内蒙古大学(67)、海南大学(66)、青海大学(64)、湘潭大学(63)、西南交通大学(62)、云南大学(60)。

3.3 双一流高校投档数最多的专业

def get_p3():
    bar = (
        Bar()
        .add_dataset(source=data_dict[::-1])
        .add_yaxis(
            series_name="",
            y_axis=[],
            dataset_index=0,
            encode={"x": "投档计划数", "y": "院校名称"},
        )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='3-双一流高校投档数最多的专业',
                subtitle=subtitle,
                pos_left='center',pos_top='1%',
                title_textstyle_opts=opts.TextStyleOpts(color=title_color, font_size=18)
            ),
            legend_opts=opts.LegendOpts(pos_left="center",pos_top='2.5%'), 
        )
    )

图片

  • 投档数前10高校专业:哈尔滨工业大学(威海)(工科试验班:
    482)、山东大学威海分校(电子信息类:400)、山东大学(计算机类:288)、中国石油大学(华东)(软件工程:82)、中国农业大学(市场营销:81)、大连理工大学(电子信息类:78)、清华大学(理科试验班:72)、中国海洋大学(法学:63)、上海交通大学(工科试验班类:63)、天津大学(工科试验班:60)。

3.4 非双一流高校投档数TOP150

图片

  • 投档数前10高校:济南大学(136)、青岛大学(121)、青岛科技大学(97)、山东理工大学(94)、山东科技大学(91)、山东建筑大学(91)、临沂大学(90)、聊城大学(84)、山东农业大学(83)、齐鲁工业大学(83)。

3.5 非双一流高校投档数最多的专业

图片

  • 投档数前10高校专业:山东政法学院(法学:875)、山东第一医科大学(临床医学:685)、山东第二医科大学(临床医学:507)、滨州医学院(临床医学:459)、济宁医学院(临床医学:385)、齐鲁工业大学(工商管理类:300)、山东财经大学(会计学:300)、山东师范大学(中国语言文学类:285)、青岛大学(临床医学:275)、曲阜师范大学(化学:259)。

3.6 山东考生在全国各地区投档数

def get_p6():
    chart = (
        Map()
        .add('', data, 'china',is_map_symbol_show=False, label_opts=opts.LabelOpts(is_show=False))
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='6-山东考生在全国各地区投档数',
                subtitle=subtitle,
                pos_left='center',pos_top='1%',
                title_textstyle_opts=opts.TextStyleOpts(color=title_color, font_size=24)
            ),
            legend_opts=opts.LegendOpts(pos_left="center",pos_top='2.5%'),
            visualmap_opts=opts.VisualMapOpts(
                range_color=range_color,
            ),
        )
    )

图片

  • 东部沿海地区:像江苏、浙江、广东等经济发达的东部沿海省份,高校资源丰富、经济发展水平高、就业机会多,吸引了较多山东考生投档。
  • 中部地区:河南、湖北等中部省份高校数量较多,且距离山东相对较近,交通便利,是山东考生选择的热门地区之一。
  • 西部地区:西部省份除新疆地区外,其他地区投档数相对较少,与西部地区高校资源相对较少、经济发展水平相对较低、距离山东较远等因素有关。

3.7 各办学类型投档数

图片

3.8 专业名称投档计划数词云

defget_p8():
    chart = (
        WordCloud()
        .add('',words,word_size_range=[5,40])
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='8-专业名称投档计划数词云',
                subtitle=subtitle,
                pos_left='center',pos_top='1%',
                title_textstyle_opts=opts.TextStyleOpts(color=title_color, font_size=24)
            ),
            legend_opts=opts.LegendOpts(is_show=False),
            visualmap_opts=opts.VisualMapOpts(
                range_color=range_color,
            ),
        )
    )

图片

  • 投档数前10高校:山东理工大学、青岛理工大学、青岛农业大学、临沂大学、青岛科技大学、齐鲁工业大学、山东科技大学、烟台大学、山东建筑大学、曲阜师范大学。

3.9 专业名称投档计划数词云

图片

  • 投档数前10专业:计算机科学与技术、法学、英语、电气工程及其自动化、汉语言文学 会计学、机械设计制造及其自动化、临床医学、软件工程、数据科学与大数据技术。

🏳️‍🌈 4. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。


网站公告

今日签到

点亮在社区的每一天
去签到