数模学习资料https://pan.baidu.com/s/1_pXQrFaoxZWCK1PCwT-ayA?pwd=1234
30 天数学建模基础算法学习目录(分阶段)
第一阶段:基础入门(第 1-10 天)—— 掌握经典统计与优化算法
算法 1:线性回归
核心重点:最小二乘法、损失函数(MSE)、多重共线性、正则化(L1/L2)
案例:房价预测(基于面积、卧室数等特征)
实现核心:特征归一化、模型参数求解(梯度下降 / 正规方程)
算法 2:逻辑回归
核心重点:Sigmoid 函数、对数损失、分类阈值、多分类扩展(OVR/Softmax)
案例:信用卡欺诈检测(二分类问题)
实现核心:样本不均衡处理、决策边界可视化
算法 3:K - 近邻(KNN)
核心重点:距离度量(欧氏 / 曼哈顿)、K 值选择、加权投票
案例:鸢尾花分类(多特征分类)
实现核心:特征缩放、K 值交叉验证
算法 4:决策树
核心重点:信息增益(ID3)、基尼指数(CART)、剪枝(预剪枝 / 后剪枝)
案例:员工离职预测(分类树)
实现核心:特征重要性评估、树结构可视化
算法 5:朴素贝叶斯
核心重点:贝叶斯定理、条件独立性假设、拉普拉斯平滑
案例:文本分类(垃圾邮件检测)
实现核心:文本特征提取(词袋模型)、概率计算
算法 6:支持向量机(SVM)
核心重点:最大间隔超平面、核函数(线性 / 径向基 / 多项式)、软间隔
案例:手写数字识别(图像分类)
实现核心:核函数选择、惩罚参数 C 调整
算法 7:K - 均值聚类(K-Means)
核心重点:迭代过程(分配 - 更新)、肘部法(K 值选择)、初始质心选择
案例:客户分群(RFM 模型特征)
实现核心:聚类结果可视化、 silhouette 系数评估
算法 8:层次聚类
核心重点:凝聚式 / 分裂式、距离度量(单 linkage / 全 linkage / 平均)
案例:基因表达数据聚类
实现核心:树状图绘制、聚类阈值确定
算法 9:主成分分析(PCA)
核心重点:方差最大化、特征值分解、降维后解释方差比
案例:人脸识别(高维图像降维)
实现核心:数据标准化、主成分选择
算法 10:线性规划
核心重点:目标函数、约束条件、可行域、对偶问题
案例:生产计划优化(最大化利润,约束资源限制)
实现核心:模型建立(变量 / 目标 / 约束)、 solver 选择(如 simplex 法)
第二阶段:进阶应用(第 11-20 天)—— 常用机器学习与数值方法
算法 11:随机森林
核心重点: Bootstrap 抽样、特征随机选择、袋外误差(OOB)
案例:电商销量预测(回归问题)
实现核心:树数量调整、特征重要性融合
算法 12:梯度提升树(GBDT)
核心重点:残差学习、梯度下降优化、弱学习器组合
案例:点击率预测(CTR 预估)
实现核心:学习率调整、树深度限制
算法 13:XGBoost/LightGBM
核心重点:正则化(树复杂度惩罚)、列采样、直方图优化
案例: Kaggle 竞赛入门(如泰坦尼克号生存预测)
实现核心:参数调优(eta、max_depth、subsample)
算法 14:神经网络(基础)
核心重点:神经元模型、激活函数(Sigmoid/ReLU)、反向传播
案例:手写数字识别(MLP)
实现核心:网络结构设计(输入 / 隐藏 / 输出层)、损失函数选择(交叉熵)
算法 15:时间序列分析(ARIMA)
核心重点:平稳性检验(ADF)、差分处理、参数识别(p/d/q)
案例:股票价格预测(单变量时间序列)
实现核心:数据预处理(去趋势 / 去季节)、模型定阶
算法 16:遗传算法
核心重点:选择(轮盘赌 / 锦标赛)、交叉(单点 / 多点)、变异
案例:旅行商问题(TSP)优化
实现核心:适应度函数设计、种群规模调整
算法 17:模拟退火
核心重点:Metropolis 准则、温度衰减策略、全局最优搜索
案例:函数极值优化(如 Rastrigin 函数)
实现核心:初始温度设置、迭代终止条件
算法 18:粒子群优化(PSO)
核心重点:粒子位置 / 速度更新、个体最优 / 全局最优
案例:神经网络权重优化
实现核心:惯性权重调整、学习因子设置
算法 19:支持向量回归(SVR)
核心重点:ε- insensitive 损失、核函数应用、正则化参数
案例:电力负荷预测(回归问题)
实现核心:核函数选择、ε 参数调整
算法 20:AdaBoost
核心重点:权重更新(误分类样本加权)、弱分类器加权组合
案例:欺诈行为检测(不平衡数据)
实现核心:基分类器选择、迭代次数确定
第三阶段:综合提升(第 21-30 天)—— 复杂模型与领域应用
算法 21:卷积神经网络(CNN)核心重点:卷积层(特征提取)、池化层(降维)、全连接层(分类)
案例:图像分类(CIFAR-10 数据集)
实现核心:网络结构(如 LeNet-5)、数据增强(翻转 / 裁剪)
算法 22:循环神经网络(RNN/LSTM)
核心重点:序列依赖、长短期记忆(解决梯度消失)、双向 RNN
案例:自然语言处理(文本生成)
实现核心:输入序列处理、隐藏层状态设计
算法 23:注意力机制(Transformer 基础)
核心重点:自注意力计算、多头注意力、位置编码
案例:机器翻译(简单 Seq2Seq 模型)
实现核心:注意力权重可视化、模型并行化
算法 24:强化学习(Q-Learning)
核心重点:状态 - 动作价值函数、ε- greedy 探索、贝尔曼方程
案例:迷宫路径规划(网格世界)
实现核心:奖励函数设计、Q 表更新策略
算法 25:图论算法(Dijkstra/ Floyd-Warshall)
核心重点:最短路径、贪心策略(Dijkstra)、动态规划(Floyd)
案例:交通路线优化(城市间最短路径)
实现核心:图的表示(邻接矩阵 / 列表)、算法效率对比
算法 26:排队论
核心重点:M/M/1 模型、泊松分布(到达率)、指数分布(服务时间)
案例:银行柜台服务优化(等待时间分析)
实现核心:参数估计(到达率 / 服务率)、性能指标计算(平均队列长度)
算法 27:灰色预测模型(GM (1,1))
核心重点:累加生成(AGO)、微分方程建立、残差修正
案例:能源消耗预测(小样本数据)
实现核心:数据预处理(光滑性检验)、模型精度评估(后验差比)
算法 28:马尔可夫链
核心重点:状态转移矩阵、平稳分布、无记忆性
案例:股票走势预测(状态划分:涨 / 跌 / 平)
实现核心:状态定义、转移概率估计
算法 29:模糊综合评价
核心重点:模糊集、隶属度函数、权重分配(AHP)
案例:供应商选择(多指标评价)
实现核心:指标体系建立、隶属度计算
算法 30:元胞自动机
核心重点:细胞状态、邻居规则、演化过程
案例:城市扩张模拟(CA 模型)
实现核心:规则设计(如 Conway 生命游戏)、状态可视化
学习建议:
每天任务:上午学理论(核心重点),下午做案例(实现核心),晚上总结(关键词梳理)。
工具推荐:Python(NumPy/Pandas/Scikit-learn/TensorFlow/PyTorch)、Matlab(统计与优化
工具箱)。进阶方向:第 30 天后可结合具体赛题(如国赛 / 美赛),将算法组合应用(如 “聚类 +
分类”“降维 + 回归”)。
此目录覆盖了数模常用的统计、优化、机器学习、深度学习及领域模型,适合小白从基础到
综合的逐步提升。