提示:本文章所属专栏主要教会大家如何用matlab进行机器学习,属于机器学习入门,原理较少,实操较多,想短时间内应用机器学习解题的可入
前言
网上大多有关机器学习的教程与文章中较少有关matlab的一般是python那些,这边主要介绍如何应用matlab进行机器学习。以及用机器学习解数模赛题的一般步骤。
一、matlab机器学习内容
本专栏主要介绍如何用机器学习解决分类问题。对于回归问题,之后有时间会出。专栏内容主要为以下我做的思维导图为主:
(手机可能看不清,建议用电脑)
二、matlab机器学习步骤
1.数据预处理
1.样本数据并非都对分类结果有结果,例如2022数模国赛玻璃样品编号就对分类结果无影响,应当剔除。
2.处理异常值,异常值可能会影响分类结果
3.处理缺失值
4.数据可视化
2.选择合适的模型
导入数据,用matlab的机器学习工具箱训练所有模型,这边提示一下,机器学习不是一个模型,而是一个模型的集合,常见的有决策树,KNN,SVM等,训练完后,选择准确率较高的几个模型进行调参,调参需要导出代码,加入几个循环语句,每一个模型都有它的最佳参数,有它的最佳准确率,但是准确率并非是评价模型好坏的唯一标准,还有诸如F1分数,ROC曲线等具体选择哪一个指标依样本情况而定,这边只是粗略概括,具体见以后文章。
3.预测分类结果
导入待分类样品的数据,用训练好的模型对其预测,获得分类结果
三 、注意事项
matlab机器学习需要高版本的才能够支持,建议下2020a以上版本,老版本可能没有集成学习的功能,集成学习主要是由决策树改进而得。