机器学习第六讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列
资料取自《零基础学机器学习》。
查看总目录:学习大纲
关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南
一、生活化比喻:数据世界的乐高积木 🧱
比喻场景1:
假设学校图书馆有三种数据记录方式:
二、Excel表格转化演示 💻(教材第六章经典案例2)
例:3月电子产品销售表
产品 | 销量 | 单价(元) |
---|---|---|
手机 | 120 | 2999 |
耳机 | 85 | 599 |
充电宝 | 200 | 129 |
转化为矩阵表示:
数学表示:
M = [ 120 2999 85 599 200 129 ] M = \begin{bmatrix} 120 & 2999 \\ 85 & 599 \\ 200 & 129 \\ \end{bmatrix} M=
120852002999599129
三、核心运算规则解析 ⚡️
- 加法运算:要求同维度矩阵
- 标量乘法:数乘每个元素
# 如数据整体涨价10%
价格矩阵 = [[2999],[599],[129]]
新价格 = 1.1 * 价格矩阵 # [[3298.9],[658.9],[141.9]]
- 矩阵乘法:行乘列的奇妙规则3
四、数据科学中的现实价值 📊
数据形态 | 向量/矩阵形式 | 应用场景 |
---|---|---|
学生成绩单 | 行向量 | 班级平均分计算 |
医院化验报告 | 列向量 | 健康指标趋势分析 |
电商用户画像 | 用户×商品矩阵 | 推荐系统构建 |
城市交通流量 | 时间×路口流量矩阵 | 智能信号灯控制 |
五、图像处理的魔法揭秘 🖼️
原理:
每个图片本质上都是像素值矩阵,例如:
代码示例(教材第六章代码片段4):
import numpy as np
# 创建100x100像素的红色方块矩阵
red_block = np.ones((100,100)) * 255
green_block = np.zeros((100,100))
blue_block = np.zeros((100,100))
六、易犯错误警示牌 🚨(注意事项5)
- 尺寸错误:试图相加3×2和2×3矩阵
- 空值污染:Excel中的N/A未处理直接运算
原始数据:[120, null, 200]
错误计算:sum = 120 + null + 200 → NaN
- 内存爆炸:处理100万×100万维度的超大型矩阵时需要先做数据分块
七、核心要义总结 💎
向量与矩阵是用数学语言精确描述多维数据的基础工具,如同建筑的砖瓦构成数据科学大厦(教材第六章核心结论1)
(典型案例:Netflix用户-影片评分矩阵是推荐算法的关键输入数据🎬)
目录:总目录
上篇文章:机器学习第五讲:强化学习 → 电子宠物狗试错学习,做对给虚拟奖励
下篇文章:机器学习第七讲:概率统计 → 预测可能性,下雨概率70%就是典型应用
《零基础学机器学习》第六章第一节"数据矩阵表达",P.265 ↩︎ ↩︎
《零基础学机器学习》第六章案例6-2"零售数据转化",P.278-280 ↩︎
《零基础学机器学习》第六章运算规则推导,P.289-293 ↩︎
《零基础学机器学习》第六章代码附录,P.317 ↩︎
《零基础学机器学习》第六章注意事项,P.308 ↩︎