一、导数的定义与核心思想
1. 通俗解释
导数就像“数学放大镜”,用来观察函数在某一点瞬间的变化快慢。比如:
- 汽车仪表盘显示的瞬时车速(不是平均车速)
- 股票分时图的瞬间涨跌速度
2. 数学定义
对于函数 y = f(x),在点 x₀ 处的导数定义为:
f'(x₀) = lim(Δx→0) [f(x₀ + Δx) - f(x₀)] / Δx
关键点:
- Δx 是微小的变化量(如0.0001秒)
- 极限表示“无限逼近”真实变化率
3. 几何意义
导数 = 函数图像在该点的切线斜率
二、AI与量化中的实际应用
1. AI中的应用
神经网络训练(梯度下降)
- 场景:调整参数让误差最小化
- 用到的导数知识:误差函数对参数的导数(即梯度)
- 举例:
损失函数L(w) = (w·x - y)^2 的导数
def gradient(w, x, y):
return 2 * (w * x - y) * x # 这里用到了幂函数求导法则
自动驾驶(运动预测)
- 场景:通过车辆位置数据计算瞬时速度
- 用到的导数知识:位移对时间的导数
2. 量化金融中的应用
期权定价(希腊字母)
- 场景:计算期权价格对股价的敏感度(Delta)
- 用到的导数知识:价格函数对股价的导数
- 公式:Delta = ∂(期权价格)/∂(股价)
风险控制(波动率计算)
- 场景:通过价格变动速度预测风险
- 用到的导数知识:收益率序列的导数(即加速度)
三、必须掌握的求导公式
函数类型 | 求导公式 | 应用场景举例 |
---|---|---|
常数函数 | C' = 0 | 固定收益产品的利率变化 |
幂函数 | (x^n)' = n*x^(n-1) | 神经网络中的权重更新 |
指数函数 | (e^x)' = e^x | 复利计算/人口增长模型 |
对数函数 | (lnx)' = 1/x | 信息熵计算(决策树算法) |
四、新手常见误区
混淆"可导"与"连续"
- 反例:f(x) = |x| 在 x=0 处连续但不可导
- AI中的体现:ReLU激活函数在0点的特殊处理
忽略定义域
- 错误案例:对 ln(x) 在 x ≤ 0 时求导
机械套用公式
- 典型错误:(e^(2x))' 忘记链式法则(正确答案是 2e^(2x))
单侧导数与可导条件详解
一、单侧导数的定义
左导数
函数f(x)在点x₀处的左导数定义为:
f'₋(x₀) = lim(Δx→0⁻) [f(x₀ + Δx) - f(x₀)] / Δx
(Δx从负方向趋近于0)右导数
函数f(x)在点x₀处的右导数定义为:
f'₊(x₀) = lim(Δx→0⁺) [f(x₀ + Δx) - f(x₀)] / Δx
(Δx从正方向趋近于0)
二、可导的充要条件
函数f(x)在x₀处可导 ⇔ 同时满足:
- 左导数f'₋(x₀)存在
- 右导数f'₊(x₀)存在
- f'₋(x₀) = f'₊(x₀)
三、典型案例分析
**绝对值函数f(x) = |x|**
- 在x=0处:
- 左导数f'₋(0) = lim(Δx→0⁻) [|Δx| - 0]/Δx = -1
- 右导数f'₊(0) = lim(Δx→0⁺) [|Δx| - 0]/Δx = +1
- 结论:在x=0处不可导(左右导数不相等)
- 在x=0处:
分段函数示例
f(x) = { x² (x ≤ 1)
{ 2x-1 (x > 1)- 在x=1处:
- 左导数f'₋(1) = 2
- 右导数f'₊(1) = 2
- 结论:在x=1处可导(左右导数相等)
- 在x=1处:
四、应用场景
AI中的ReLU激活函数
f(x) = max(0,x)- 在x=0处:
- 右导数=1
- 左导数=0
- 处理方式:在反向传播时默认取右导数
- 在x=0处:
量化金融中的价格跳空
- 当价格出现跳空缺口时:
- 左导数(缺口前最后一刻的价格变化率)
- 右导数(缺口后第一刻的价格变化率)
- 交易策略:当左右导数差异超过阈值时触发风控
- 当价格出现跳空缺口时:
五、重要结论
- 可导必连续,连续不一定可导
- 尖点(如|x|的顶点)一定不可导
- 分段函数在分段点必须单独验证可导性
六、验证方法
- 先检查函数在该点是否连续
- 分别计算左右导数
- 比较两者是否相等