作者:禅与计算机程序设计艺术
1.简介
深度学习(Deep Learning)是一类机器学习方法,其核心是神经网络(Neural Network)。近年来,随着技术的进步,越来越多的公司、组织和研究人员开始研究深度学习。实际上,深度学习已经成为当今最火爆的计算机视觉、自然语言处理等领域的热门研究方向。从某种意义上来说,深度学习就是通过高度抽象的神经网络模型对原始数据进行学习,提取出有用的特征并应用到下游的任务中。不同于传统机器学习方法,深度学习不需要手工设计特征工程和分类规则,而是可以自动构建高维空间中的复杂函数关系。这种能力不仅让深度学习在图像识别、自然语言处理等领域获得了极大的成功,还催生了更加复杂的任务如无监督学习、强化学习等。但是由于深度学习领域的复杂性和广泛使用的需求,也存在很多潜在的问题。如何有效地选择适合自己的深度学习框架、调优超参数、解决性能瓶颈、控制内存占用、提升训练速度、减少抖动,本文将提供一些建议。
2.概览
在正式介绍之前,先简单回顾一下深度学习及其相关术语。
深度学习术语
- 深度学习:深度学习(Deep Learning)是一类机器学习方法,其核心是神经网络(Neural Network)。近年来,随着技术的进步,越来越多的公司、组织和研究人员开始研究深度学习。实际上,深度学习已经成为当今最火爆的计算机视觉、自然语言处理等领域的热门研究方向。从某种意义上来说,深度学习就是通过高度抽象的神经网络模型对原始数据进行学习,提取出有用的特征并应用到下游的任务中。不同于传统机器学习方法,深度学习不需要手工设计特征工程和分类规则,而是可以自动构建高维