深度学习
Abstract
深度学习(Deep Learning)是机器学习的一个重要分支,核心是使用多层神经网络从数据中自动学习特征表示。

相比传统机器学习更依赖人工特征工程,深度学习更强调让模型在数据中自行学习表示:底层网络先捕捉边缘、局部模式等基础特征,随着层数加深,逐步组合成更抽象、更接近任务语义的高层表示。
核心概念
深度学习通常围绕以下几个部分展开:
- 神经网络:由神经元、层、权重、偏置和激活函数组成
- 前向传播:输入数据经过网络计算,得到预测结果
- 损失函数:衡量预测结果和真实标签之间的差距
- 反向传播:根据损失计算梯度,并更新模型参数
- 优化算法:如 SGD、Adam,用于逐步降低损失
- 正则化:如 Dropout、数据增强,用于缓解过拟合
主要模型
| 模型 | 重点 | 常见场景 |
|---|---|---|
| 神经网络 | 深度学习基础结构、激活函数、训练流程 | 分类、回归、特征学习 |
| CNN | 卷积、局部连接、权重共享 | 图像识别、目标检测、视觉任务 |
| RNN | 序列建模、时间展开、LSTM、GRU | 文本、语音、时间序列 |
| Transformer | Attention、并行序列建模、Encoder-Decoder | 机器翻译、语言模型、多模态模型 |