跳转至

深度学习

Abstract

深度学习(Deep Learning)是机器学习的一个重要分支,核心是使用多层神经网络从数据中自动学习特征表示。

overview

相比传统机器学习更依赖人工特征工程,深度学习更强调让模型在数据中自行学习表示:底层网络先捕捉边缘、局部模式等基础特征,随着层数加深,逐步组合成更抽象、更接近任务语义的高层表示。


核心概念

深度学习通常围绕以下几个部分展开:

  • 神经网络:由神经元、层、权重、偏置和激活函数组成
  • 前向传播:输入数据经过网络计算,得到预测结果
  • 损失函数:衡量预测结果和真实标签之间的差距
  • 反向传播:根据损失计算梯度,并更新模型参数
  • 优化算法:如 SGD、Adam,用于逐步降低损失
  • 正则化:如 Dropout、数据增强,用于缓解过拟合

主要模型

模型 重点 常见场景
神经网络 深度学习基础结构、激活函数、训练流程 分类、回归、特征学习
CNN 卷积、局部连接、权重共享 图像识别、目标检测、视觉任务
RNN 序列建模、时间展开、LSTM、GRU 文本、语音、时间序列
Transformer Attention、并行序列建模、Encoder-Decoder 机器翻译、语言模型、多模态模型