张芷铭的个人博客

机器学习让计算机通过数据自动学习规律解决问题,核心三要素:数据、模型、优化。

概念辨析

概念定义
机器学习通过数据学习改进性能的统称
统计学习以统计理论为基础的机器学习子集
深度学习利用深层神经网络自动学习多层级特征

$$机器学习 \supseteq 统计学习 \supset 深度学习$$

数学基础

领域核心内容应用场景
线性代数矩阵运算、SVD、张量表示模型参数优化
概率统计贝叶斯定理、概率分布、统计推断不确定性量化
优化理论梯度下降、凸优化、正则化损失函数最小化
信息论熵、交叉熵、KL散度模型评估

机器学习三要素

模型(假设空间)

分类说明
监督学习数据有标注
无监督学习数据无标注,学习内在结构
强化学习与环境交互学习最优策略
半监督学习少量标注 + 大量未标注

策略(选择准则)

  • 经验风险最小化:极大似然估计(MLE)
  • 结构风险最小化:最大后验概率估计(MAP)

正则化是结构风险最小化的实现

算法(学习方法)

模型参数优化的具体算法,如梯度下降。

核心算法

监督学习

任务算法
分类逻辑回归、决策树、随机森林、SVM
回归线性回归、Lasso、Ridge

无监督学习

任务算法
聚类K-Means、DBSCAN、层次聚类
降维PCA、t-SNE
异常检测孤立森林、GMM

深度学习

架构应用
CNN图像识别
RNN/LSTM序列建模
TransformerNLP、多模态

[[Diffusion模型 MOC]]

工程实践

数据流程

  1. 数据预处理:缺失值处理、特征编码、标准化
  2. 特征工程:特征选择、特征提取、数据增强

开发工具

框架适用场景
PyTorch研究
TensorFlow工业部署
Scikit-Learn传统算法

评估指标

任务指标
分类准确率、召回率、F1、AUC-ROC
回归MSE、MAE

学习路径

  1. 入门:数学基础 + Python 编程
  2. 进阶:经典算法实践 + 深度学习框架
  3. 高阶:NLP/CV/强化学习专项

前沿方向

  • 大模型技术(GPT-4、多模态)
  • 生成式 AI(扩散模型)
  • 联邦学习(隐私保护)
  • 交叉应用(AlphaFold、自动驾驶)

Comments