张芷铭的个人博客

📅 0001-01-01

三种学习范式对比

类型	数据特点	目标	常见算法
监督学习	有标签数据	学习映射函数预测输出	线性回归、SVM、决策树
无监督学习	无标签数据	发现数据潜在结构	K-means、PCA
强化学习	环境交互	最大化累积奖励	Q-Learning、DQN

监督学习

利用标记数据训练模型，学习输入到输出的映射函数。

无监督学习

从无标记数据中发现潜在结构，用于聚类或降维。

强化学习

通过与环境互动学习决策策略，通过奖励惩罚机制优化。

Comments