张芷铭的个人博客

监督学习、无监督学习、强化学习

监督学习(Supervised Learning)

监督学习是利用标记数据训练模型的方法。目标是从输入数据中学习到映射函数,预测输出标签。常见算法包括线性回归、逻辑回归、决策树、支持向量机(SVM)等。

无监督学习(Unsupervised Learning)

无监督学习不依赖标记数据,而是从未标记的数据中发现潜在结构。目标是数据的聚类或降维。常见算法包括K均值(K-means)、主成分分析(PCA)等。

强化学习(Reinforcement Learning)

强化学习通过与环境互动学习决策策略。目标是通过奖励和惩罚机制,最大化累积奖励。常见算法包括Q学习(Q-Learning)、深度Q网络(DQN)等。

这些方法分别应用于不同类型的问题和场景,在机器学习领域中各有重要作用。

💬 评论