能否介绍一下强化学习(Reinforcement Learning),以及与监督学习的不同?

随着 DeepMind 和 AlphaGo 的成功,强化学习(Reinforcement Learning)日益受到关注。然而,在一些机器学习入门课程…
关注者
2,432
被浏览
679,545
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

个人理解,强化学习是没有谁告诉你下一步该怎么走,要自己摸索,每一个动作对应一个奖赏,最后得到一个奖赏最大的方式进行数据处理。而监督学习是有数据和标签,通过反向传播算法的反馈来调节参数,直到误差最小