能否介绍一下强化学习(Reinforcement Learning),以及与监督学习的不同?
关注者
2,432被浏览
679,545登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
个人理解,强化学习是没有谁告诉你下一步该怎么走,要自己摸索,每一个动作对应一个奖赏,最后得到一个奖赏最大的方式进行数据处理。而监督学习是有数据和标签,通过反向传播算法的反馈来调节参数,直到误差最小
个人理解,强化学习是没有谁告诉你下一步该怎么走,要自己摸索,每一个动作对应一个奖赏,最后得到一个奖赏最大的方式进行数据处理。而监督学习是有数据和标签,通过反向传播算法的反馈来调节参数,直到误差最小