强化学习(RL)。
时间:2022-03-07 02:33:01 | 来源:行业动态
时间:2022-03-07 02:33:01 来源:行业动态
该项技术兴起不过数年,却算得上是近些年人类最重要的技术突破之一。2016年战胜李世石的 AlphaGo 背后就是该技术发挥作用。
强化学习原理不难理解,就是一种驯兽师机制,也可以理解为「巴浦洛夫的狗」原理。
以小鸡啄纸为例:
如果我们想训练一只鸡啄粉色纸片,那么,每当它啄到粉色纸片时,就奖励给食物。
经过一番训练后,这只鸡就一直能正确找到粉色纸片了。