Google DeepMind首席执行官哈萨比斯称:“阿尔法狗Zero通过三天的围棋自学就以100:0的比分完胜对阵李世石的‘阿尔法狗Lee’,经过21天的学习就超越了以3:0战胜柯杰九段的‘阿尔法狗Master’。”
阿尔法狗之前通过人类旗手的棋谱进行训练,学习如何下围棋。去年以4:1打败李世石九段的阿尔法狗Lee,利用七个月的时间学习了16万件棋谱。但是阿尔法狗Zero与之前的版本不同,只掌握了围棋基本规则,并无其他任何信息的输入。即在没有输入人类棋谱数据的情况下,通过下围棋的过程自动生成了大数据。
◇使用100年前的心理学技巧
- ▲ 一颗围棋棋子就是一个宇宙。围棋的走法共有10的170次方种可能性,超过宇宙原子总数。
韩国电子通讯研究院(ETRI)高级研究员李京远表示:“阿尔法狗Zero的优势是会用强化学习。”强化学习是人类或动物大脑的实际运作方式。
世界著名脑科学家、美国耶鲁大学医学教授李大烈表示:“强化学习是100年前出现的心理学概念,但是最近在脑科学领域运用十分活跃,脑科学的研究成果直接对人工智能开发产生积极影响。”
◇或成为人类难题的突破口
专家们期待阿尔法狗Zero增大人工智能运用幅度。例如,向阿尔法狗Zero输入首尔市人口分布和业务空间数据,在没有任何其他相关数据的情况下,也能绘制出与当前完全不同的、高效的地铁及公交路线图。还能对无人驾驶车运行提供安全保障,目前靠人类无法计算出其在运行过程当中出现事故的所有情况,但是通过阿尔法狗Zero可以预测所有可能性,包括目前从未出现的情况。
阿尔法狗Zero也存在局限性。韩国科学技术计划评价院车斗元研究院表示:“目前人们无法明确解释阿尔法狗Zero算出的每一种走法,所以运用到实际生活,将有可能出现一些副作用。”