如何评价DeepMind发表在Nature上的AlphaGo Zero?
我个人观点,人工智能的发展肯定会给人类的世界带来翻天覆地的变化,人工智能也是人类科技的发展史上一个新的里程碑,人工智能未来的趋势是势不可挡的,谁也无法阻止人工智能科技的发展。
科技界的有关人士尽管有各种说法,好的坏的等等,各种危言耸听,说人工智能的发展会给人类带来毁灭性的灾难等等吧,我觉得这种说的说的太过于片面了,如果说先进的科技会毁灭人类,那么现在的核电站,***,战斗力等各种先进的科技都可以毁灭人类,为什么还要使用这些科技呢,毁灭人类的不是科技,而是使用贪婪的人类,科技是一把利剑,他自己不会刺向人类,只有手握它的人才能控制它。
人是大自然的产物,是宇宙的产物,科技是人的产物,科技在先进也不可能超过它的创造者的,就像人类无法超越宇宙
今天有两只GO快要改变世界了,老GO被新GO的智能碾压,完成了从“快速学习”到“无师自通”的革命性转换。
对,就是大谷歌的“新狗”AlphaGo Zero的水平已经超过之前所有版本的AlphaGo。在对阵曾赢下韩国棋手李世石那版AlphaGo时,AlphaGo Zero取得了100:0的压倒性战绩。
2017年5月,以3:0的***赢下中国棋手柯洁后,AlphaGo宣布退役,但DeepMind公司并没有停下研究的脚步。伦敦当地时间10月18日,DeepMind团队公布了最强版AlphaGo ,代号AlphaGo Zero。它的独门秘籍,是“自学成才”。而且,是从一张白纸开始,零基础学习,在短短3天内,成为顶级高手。
一年多前,AlphaGo便是2016年1月28日当期的封面文章,Deepmind公司发表重磅论文,介绍了这个击败欧洲围棋冠军樊麾的人工智能程序。
AlphaGo Zero的神经网络通过新的自我对弈数据进行训练,在每个位置s,神经网络fθ都会进行蒙特卡洛树(MCTS)搜索,得出每一步落子的概率π。这一落子概率通常优于原始的落子概率向量p,在自我博弈过程中,程序通过基于蒙特卡洛树的策略来选择下一步,并使用获胜者z作为价值样本,这一过程可被视为一个强有力的评估策略操作。在这一过程中,神经网络参数不断更新,落子概率和价值 (p,v)= fθ(s)也越来越接近改善后的搜索概率和自我对弈胜者 (π, z),这些新的参数也会被用于下一次的自我对弈迭代以增强搜索的结果。
AlphaGo Zero的突破使得我们在未来面对人类面对的一些重大挑战(如蛋白质折叠、减少能源消耗、寻找革命性的新材料等)充满信心。众所周知,深度学习需要大量的数据,而在很多情况下,获得大量人类数据的成本过于高昂,甚至根本难以获得。如果将该技术应用到其他问题上,将会有可能对我们的生活产生根本性的影响。
对于知识有二种观点,1)知识是传承的,新知识是旧知识积累而获得的,2)知识是否定的,否定旧知识才是创新的前提,造再多的马车发明不了汽车,汽车是由完全不懂马车的机械工程师应用新科技发明的,学再多的因式分解发明不了微积分,否则便否定了牛顿的伟大,显然阿尔法支持2)阿尔法1受人类经验的局险,遵人理,如同中医。阿尔法2直接从原理出发,遵天理,如同西医,直接以最前沿的理论与实验科学为基础。显然,我们死背死记知识是阿尔法坚决反对的,结果也表明从一开始就不会成功