上世纪50年代末,人工智能理论初步形成后,曾引发一系列乐观情绪和全球热潮。但由于技术、算法、数据都未能形成突破性进展,AI未能达到预期效果,热潮一落千丈。2016年3月,谷歌AlphaGo战胜韩国九段顶尖中国围棋选手李世石,人类第一次看到人工智能可能取得的伟大成就,人工智能浪潮再次兴起,专家认为,更多资源和关注的投入,将使得智能革命加速到来。
AI发展离不开大数据
新一轮AI的火热,业内人士认为主要归功于三点:一是海量的数据提供了燃料;二是运算力的提升让原本巨量的运算量变成可能;三是深度学习算法突破了人工智能算法的瓶颈。其中,尤以深度学习算法的突破最让人振奋。
人工智能的本质是以电脑模拟人脑。人脑通过神经元处理信息,所谓深度学习,即搭建多层的人工神经网络,然后输入大数据进行训练、学习,使AI可以模拟人脑处理信息。近年来,深度学习领域的突破可使AI在一些关键能力上媲美甚至赶超人类,但距离实现“通用人工智能”,即更稳健、更具解释性以及更具通用性的技术的出现,还很远。
有专业人士指出,研究人员仍面临着各种问题,如缺乏足够的数据来训练深度学习系统;无法制造同时处理多项任务的人工智能;不知道如何让一些系统运转起来等等。中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃说,围棋是“完备信息”问题,也就是说决策时所有的信息都是可见的,对于有规则可循的运算,机器比人强是正常的。一切规则清晰的游戏,计算机永远都要赢过人类。但哪怕是规则稍作改变,情况就大不一样。
AlphaGo需要学习数量庞大的棋局才可以掌握有效的下棋技巧,而冷扑大师目前的对战形式也是一对一,而现实生活中德扑是多人游戏,多人游戏在计算上的复杂程度是目前冷扑大师所无法胜任的。因此,针对人工智能技术的商业化问题,也备受关注。创新工场CEO李开复先生曾表示,人工智能发挥商业价值,仍需要满足三个条件:海量的数据、数据有标注、单领域。例如在金融领域,金融是虚拟的、由人创造的,数据量庞大且天生带有标注,譬如股票的涨停、小额贷款是否还钱、买了保险后是否出事都是一种标注,这使得AI在放贷、银行、投资、保险方面具有潜力。
众所周知,人工智能是建立在海量数据基础之上,通过大数据训练,来优化算法模型,以人脸识别技术为例,训练这一算法模型需要至少百万级别的图片数据。目前,人工智能主要是监督式学习,有监督的训练就需要带标签的数据,因此数据的质量和精准度与输出结果密切相关。现在,已经有出现一些专业的数据标注公司,专注剔除数据中的噪音、垃圾信息,获取优质且带有标签的数据。有专业人士指出,未来人工智能公司成功的关键,在大数据和云计算。
另一大挑战在于深度学习的推广和场景迁移能力不足,每个领域的数据都需要重新收集、标准和再训练,很难进行跨领域推广。这些挑战也是人工智能工业界和学术界急需突破的问题。而一个不争的事实是,目前国内在人工智能领域的人才比较匮乏,如懂得迁移学习;增强学习或者思辨能力的人很少。百度作为人工智能领域的领军者,卓越成绩的取得,离不开重金吸纳的全球范围内的优秀人才,因此,吴恩达的离职被人们看作是百度人工智能的重大损失。
在实际应用层面,人工智能仍有很长的路要走。李开复在冷扑大师对战“中国龙之队”比赛结束后表示:“人工智能已从完美信息的AlphaGo,延伸到了不完美信息的冷扑大师,人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了,以后更应该关注商业领域的人工智能,在金融、医疗、教育等领域产生的商业价值。
巨头争相布局AI制高点
目前,处在风口之中的人工智能,已成为各家巨头战略进军目标,更是下一代科技革命的发动机,而走在行业前沿的,都有一个共同特点,大多是互联网或者计算机领域的佼佼者,积累了大量数据,如Google、Facebook、Microsoft、Amazon、英特尔、百度、阿里巴巴和腾讯等。数据是这些企业得天独厚的资源。让我们来看一看这些企业在AI跑马圈地过程中的重要战略举措。
英特尔
英特尔新成立了一个人工智能产品事业部,整合了公司的人工智能力量,并由Nervana前CEO纳维恩•饶(Naveen Rao)领导。新部门是一种聚焦。它将整合公司的资源,包括工程、实验室、软件等等,打造领先的AI产品组合:英特尔Nervana平台,一个客户需要的软硬结合的AI产品。
英特尔将创建一个应用型的AI研究实验室,致力于推动计算的前沿。并且将探索新的架构和算法方法,以推动未来AI的发展。这包括了从数据中心到边缘设备,从训练到推理的一系列解决方案,所有这些都旨在使英特尔及其客户更快地创新。这也将是英特尔的AI创新之源。
阿里巴巴
3月9日,阿里巴巴召开首届技术大会,会议透露阿里巴巴正在启动一项代号“NASA”的计划,面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技。
马云表示,阿里巴巴未来20年的愿景是构建世界第五大经济体,服务全球20亿消费者,创造1亿就业机会,帮助1000万家企业盈利。就像美国航空航天局NASA驱动人类科技和生活的极大进步,新经济体必须建在新的技术基础设施之上,建立在新的技术思考之上。
他还一步阐释:“一个服务20亿人的经济体,需要强大的技术实力。我们将建立阿里巴巴的’NASA’,以担当未来的责任。面向机器学习、芯片、IoT、操作系统、生物识别这些核心技术,我们将组建崭新的团队,建立新的机制和方法,全力以赴。
“我希望,对一些技术趋势的判断,阿里巴巴要有自己的哲学思考。”马云指出,阿里巴巴的“NASA”,必须围绕新经济体的三大使命展开技术思考:让世界更加普惠(Inclusive)、让机会更加均等;让世界经济发展更加可持续(Sustainable);让未来生活更加健康快乐(Happy&Healthy)。最近人工智能很火,那么更应该把机器智能(Machine intelligence)做好。机器应该是帮助人类做人类做不到的事情。我们要让机器成为人最好的助手,而不是剥夺人类的乐趣,甚至成为人类最大的对手。
腾讯
1月6日,腾讯研究院年会上,腾讯集团副总裁、人工智能实验室负责人姚星细解读了腾讯在人工智能方面的战略规划:
1.腾讯有自己的AI部门,目前有30多个科学家,90%以上的人都是博士学历以上,来自哈佛、麻省理工、哥伦比亚大学等高校。
2.腾讯在AI上面的考虑主要基于四个垂直领域:专注机器学习、自然语言处理、语音识别和计算机视觉四个方向的基础研究。
具体来说,在计算机视觉领域,除了传统的图像处理,腾讯还会引入AR,也会引入空间定位技术;语音识别会引入自动翻译方面的一些技术;自然语言处理,除了人的认知行为的一些研究,还会做对聊天机器人这类的应用做一些研究。
3.未来腾讯的人工智能服务将紧密围绕内容、社交、游戏三个核心应用场景展开,并将人工智能工具以API形式开放出去,推动行业健康发展。
3月23日,腾讯宣布任命人工智能领域顶尖科学家张潼博士担任腾讯AI Lab(腾讯人工智能实验室)主任。加入腾讯前,张潼博士曾经担任美国新泽西州立大学教授、IBM研究院研究员、雅虎研究院主任研究员,百度研究院副院长和大数据实验室负责人。
百度
3月2日上午消息,中国深度学习技术及应用国家工程实验室正式揭牌,该实验室由国家发改委批复,百度牵头筹建。这是首个国字号背景的深度学习实验室,百度董事长李彦宏还将此称为“人工智能国家队”。
4月12日,百度云和NVIDIA共同发布了国内第一个公有云上基于虚拟化的托管集群——百度云深度学习平台,旨在让ABC(人工智能AI、大数据Big Data、云计算Cloud Computing)时代下企业和开发者快速获取AI能力。
百度云深度学习平台是以NVIDIA最新深度学习平台 NVIDIA® Tesla® P40 GPU 加速器以及NVIDIA 深度学习软件为依托的云服务,是国内第一个公有云上基于虚拟化的托管集群,支持分钟级建立、释放集群,实现GPU资源完全按需使用。
有专业人士预测,在人工智能领域,中国可能成为与美国比肩领跑者,国内互联网公司成为人工智能的核心推动力。海量数据是我们的优势,而应用深化则是企业业务发展的迫切需求,也将在另一角度推动人工智能发展。而优秀人才稀缺,将是一个长期存在的问题。