AI技术创新突破瓶颈
从技术创新角度来看,我国具有广阔的前景。
2014年9月,中国科学院院士施一公在“欧美同学会·中国留学人员联谊会第三届年会”上关于我国的创新人才培养,做了一次发人深省的演讲。
他说:如今我们的GDP已经全球第二,但是技术革新和基础研究的创新能力,作为一个国家我们排在20名开外。我不知道在座的哪一位可以心安理得地面对这个数字。我们有14亿人,我们号称勤劳、勇敢、智慧,我们号称重视教育、重视科技、重视人才。我们改革开放三十多年,还可以找各种各样的理由,我们还是刚刚起步,但无论怎样,我希望大家能有这样的意识,就是我们的科技实力、创新能力、科技质量在世界上排在20名开外。
这并不是悲观主义。相反,施一公说自己对未来很乐观,他在演讲中强调,他每天都在鼓励自己:我们的国家很有前途。现在无论是在政治领域,还是在教育领域,深层次的思考和变革真正地开始了。
技术层面变革的大潮是什么?自然要说正在迈向技术奇点的人工智能。
现在一说起人工智能的起源,公认是1966年的达特茅斯会议。殊不知此前还有一个小小的前戏:1955年,美国西部计算机联合大会(Western Joint Computer Conference)在洛杉矶召开,会中还套了个小会“学习机讨论会”(Sessionon Learning Machine)。在与会者中有两位参加了第二年的达特茅斯会议,他们是塞弗里奇(Oliver Selfridge)和纽厄尔(Allen Newell)。
塞弗里奇发表了一篇模式识别的文章,而纽厄尔则探讨了计算机下棋,他们分别代表两派观点。讨论会的主持人是神经网络的鼻祖之一皮茨(Pitts),他最后总结时说:“(一派人)企图模拟神经系统,而纽厄尔则企图模拟心智(Mind)……但殊途同归”。皮茨预示了人工智能随后几十年关于“结构与功能”两条路线的“斗争”。
麦卡锡给达特茅斯会议起了一个当时看来别出心裁的名字:“人工智能夏季研讨会”(Summer Research Projecton Artificial Intelligence)。
普遍的误解是“人工智能”这个词是麦卡锡想出来的,其实不是。
麦卡锡晚年回忆也承认这个词最早是从别人那里听来的,但记不清是谁。后来英国数学家菲利普·伍德华(Woodward)给《新科学家》杂志写信说他是AI一词的创始人,麦卡锡最早是听他说的,因为他在1956年曾去MIT交流,见过麦卡锡。但麦卡锡的建议书在1955年就开始用“人工智能”这个词了,当事人除明斯基之外,都已仙逝,这事恐怕要成悬案了。
到现在为止,人工智能已经经历了三个技术创新阶段。
第一阶段,在20世纪50年代,神经网络相关基础理论的提出奠定了里程碑。第二阶段,20世纪80年代初,算法应用升级,将人工智能推向新的高峰。第三阶段,2006年深度学习相关技术崛起。深度学习(深度神经网络)基本理论框架得到了验证,伴随着芯片算力和数据的突破,人工智能开启了新一轮的繁荣。2010年率先在语音、自然语言处理领域突破,2012年又在计算机视觉领域异军突起。
人工智能每一个发展阶段的递进,都伴随着前沿技术的逐步突破。计算能力、算法和数据是促成人工智能第三次热潮爆发的三个原因。
在计算能力方面,从通用芯片CPU(中央处理器)到有强大并行计算能力的GPU(图形处理器),再到可编程的芯片FPGA(现场可编程门阵列)、ASIC(专用集成电路),针对AI具体应用而设计的芯片使得数据和模型训练效率大大提升。
在算法方面,自从2006年Hinton等人提出深度学习的概念,恰逢其时地满足了移动互联网时代对大量数据、图像的识别需求。由于人工智能技术立足于神经网络,同时发展出多层神经网络,在深度机器学习上有先天优势,因此在目前人工智能发展中起到核心作用。与传统的算法相比,这个算法并无多余的假设前提(比如线性建模需要假设数据之间的线性关系),而是完全利用输入的数据自行模拟和构建相应的模型结构。这个算法的特点决定了它是更为灵活的且可以根据不同的训练数据而拥有自优化的能力。
在数据方面,深度学习这个算法带来了庞大的运算量。在计算机运算能力取得突破以前,这样的算法几乎没有实际应用的价值。大概十几年前,我们尝试用神经网络运算一组并不海量的数据,整整等待三天都不一定会有结果。但今天的情况却大大不同了。IDC报告显示,预计到2020年全球数据总量将超过40ZB(相当于4万亿GB),这个数据量是2011年的22倍。在过去几年,全球的数据量以每年58%的速度增长,在未来这个速度会更快。
在计算能力、算法和大数据这三项均达到增长临界点时,人工智能的关键技术突破就变得水到渠成。
机器学习最典型的应用是数据挖掘,亚马逊、京东等主流电商的推荐系统已经做得相当完善,用户可以通过网站的推荐便捷地购买到需要的产品。AlphaGo可以说是机器学习的典范,其在2016年3月的首次人机大战中声名鹊起,焦点在于它在一个人类独有的高精尖思维领域超越了人类,后来AlphaGo 2.0跟世界排名第一的柯洁人机大战,更是引发了全世界对深度学习、自主学习算法的关注。在深度学习、神经网络算法和模型训练下,机器学习的精度和准确度越来越接近真实。
2012年以后,人工智能又在计算机视觉领域异军突起。在人类认识和了解世界的信息中,70%以上来自视觉,计算机视觉同样成为机器认知世界的基础。以人脸识别、指纹识别、瞳孔识别为代表的生物特征识别领域,技术成熟度和工业化程度高,广泛应用于安防和考勤。
2017年春运,我国多个铁路大站通过“刷脸”检票,准确率高达99.6%,单人次通过时间控制在3~6秒,大大提高了春运检票的效率和便捷性。
另外,随着人工智能应用的迅速增长,人工智能的计算力平台越来越受关注。相对于数据中心与云计算的模式,嵌入式人工智能设备对高性能计算的要求也越来越急迫。目前,各个芯片巨头都在接连发布AI芯片产品,并且为各个应用场景定制深度学习计算框架的创业公司也如雨后春笋般悄悄林立。比如,专用于自动驾驶汽车的芯片、处理监控视频的交通安防领域计算平台等。另外,智能家居、智能机器人、无人机、智能硬件的AI芯片的需求也日益扩大。
AI产业走到了一个高位区
大规模的创新创业正在酝酿。
从1996年我国第一家人工智能企业未来机器人在上海成立后,我国人工智能产业萌芽,进入了长达7年的蛰伏期。在这个时期,每年成立的人工智能企业只有两三家,面临着无人投资的资本寒冬。
2003—2008年,我国AI产业出现了第一个“春天”,受到美国AI初创企业高速增长的影响,我国的一些创业者瞄准这个新领域发力,这段时间,年均成立企业不超过十家。虽然企业稀少,但是一些前瞻意识较强的投资方开始试水,2001年成立的小i机器人在2005年获得IDG资本投资2040万元,打响了我国企业获投的第一炮。
2008年以后,我国人工智能企业进入快速增长阶段,涨幅最高超过100%,并在2015年达到峰值。虽然增势在2015年后回落,但是按照产业发展规律来看,这个趋势是产业发展的必然。
现在,我国正处于AI产业发展高位区。首先,从融资上来分析,企业融资从2013年开始激增,截至2017年6月,我国累积融资超过600亿元,2016年非但不显颓势,反而更加强劲,企业获投率达到惊人的69.13%,远超互联网行业。其次,BAT等科技巨头纷纷为AI产业布局,争先发布开源平台助力企业发展。2016年,百度开放了其深度学习平台PaddlePaddle,覆盖了搜索、图像、语音识别、语义处理、用户画像等领域的技术。腾讯在不同领域展开AI研究,其中腾讯AI Lab注重将技术与腾讯业务场景相结合,即游戏、社交、内容生态。阿里巴巴主要围绕自身的电商业务进行布局。BAT试图通过开源来构建AI生态和护城河,完善AI产业生态。
国务院颁布的《新一代人工智能发展规划》提出了2030年发展目标,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。来自政府的强大动力,将会成为AI产业发展的支柱。