2019过去了，AI 离我们还有多远？ | AI|行业新闻|新闻动态

新闻动态

2019过去了，AI 离我们还有多远？

2020-01-08

撰文丨魏薇

2019年最后两周，围棋届“不败少年”李世石举行告别赛，最后的对手他再次选择了AI。

对弈的是韩国人工智能程序“韩豆”，三番棋大战，李世石以1胜2负的结局，结束了24年7个月的职业棋手生涯。

结果毫无波澜，不到4年时间，人类已接受现实，围棋不是AI的对手。李世石日后最值得骄傲的战绩，可能不是多少个冠军，而是与AlphaGo的大战中贡献“神之一手”，赢了一局——目前人类对阵AlphaGo收获的唯一一局胜利，鉴于后者的进化速度，大概率也是最后一局。

那场大战向世人布道了AI。之前，AI虽有语音合成等离散应用，并没有进入大众视野，AI更多是科幻电影的遐想，严肃讨论多限于学术圈。AlphaGo的胜利，吹响了AI进军的号角，一度是各种公司发布会的热词。

2019年，AI已经不再是一个时髦词，百度指数“人工智能”的词条，过去90天的总趋势大体是一条水平线，就像默认人类下围棋会输给AI一样，人们已习惯AI规模化地渗透到日常生活，只不过，要花更多精力严肃回应AI的挑战。

刷脸与假脸

2019年，北京标志性的两大项目——大兴机场和京张高铁相继运营，作为张扬新工程技术含量的标识，官方新闻稿中，频繁提到刷脸安检或者刷脸进站。

这些功能早已不再局限于大项目的点缀。2019年春运，北京站所有通道即已实现“刷脸进站”。

2019年8月，铁路上海局发布消息，宣布年内将在17个客运站增设104台“刷脸进站”设备，设备增至580台，覆盖范围扩大至40座城市、65个车站，不只是大站，新沂、海宁、昆山等县级普速客站，都能享受到这种便利。

人脸识别一度只在银行等场景出现，毕竟与钱相关。2019年后已广泛出现在车站、酒店等公共场所，稍微时髦一点的商店，连支付都可刷脸。

每刷脸一回，都会调取一次数据。9月，百度首次向外公开人脸识别公有云服务调用量，这个头部平台的调取规模达到日均1亿次！即便计入刷脸失败重复的次数，一天至少服务数千万人次。

公开数据显示，身份验证API由于涉及到公安部数据源调取成本，每次调取价格为0.6元，而人像处理API月调用量只要超过3000万次，调用价格每次不足0.002元，按照后一种处理，即便像洗脸一样一天刷两次，全年也不到1块钱。

尤其值得欣慰的是，AI在视觉的应用带来不少温暖。以2016年启动的“百度AI寻人”为例，求助者只需上传走失亲人照片，即可一键与全国各地救助站及各公益寻人平台登记的走失人员进行实时比对，目前，“百度AI寻人”已帮助超过9700位走失者回家与亲人团聚。

不过，AI已不再满足于刷脸。

9月的一个周末，一款工具“ZAO”迅速风行，用户可将自己的脸换到别人的脸上，很多人借此过了一把“明星”瘾，出现在各种经典的场景中。

但是由于涉及肖像权、隐私风险和版权纠纷，APP上线三天即被封杀。25年前，电影《阿甘正传》将汤姆·汉克斯的形象合成到纪录片，实现与肯尼迪等多位总统“会面”，相似的工作却花了数百万美金。

ZAO在国内近乎娱乐话题，而在美国，用AI技术生成的假脸（通称DeepFake）则已成为严肃的政治议题，甚至引起军事机构的注意。

2019年5月，艺术家Bill Posters做了一个马克·扎克伯格的DeepFake视频，在合成视频中，“扎克伯格”说：“试想一下：一个人完全控制着数十亿人被盗的数据，掌握着他们所有的秘密、生活和未来……它让我明白，谁控制了数据，谁就控制了未来。”

马克·扎克伯格的DeepFake视频

这个“扎克伯格”，跟本人几乎没有差别，能眨眼，会做手势，口型和画外音高度吻合。4个月后，Facebook宣布启动一项“DeepFake视频检测挑战赛”，豪掷1000万美元，悬赏谁能最有效地检测出利用DeepFake技术制造的假视频。

许多人发出严厉质问：如果DeepFake任其泛滥，如何区分真相和假新闻？而且还可能产生借此左右民意而影响政治的运作，比如，推动弹劾特朗普的众议院议长南希·佩洛西（Nancy Pelosi）就因DeepFake，被人恶搞一把，在一段伪造的视频中，其言语含混，形如醉酒。

美国国防部旗下的DARPA（美国国防部高级研究计划局），已在2018将研发AI反变脸刑侦工具列入其专项计划，以期将现有刑侦检测工具变得自动化，以AI技术检测涌现的AI假脸。

据说，一个诀窍是观察眼睛的状态，由于多使用睁眼的照片进行训练，DeepFake的视频一般极少甚至不会眨眼，即便有眨眼模式，也会太快或过于频繁。

林志玲与骚扰电话

2019年6月，台湾女星林志玲宣布结婚，许多粉丝调侃，要卸载高德地图，或者将导航声音换成郭德纲的。

科学地说，所谓林志玲、郭德纲的声音，纯为“幻音”，不过是语音合成的产物，AI可以合成任何人的声音。

百度地图在2019年就推出一项代号为“百雀灵”的语音定制功能，只要在百度地图App上录制20句话，等待15分钟左右，即可生成有自己声音特色的个性化语音包。

3个月内，已有超百万用户定制了自己专属语音包，其中包括150多名明星、主播和网红。

基于自然语言理解和合成技术，AI能分析处理人类语言，了解人类的意图并能与人沟通，对答如流，大量语音服务的场景，正逐步过渡到AI服务。

比如，浦发银行和百度在2019年联合发布的智能客服项目，拥有超过150个全语音菜单导航项和800多个知识库问答，全部由AI提供客服语音服务，可承担相当于现有客服团队1/3的工作量。

双方联合开发出业内首款不需要交互界面的语音APP，完全辨“声”识人，准确率达90%。

在电话销售和客服行业，AI技术已能覆盖大部分工作，提升传统工作人员的效率。一批企业以AI语义分析技术为核心，面向企业提供SaaS化的外呼、呼入处理系统，效率大幅提升。

稍有缺憾的是，由于AI能理解和回答的多基于原始语料和数据，不能有问必答。例如，当客户偏离业务场景聊起家常，AI往往不知所措，答非所问，客户即能判断出电话那头不是真人。

不过，AI正在提炼话术模板，迅速进阶。2018年谷歌的I/O大会，打电话AI Duplex一经亮相就技惊四座，在电话预约领域，据称已通过图灵测试。

2019年的I/O大会，谷歌CEO专门披露，AI Duplex一年内已在全美40多州商用，究竟来电的是不是人，即将真假莫辨。

硬币的一个反面是，骚扰电话这类语音应用的成本大幅下降。

2019年的央视315，曝光了陕西一家名为“易龙芯科”的公司，利用智能机器人一天打出能4万个骚扰电话。

这并不奇怪，在一些外呼公司的介绍材料上，一个AI语音机器人每天能拨打3000通左右，不只是比业务员打电话快很多，且一天费用仅需32.9元，相当于骚扰一次的语音成本只要1分钱！

大量骚扰来电，究竟是真人还是机器人，用户已不好分辨。

短暂的交谈后，先进的AI能通过语音语调大致推测客户的性别、年龄甚至是部分心情和健康状况信息，理解对答语句内容后能掌握用户回答的更多信息，并分析出性格和用词习惯等，再与测谎等技术结合，就能侧写出真实有效的用户画像。

AI环境下频发的电话骚扰，已引起业界关注。

2019年4月末，三大运营商罕见联合，推送了一条相似的短信内容：“根据国家有关规定，未经用户同意，任何组织和个人不得擅自向用户拨打商业营销电话。为维护用户合法权益，我们将对涉嫌营销扰民的电话号码进行依法处置。”

能预见的是，这将是一场持久战。

中美国民与智能音箱

2018年，YouTube最受欢迎、播放量最高的十大广告榜单，名列第一的是亚马逊人工智能音箱Alexa，其制作的超级碗广告“Alexa Loses Her Voice”，当年的点击量超过5000万次。

为推广其智能语音Alexa，2019年亚马逊又请来Harrison Ford(哈里森·福特)，Forest Whitaker(福里斯特·惠特克)等诸多明星。

新广告的一个段子是，狗狗用的智能项圈，狗狗一叫唤，智能语音就自动下单，结果哈里森·福特不得不为一车的狗粮买单。

2014年，亚马逊推出Echo，智能音箱的出货量开始激增，光在2019年三季度，亚马逊就卖出了1040万台。据预测，最迟到2020年四季度，拥有智能音箱的美国成年人数量将突破1个亿，很多人还不只拥有一台。

虽然多数用户能够借助语音助手完成相对有限的任务，比如音乐、查看天气、设置计时器和提醒。但是，他们在购买越来越多与支付产品相关的技能。

有乐观预测，到2021年，单是设备销售、有偿技能以及广告、语音购物或交易等其他领域的结合，亚马逊Alexa的年营收最高可能达190亿美元。

2019年，智能音箱在中国同样爆发了。

根据国际第三方数据机构Strategy Analytics的报告，2019年第三季度全球智能音箱出货量同比增长55%，达到3490万台，三家中国公司的出货量达到1150万台，占据全球1/3的份额，且增速远高于亚马逊和谷歌。

其中百度的业绩尤为突出，旗下“小度”音箱当季出货量达430万台，同比增长130%，不只是绝对量位列国内第一、国际前三，增速更在全球主流厂商中遥遥领先。

迅猛的增长，得益于AI智能水平的大幅跃升。

据中国科学院发布的《智能音箱的智能技术解析及其成熟度测评》报告显示，市面上主力的智能音箱产品“听清率”均超过96%，语音技术已到较高水平，其中，小度对用户指令的“听懂率”超过90%，用户10条指令，AI基于自然语言理解已能听懂9条。

现在智能音箱，不再是起初单纯为蓝牙音箱加个语音助手而已，主力厂商秀的均是AI技术实力。

例如，小米音箱搭载了回声消除技术（AEC），通话更清晰；天猫精灵推出“语音语义一体化技术”，将下一轮文本识别语义理解的错误率降低了58.5%；小度的“全双工免唤醒能力”，则能“一次唤醒，多轮交互”，且在与他人对话的同时互不干扰实现人机交互。

AI技术的升级，在2019年催生了大量突破性产品，例如小度在家智能屏X8，具备包括眼神唤醒、手势控制以及远场语音交互等功能在内的多模态交互，以及“儿童模式”、“童脸识别”等更加贴近实际场景的应用。

因交互的多元性、全面的信息展示与服务提供，带屏的智能音箱在中国格外受欢迎，2019年第三季度，光百度一家的出货量就达230万台。

智能音箱日益成为国民级的电子消费品，广告也越来越多。就像亚马逊在超级碗一掷千金，国内头部智能音箱玩家纷纷增加预算，增强品牌影响力。2019年，“小度”就相继登台春晚、亮相综艺、联名故宫、横扫跨年晚会，实现品牌认知的全民触达。

其实，不只是智能音箱，AI在其他设备也在加速渗透。截至6月，单是搭载“小度助手”（DuerOS）的智能设备激活数量已突破4亿台，这个数字在2018年11月只有1.5亿，以此计算，2019年每天有超过100万台设备激活“小度助手”，其语音交互超过36亿次，AI正在快速进入各类生活场景。

人们在享受智能设备带来的便利性和交互性的同时，AI也成为一把双刃剑，带来信息安全的隐忧。

2019年4月，亚马逊Echo、谷歌Home、苹果Homepod等设备，被曝出可能记录用户语音的可能；11月，两名研究人员成功入侵亚马逊最新款的智能音箱。

最近，谷歌又禁止小米所有智能家居产品访问其AI控制集成中枢Nest Hub和谷歌AI语音助手Assistant，这是因为有用户发现，小米一台摄像头集成Nest Hub之后，意外看到了他人家庭中的景象。

就和汽车普及带来车祸一样，这些都是AI遭遇的现实挑战。

2019年，AI领域学术权威Yann LeCun 在 Twitter 提问：要是当初知道卷积神经网络 (CNN) 会催生 DeepFake，我们还要不要发表 CNN？（CNN是深度学习技术的代表算法之一）

LeCun最后的结论是，即便没有开源，CNN （或类似的东西)）还是会被其他人发明出来。“每个新生出来的人都可能造谣、传播流言并影响其他人，那我们是不是别生孩子了？”他如此回应因DeepFake引发的对AI的批评。

天才棋手的李世石输给AlphaGo后，在归隐之际并未回避人机大战，而在对弈中找到新的乐趣。2019年，AI向日常生活渗透的趋势已不可阻挡，思考如何与AI共处，实现科技向善，增进社会福祉，是新的“20”世代必须重视的课题。

来源: 21世纪商业评论

上一篇: 工业4.0时代的崛起——皓丽会议平板的7大未来场景

下一篇: 2020年，AI领域怎么投？