搜狗汪仔搭车人工智能 技术场景和生态决定能走多远

来源:中国网2017-02-10 10:58:28

\

当人工智能被认定为产业洗牌的战略级窗口时,插一脚自然成了每一家企业的想法。新年刚过,搜狗的问答机器人汪仔就登上了江苏卫视2017年《一站到底》的节目舞台,与选手丰莉婷一决高低,最终取得了胜利。对此,搜狗大书特书,在微信朋友圈里广泛传播这一事件,在普通公众眼里,搜狗貌似一下子闯进了国内人工智能领导者的阵营,一副舍我其谁的面孔。

但在人工智能行业一片喧嚣,越来越多的企业“搭车”人工智能概念时,同样是贴着人工智能的标签,可能水平参差不齐。在乱花渐欲迷人眼的环境下,我们更应该保持清醒态度,厘清概念,分清真伪。

4000万“身价”的汪仔含金量不高

按照搜狗与王小川的说辞,亮相《一站到底》舞台的汪仔身价4000万元,是基于人工智能技术研发的问答机器人,历时9个月研发,集合了搜狗、清华大学天工智能计算研究院等顶尖技术团队,还搭载了搜狗自主研发的立知问答系统,能听能说,还会思考和判断,超越了人工智能的识别、计算层面。确实,听起来很高大上,对外行的公众来说保持了足够的神秘感,但对人工智能的专家和内行来说,汪仔这个问答机器人可能就不灵了。

这一点从汪仔获胜后市场上的反馈就能看出来,其实,不少人对搜狗大肆宣扬的问答机器人早就颇有微词,认为在技术含金量上掺水了。

一种说法认为,搜狗的问答机器人汪仔披的是人工智能的外套,对外宣称使用了语义分析、问题理解、信息抽取、知识图谱、深度学习、知识计算等众多技术,但本质上就是知识搜索,做一个不太恰当的比喻,汪仔更像是一个题库、知识库的搜索工具,只要后台的知识库足够丰富、庞大,就能轻松应付各种问题,而且抢答速度超过人类是必然的,毕竟人脑的记忆力、算力是比不过机器的。如果说具备一定技术含金量的话,在语音识别、自然语言处理上确实需要具备一些人工智能的能力,但这一点都不稀奇,与科大讯飞在语音、图像识别领域的高手比,这算是炒剩饭。

而且搜索本身就是一个问答系统,用户在搜索框里输入一个关键词或一句话,后台系统进行理解、分析、检索、匹配,最终给出用户准确的答案。这是搜索引擎多年来一直在努力的方向,无论是应用场景,还是技术突破上,都谈不上多大的颠覆性。从苹果Siri到GoogleNow,再到微软的Cortana,用自然语言提问并获取答案的方式,一直是人工智能较为普遍的低阶应用。而遍及各个行业的智能客服问答机器人更是如此,仅仅是知识搜索的“变种”而已。

凑热闹的多,技术和算法是王冠上的明珠

当前的人工智能领域,表面上看起来百家争鸣、群雄逐鹿,但实质上凑热闹的多。纵观全球范围内顶级的人工智能学术、应用会议,最早仅有百度、腾讯、华为、阿里等巨头与微软、谷歌、Facebook、IBM同台竞技,但随着人工智能越来越火爆,猎豹、美图、滴滴、今日头条、小i机器人等国内的二线互联网企业也开始刷存在感,频频染指人工智能领域,并在公开场合露面和讲道。

但实际上,同样吆喝的是人工智能的技术和应用,差距相当大。其中核心的深度学习技术、算法才是人工智能王冠上的明珠,而大多数企业在核心技术上缺乏积累与突破,多数是在边缘技术上的敲锣边的行为。

那么,近一年来不断在人工智能领域“制造”眼球效应的搜狗,又价值几何呢?用一位行内人的话讲,在人工智能领域,搜狗本来就是一个迟到者,在人工智能关键的深度学习、自然语言处理、图像识别等领域的积淀并不深。

可以从两点得出这一结论,一是在技术研发投入上,搜狗拿出来说事的4000万元投入、9个月的闷头研发,放在人工智能领域,几乎可以忽略不计。对比的话,谷歌在这一领域投入数百亿元,一口气收购了11家人工智能公司,包括关注度较高的DeepMind公司;科大讯飞虽说不是人工智能领域的大哥大,但在语音识别、语音合成领域干了18年,技术投入上更是累计投入达到数十亿元,多年来一直包揽国际语音合成大赛的冠军;二是在人工智能的顶尖人才储备上,众所周知,人工智能是典型的拼顶尖科学家、专家的战争,谷歌、Facebook、微软等包揽了全球顶尖专家,可谓是人才济济。而搜狗能拿得出手的似乎只有王小川一人,还得分身,频频在公众娱乐节目中刷脸。

对于人工智能这样足以颠覆世界的技术来说,半路出家的搜狗想在技术上“偷懒”,走“借势传播”的捷径,恐怕很难行得通。不管是年前的机器翻译技术引发的广泛吐槽,还是《一站到底》中被推到前台的智能问答机器人汪仔,做秀、表演一番很容易,但最终能不能跑赢马拉松,技术实力是一个无论如何都绕不开的硬指标。虽然这种蹭热点、搭车的营销打法值得借鉴,但真到了节骨眼上,恐怕还必须要拿技术、体验来说话。

决战人工智能,场景、生态决定能走多远

不过,技术过关只是拿到了进入人工智能战场的通行证,到底能不能获得大规模的应用,发展庞大的用户体量,并实现商业价值的最大化,还有另外更举足轻重的因子。如果说技术实力决定企业在人工智能领域的高度的话,那么,应用场景和产业生态的强弱则决定了在人工智能的道路上能走多远,舞台有多大。

目前提及较多的人工智能的应用场景包括围棋竞技、人脸识别、知识问答、机器翻译等,比如谷歌的AlphaGo、Master与人类的围棋较量,背后基于深度学习技术,通过建立、模拟人脑进行分析学习的神经网络技术,不断训练,增强理解和判断能力,最终战胜了人脑;而人们熟知的人脸识别应用,涉及卷积神经网络技术,需要持续学习来进行图像分割,对色彩、轮廓、边缘进行认知,是人工智能金字塔塔尖的前沿技术;而搜狗的汪仔则是知识问答的应用,科大讯飞的机器翻译、同传属于语音识别、合成。

无论技术高低,长期看的话,这些都仅仅是人工智能应用的一个小片段或场景。放在人工智能会成为各行各业“标配”的前提下看待当前的人工智能产业,只迈出了万里长征的第一步,看到的仅仅是冰山一角。而且随着人工智能发展到后半段的话,场景的多寡和生态的健全与否可能决定了终场的成败。

对比一下会发现,搜狗的问答机器人汪仔依然停留在搜索和知识问答的场景上,过去是输入关键词或一句话,反馈给用户准确的结果。问答机器人相当于把输入文字换做了语音交互方式,仍然未脱离开信息、知识搜索的范畴。相比,谷歌人工智能应用涉足搜索、围棋竞技、无人驾驶、机器翻译、生活服务等诸多场景,科大讯飞的超脑等人工智能技术成果已经应用在教育、医疗、客服、车载等领域,微软、Facebook、亚马逊等也将人工智能与自身业务紧密绑定,覆盖更多的场景。

除了场景外,产业生态的协同能力同样不可小觑,为什么说在人工智能大战的较量中,平台或生态型的巨头胜出的几率更大,就是这个道理。任何单一产品或应用,不具备上下游的协同效应,更没有开放、覆盖完善的生态体系的支持,在人工智能的马拉松长跑中,很容易掉队,或被挤出赛道。相反,生态型的企业则能实现后半段“超车”,后来居上。

所以说,是不是具备足够多元的场景覆盖和业务协同效应,这一点在人工智能的后半段竞争中,会变得越来越关键。像谷歌、微软等全球性的巨头家大业大,走的是平台和生态的路线。而搜狗只有输入法和搜索,业务布局较窄,应用形态单一,缺乏后续延伸的空间。即使是同级别的科大讯飞,在语音识别、语音合成领域浸淫十多年,走技术开放的生态路线,可能也比搜狗的机会更大一些。