在美国,亚马逊主要作为一个电商和云计算厂商为大家所熟知。这种印象最近两年因为一款智能音箱Echo的横空出世,得到了极大的改观,大家发现:原来亚马逊也很擅长制造智能硬件。 那么,亚马逊的智能音箱的发展历程是怎样的?它又是怎样进行战略布局的呢?让我们从简单回顾亚马逊的硬件研发道路开始说起。 本文摘抄自徐飞博士在极客时间开设的专栏《技术与商业案例解读》,完整版请点击阅读原文订阅专栏后获取。 从Kindle到FirePhone:亚马逊的硬件路 在做智能音箱前,亚马逊已经做了很久的硬件,其中最有名的两个产品是Kindle电子阅读器和手机FirePhone。但是,Kindle的销售非常成功,FirePhone却彻头彻尾地失败了。 亚马逊开始卖电子书的这段经历,让它积累了运营数字产品的经验,并进一步将业务延伸到了音乐、视频、游戏等各大领域。和苹果一样,亚马逊成为了很早就积累到丰富数字产品运营经验的少数互联网公司。 和Kindle比起来,作为亚马逊最高调发售,又走高端市场的FirePhone,其销售情况可谓一塌糊涂,根本没人理睬,亚马逊之后不得不非常狠地打折清仓。在亚马逊的整个发展史上,如此惨败,无疑是第一次,也是目前为止唯一的一次。 为什么亚马逊会惨败呢?其实亚马逊的领导力准则给了我们答案。 亚马逊领导力准则里面强调客户至尚,而这款手机的研发,无论从价格还是功能上,没有一个地方体现出这条领导力准则:价格昂贵,动态3D华而不实。Firefly功能则是为了更好地让用户在亚马逊网站上进行消费,云端浏览器则是赤裸裸地搜集用户信息。当亚马逊自己都不遵循自己的领导力准则时,一个产品的惨败就是必然了。 这次惨败,让亚马逊的硬件研发团队、神秘的Lab126受到了重创。亚马逊的硬件研发和销售也因为FirePhone的惨败有了质的变化,整个手机的产品线,和当时一直在进行的一款和虚拟现实相关的产品都被叫停了。亚马逊内部对这次惨败也进行了深刻的反思。 而这个时候,一个2011年就开始的研发项目,原本因为一再为手机让路而不断降低优先级,却迎来了一个历史性的契机。这个项目就是后来赫赫有名的那只音箱Echo。 开始智能音箱的战斗:Echo攻城略地 大约在FirePhone失败半年之后,智能音箱Echo定型,亚马逊决定发布它。其发布非常低调,仅仅是就逐步给它的Prime会员推送信息,告诉他们可以购买这款音箱尝试一下。当时,音箱的库存量也很小,然而,Echo却给亚马逊带来了意外之喜,一炮而红。 2015年,亚马逊总共卖出了超过250万只音箱,到2016年这个规模又翻了一番,达到了500万只。在短短两年的时间里,Echo智能音箱把市面上入门级的专业音箱打得落花流水,各种品牌被统统扫地出门。 智能音箱Echo的崛起有很多值得我们学习和思考的地方: 首先,最初这款音箱能否成功,其实亚马逊自己也不是太清楚。所以小范围内试水是一个保险的做法,如果行得通就继续加量,如果行不通就可以及时止损。万一失败,亚马逊也不会因为生产过多而导致成本失控。 其次,在发现这款音箱很畅销之后,亚马逊对市场的反应速度和能力都令人敬佩。亚马逊意识到开放的音箱生态系统是音箱得以发展的基础以后,就果断开放了第三方技能平台,允许音箱接入第三方音乐提供商。这种做法正符合亚马逊的领导力准则,就是领导者要有长远的眼光,不要只是拘泥于短期的利益。当然还有,就是做事情需要做到客户至尚。 总体来说,Echo的诞生本身有一些偶然因素,但是诞生以后亚马逊充分贯彻领导力准则,围绕Echo的发展采取了一系列策略,让它真正能够大红大紫。 智能音箱的战斗:语音助手Alexa 作为智能音箱核心功能的语音交互,或者更通俗的说是语音助手,对Echo来说是最重要的一个模块。这两年最红火的语音助手是Alexa,它属于亚马逊。 全力以赴打造语音助手 Alexa是怎么诞生的呢?这就要回到2015年8月,Echo智能音箱卖了大概10个月之后,亚马逊突然意识到自己的语音助手可以作为一个独立的云服务存在,并不一定要和Echo智能音箱捆绑在一起。 于是亚马逊悄悄地把那个叫Echo的语音助手改名为Alexa。Alexa原本是亚马逊旗下的一个网站分析工具,语音助手算是鸠占鹊巢。没过多久,谁也不再记得那个曾经的网站分析工具了,Alexa成了专门指代亚马逊语音助手的名词。 但是为了保证向后兼容,在Echo智能音箱语音助手的提醒词里,虽然默认是HelloAlexa,最初推出音箱时用的提醒词HelloEcho也依然保留着。只有从提醒词里,我们才能够看到过去的痕迹:原来Alexa曾经叫作Echo。 亚马逊最初研发音箱的时候,对语音处理技术的重要性并不是特别清楚,所以语音助手的技术水平很一般。当Echo音箱卖得很好时,亚马逊很快就意识到了语音处理技术的重要性,但是语音处理技术人才储备并不多。索性西雅图有一家在消费市场并不是特别知名,但是在专业语音处理领域非常著名的公司Nuance。 Nuance在西雅图有一个研发中心,中心里有很多专门做语音处理技术的人才,亚马逊就狠狠地高价在这家公司里面大肆搜罗了一番。最后,Nuance西雅图研发中心的很多核心人员都跑去了亚马逊。 为了进一步增强在语音处理领域的技术和人才储备,亚马逊又迅速出手,接连收购了Yap和Evi两家创业公司。至此,亚马逊终于有些安心,给Alexa储备了足够的语音处理人才。 用机器学习搞定语音识别 Echo首先是个音箱,而音箱的主要功能是放音乐。但有些活动,比如聚餐、舞会中会有很多其他声源,这类场景下和音箱进行交互就有一个很大的问题:音箱如何在这些嘈杂的声音里识别出真正的交互命令呢? 应用场景的不同,决定了Echo音箱上的语音助手Alexa和手机上的语音助手对技术的需求有很大不同。简单来说,如果手机上的语音交互难度是一颗星,那么深处嘈杂环境下的音箱的语音交互技术起码得是四颗星。这是Echo智能音箱必须解决的一个难题。 在一次公开的交流中,负责Alexa相关业务的首席科学家、著名的机器学习学者罗希特普拉萨德(RohitPrasad)在接受采访时简单提到过,Lab126团队因为这个问题一度让Echo智能音箱项目被搁浅,最后不得不在全公司范围内寻求帮助。 而之后的解决方式是机器学习。亚马逊曾经在网络上公开过一段音频,对比了在嘈杂环境上的原始声音,和经过机器学习处理的声音。在音频里你可以看到,经过机器学习处理的音频达到了近乎完美的噪音过滤,这是Echo在极其恶劣嘈杂的环境下,依然能够表现出非常良好的语音识别功能的主要原因。 Echo上市以后,无论在多嘈杂的环境里,语音交互的识别能力都非常好,这是Echo能够迅速脱颖而出最重要的原因之一。 亚马逊公司长期以来给人的感觉是商业决策优于技术,亚马逊的核心技术并没有让人觉得多惊艳。然而在这件事情上,亚马逊显现了用技术解决难题的能力,这颇让我对亚马逊的印象有了很大的改观。 语音平台促进成长 Alexa从Echo独立出去以后,就开始在亚马逊的各大设备上集成,比如说亚马逊的FireTV就集成了Alexa。Alexa在亚马逊内部可谓大行其道,任何一个项目组的东西如果可以和Alexa整合,在亚马逊内部的优先级都会上升许多。 除了内销,亚马逊还把这个语音助手出口到了各行各业去,包括智能冰箱、汽车,乃至华为手机,等等。Alexa的遍地开花,让亚马逊作为一个语音助手市场的后来者,占据了很多有利位置。 从技术开发上,Alexa也有了自己独立的研发团队,而且目前已经非常庞大,有包括一个总监在内的很多人。在亚马逊,如果一个项目有总监级别的人参与,就代表着这个项目实在是一个非常重要的项目,是公司首席级高管(Clevel)可以直接看到和关注的项目了。Alexa有了总监级人物以后,在亚马逊的地位也就突显出来,不再是Echo下面的一个附属项目了。 在亚马逊内部,很多人都相信语音交互是一个非常重要的、新的流量渠道,而且在未来会更加重要,占领了语音,也就在未来的新交互方式里占据了一块稳固的地盘。所以自从Alexa独立以后,这个团队就一直在膨胀。很有意思的是,我在LinkedIn上经常可以收到来自亚马逊招聘人员的邀约,其中为Alexa招人的比例一直居高不下。 如果说一开始Echo作为一款智能音箱,对于亚马逊占领客厅和厨房很重要的话,那么现在亚马逊的语音助手Alexa和它给第三方开放的技能平台,则是亚马逊的重中之重。如果说这之前,亚马逊更关注音箱,那么Alexa作为一个软件独立出来发展后,亚马逊关注的重点也就从硬件转向了软件和平台:硬件,包括智能音箱在内,都是为这个软件平台服务的。亚马逊今天发展的各种硬件,确实已经变为主要为Alexa平台服务,硬件本身的作用已经远远比不上这个语音平台了。 有了这个语音平台,亚马逊不但可以在自己的硬件上推广,还可以把语音平台开放给第三方。让第三方的硬件都进入这个平台。这里就有华为的手机、LG的电器,未来我们还可以预见到的,比如说车载系统等等。 对比硬件的影响力,语音平台的影响力要大得多,最终平台会造就一个生态圈,而任何生态圈都有很强的黏性。亚马逊也可以凭借平台把影响力扩大到自己的业务之外,让Alexa成为整个互联网和IT产业里面很多公司都愿意加入的生态圈,这种影响力是智能音箱不可能达到的,也是亚马逊从来都没有企及过,但是现在却有可能成功的。 从Echo音箱到Alexa语音助手的变迁,是优先级的一个巨大改变。这个变迁在亚马逊里面用了10个月,亚马逊对市场反应的这个速度,让我非常吃惊。通常在其他互联网或者软件公司,这种变迁花费三年五年也是很常见的。这样看来,亚马逊能够在语音市场占据一片天地,也是有原因的。 智能音箱的战斗:亚马逊的战略布局 除了是最早进入智能音箱领域的企业,或者说是智能音箱的发明者,亚马逊还是一家对市场反应非常灵敏的企业,因此自然会有自己的战略布局。无论是否有其他竞争对手进来,亚马逊都是需要发展智能音箱的。 亚马逊在Echo上的布局,最初的做法也是遍地撒网,不算多高明。第一个出场的是便携式智能音箱Tap,这个音箱可以随身携带外出旅游。但是我们知道,出行的时候带个音箱其实还是小概率事件。更重要的是,Alexa需要联网才能工作,而Tap并未自带手机芯片,必须外接WiFi才能连接互联网,所以这个产品卖得一般般。 第二个出场的是EchoDot,你可以认为它就是廉价版Echo。这个EchoDot更新换代很快,半年不到就已经出到了第二代。这个产品倒是非常有意思,它有麦克风和扬声器,提供了Alexa语音助手,同时还可以连上其他高档音箱,把高档音箱变成智能音箱。 这样一来,就让那些喜欢更高品质音箱的人,可以兼得智能音箱的功能和高档音箱的音质。而对于在家里需要到处都有Alexa语音,但不一定都需要听歌的人,廉价的EchoDot也是一个很好的选择。 你完全可以在不同的房间里面放个EchoDot,并只在厅里放个Echo,通过高低结合形成一个完整的智能家居音控系统。亚马逊鼓励大家多买EchoDot,所以在售价上,为同时购买多个EchoDot的用户提供折扣。 既然谷歌通过Chromecast和GoogleTV在电视上提供视频交互的功能,亚马逊也提供了对应的策略,这就是另外一款产品:EchoShow。 EchoShow简单来说就是一个带屏幕的Echo,音箱质量还不错,有个小屏幕,Alexa可以提供视频和语音回答。这个产品出来以后,很多人都挺喜欢的。 谷歌在智能音箱上可谓来势汹汹,亚马逊在PrimeDay的时候做了一次史无前例的促销。促销主要集中在亚马逊的智能音箱领域。Echo系列全面打折,其中Echo音箱的折扣更是高达50,所以这一天很多很多的会员都买了。在我的朋友圈里,那天很多人都在贴自己买了音箱或者要剁手的照片。 当时有两种声音:一种说法是这是亚马逊通过大规模补贴来迅速占领市场,进一步巩固自己的霸主地位;另外一种说法是亚马逊在清仓了,因为很可能下一代的Echo产品要出来占领市场了。 最后证明果然是亚马逊出了Echo第二代产品。第二代Echo有Echo和EchoPlus两个版本。其中,Echo的高度只有原来的一半,而价格也很神奇地降到了99美元,比谷歌的智能音箱还便宜。不过,Echo据说虽然只有原来体积的一半,却比上一代有更好的音质,这主要归功于Echo二代里面新加的低音喇叭。 EchoPlus售价149美元,看起来更像是上一代的Echo,至少从高度上看很像。当然,149美元的售价也比上一代更加便宜。 EchoPlus最大的卖点是智能家居的控制。和一代产品不同,二代产品EchoPlus可以自动检测连接在同一个局域网里面的所有智能家居,并自动设置好。开箱之后,你就可以直接通过语音助手Alexa控制智能家居,完全不需要任何人工设置的过程。 这看起来的确是非常实用的一个功能。为了体现这个功能的价值,EchoPlus还自带了一个飞利浦智能电灯泡。至于效果怎样,可能就有待市场检验了。 亚马逊在发布会上还表示,经过对三年来用户行为的学习,亚马逊发现用户最喜欢Alexa做的三件事情是:开灯、启动咖啡机、读新消息。所以以后用户可以设定例行程序,比如在说Alexagoodmorning的时候,就可以让它把这些事情都做了。 亚马逊还发布了一个新的产品EchoSpot,这是个带圆形显示屏的2。5英寸大小的东西,比EchoShow要小。显示屏可以显示时间、天气,甚至可以实现和用户进行视频会议等诸多功能。作为一款屏幕如此小的产品,EchoSpot的售价在我看来并不便宜,高达129美元。 最后出场的是20美元一个的EchoButton。它的功能非常有限,目前也只能做一下语音交互,比如可以用作抢答问题的答题器。 亚马逊发布了新的Echo系列之后,我着实有些不爽。没错,我就是那个贪图便宜在PrimeDay里面半价买了一代Echo智能音箱的人。被清仓的感觉真心不好。在我买了一代以后是不是要买二代,这个问题就显得很尴尬了。 面对谷歌咄咄逼人地进军智能音箱市场,亚马逊推出新一代产品,并主要解决了下面几个问题。 首先是谷歌的低价问题。作为一个把节俭写入了领导力准则,把成本控制看作生命,把低价看作核心价值的公司,在自己发明的智能音箱领域,居然被一个黑科技公司打趴下了,实在不是什么值得高兴的事情。所以,在Echo二代里,亚马逊大幅度降低了音箱的价格,性价比方面一下子就超越了谷歌。这样,亚马逊就在价格上占据了优势。 其次是对谷歌Chromcast和电视机结合的反击。谷歌通过音箱和Chromecast的组合,以及Chromecast和电视机的结合,提供了独一无二的体验。亚马逊的反击颇为迂回,主要体现在两个方面:一个是EchoShow,可以放在客厅之类的地方;一个是新的EchoSpot,小巧精致放书桌上正合适,还可以用来和他人视频通信,可谓一举数得。至于到底是大屏幕电视的体验更好,还是另起炉灶的新Echo硬件更好,我们很难判断。想来是各有千秋吧。 第三点,可能也是体现亚马逊战略的一点,就是亚马逊希望成为智能家居的控制器。为什么说是控制器呢?因为在上一代产品里,智能家居的控制是需要通过技能的设置来完成的。虽然设置好了以后也挺好用的,但是难免有人不懂或者不熟悉使用电脑。所以为了更好地占领智能家居市场,让对智能设备的控制简单化、傻瓜化也就提上了日程。这个EchoPlus的设备就是为此设计的。 更低廉的价格,更多的交互方式,对智能家居控制器的强化,基本上构成了亚马逊这次新产品发布的主要目的,亚马逊在商业上想得很清楚。 所以长期来看,亚马逊和谷歌在智能音箱领域的斗争依旧要延续下去。估计最后分庭抗礼的可能性比较大。 智能音箱的战斗:巨头纷纷入场 在谷歌入场一年以后,另外两大IT巨头苹果和微软也宣布进军智能音箱市场。苹果的入场始于2017年WWDC全球开发者大会,它们发布了一款叫作HomePod的智能音箱,原计划年底交货,不过目前已经推迟。 而在这之前不久,也就是2017年5月9日,传统音箱厂商哈曼卡顿(KarmanKardon)宣布和微软合作,推出一款搭载微软语音助手Cortana的智能音箱,这款音箱名为Invoke。 进入智能音箱市场的,不仅有国外的企业,也有国内的企业。国内最著名也最早的是京东,它联合的是科大讯飞。科大讯飞作为中文语音技术的先驱,经过十余年的积累,对于中文语音处理和识别技术的掌握,基本上是全球最牛的了。名为叮咚的音箱是科大讯飞和京东合作的产物,推出的时间不算很晚,功能上差强人意,生态圈做得不算好。总体而言,叮咚应该不是亚马逊和谷歌的对手。 除此之外,国内的智能音箱还有阿里巴巴旗下的天猫精灵X1、喜马拉雅的小雅AI音箱、联想推出的联想智能音箱、小米推出的小米AI音箱,等等。这些音箱在嘈杂的环境下都很难达到亚马逊或者谷歌音箱的水平,国内的音箱是不是能够一骑绝尘,目前来看还需要一段时间。