如果没有这家2015亿元独角兽俱乐部排位第四的公司,本·拉登不会那么快被奥巴马拿下。正是帕兰提尔(Palantir),依靠语音识别和声纹识别技术,通过大数据分析识别了本拉登的声音并将其精准定位。如今,帕兰提尔(Palantir)已经变成了进行大规模数据挖掘以供美国情报及执法部门使用的关键公司。
一场由语音开启的“场景革命”正在渗透各个消费领域
用抓住本·拉登的技术服务于普通大众,一场由语音开启的“场景革命”正在渗透各个消费领域。
在中国,语音识别和声纹识别也同样在公安和安防系统被使用。不过这项技术在近年来已被广泛地应用到了金融、家居、汽车、教育等多个消费领域。
对于银行来说,指纹可以被复制,但是加上声音就是双保险;对于支付而言,人脸识别也可以被照片替代,加上声纹,被复制的难度就大大增加;在家里,窝在沙发上懒得下去找遥控,有了语音交互技术你完全可以“吼一声”就让电视乖乖换台;在路上,一边开车一边还得谈生意,植入语音系统芯片的车载后视镜或抬头显示仪完全可以解放你的双手;在厨房,火太大,手沾油,手忙脚乱之下想要切换油烟机风力大小也许会让人急到发飙,但现在加入语音交互系统的油烟机只要动动嘴就够了。(图为中考英语口语设备佩戴说明)
不仅上述在几个领域的运用,在教育方面,中国学生中考英语口语比例已经从十年前的可有可无增加到了40%的比重。教育最大的问题是公平,学生参加考试最大的担忧是不公平。你无法想象,抽签排到最后一个进入考场到学生进行口语考试将面临怎样到心理压力,老师是否还有耐心听得下去,分数能否客观?但在语音技术成熟但今天,只要不停电不断网,机器是没有情绪没有偏见的,也只有机器能够做到100%的公平。目前,语音识别技术已被运用到来口语考试当中。
对于大众用户来说,也许你还没来得及置办一件高端智能的家具,没来得及换一个可以解脱双手的后视镜。但语音交互这门技术你可能早就体验过了。你有没有跟着语言app学过口语?你有没有在微信里玩过语音转文字?你有没有用酷我音乐或唱吧搜过自己想不起歌名的一首歌?有没有“调戏”过siri、小冰、小智、小欧等手机助手?如果有,那么你早已是抓住本拉登如此“高大上”技术的基础用户。
而上述这些功能,一家叫云知声的公司全都做到了,并且在成立仅三年时间内成功融资近5亿人民币,挺进IOT(物联网)的“独角兽俱乐部”。
12月16日,云知声2015战略发布会在京举行,发布了“云端芯”的战略部署,并与华为签署合作协议。作为世界上三分之二数字机顶盒的制造商,华为将在日后的机顶盒制造中使用云知声的语音交互技术,并开展多层面多领域的合作。
用户画像:到底谁在使用语音交互?
作为一家B2B的公司,云知声主要向客户提供系统解决方案,不仅服务B端客户,云知声也研究C端用户。在发布会上,云知声团队基于476个城市,9000万台设备产生的语音大数据生成量以下几组用户行为数据。
数据显示,使用智能设备的男性多于女性,男女比例为63%:37%;24-35岁的用户最多;华南地区使用智能设备的频率更高,其中东莞用户最活跃。34%的男性用户使用语音进行聊天,18%的男性喜欢听音乐,16%在视频上使用语音操控,9%进行搜索,7%导航。就女性用户而言,大部分场景也是聊天,其次是音乐、视频、搜索、天气等。
而智能设备等语音交互使用者以互联网行业居首,其次是金融、媒体行业。在具体场景里,57%的智能电视用户选择在沙发上用语音换台;在车里,45%的用户更喜欢用智能车机设备打电话;在教育场景里,73%的学生在平板上练口语,85%的K12教育接入了智能测评,35%的幼儿早教使用智能语音。
语音交互三大阵营:上市公司、BAT以及创业新秀
云知声此前的对标企业是美国苹果公司推出的智能家居平台Homekit。但想要对标苹果,对标帕兰提尔的企业岂只云知声一家。目前,国内有三大阵营正在分这块蛋糕:第一阵营是上市企业科大讯飞,第二阵营是BAT,第三阵营是以云知声为代表的后起新秀。这是云知声CEO黄伟对行业进行的分类。
在黄伟看来,第一阵营里科大讯飞是成立最早的,早在1998年就创立,2008年上市,市值早已奔向百亿美金。科大讯飞的百度百科词条资料显示,科大讯飞是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的公司。
“语音技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司,其智能语音核心技术代表了世界的最高水平。”
“科大讯飞占有中文语音技术市场70%以上市场份额,语音合成产品市场份额达到70%以上,在电信、金融、电力、社保等主流行业的份额更达80%以上,开发伙伴超过10000家。”这些数据说明了科大讯飞在行业里的地位。
科大讯飞确实强,不过黄伟认为,科大讯飞目前的重点还在政府工程、金融、运营商等方面。
第二阵营里,百度在2008年就与中科院合作成立工作室开展语音技术研究。在去年5月,百度吸引人工智能专家、前谷歌研究员吴恩达(Andrew Ng)加盟,担任百度首席科学家。7个月后,吴恩达带领10人团队对外宣布百度开发出了一种更为准确的语音识别系统——百度Deep Speech。吴恩达称,以语音识别系统准确率标准衡量,百度Deep Speech系统要强于谷歌和苹果等对手的系统。
今年10月,国家总理李克强在百度与机器人“小度”的对话曾上了新闻热搜榜。现场有人问“小度”:“你对北京的城市管理有什么建设性的意见啊?”“小度”思考一会后回答:“什么时候不堵车就好了。”幽默的回答引得全场同行人员哈哈大笑,并直夸其聪明。
腾讯在语音技术方面的布局最典型的应用就是微信的语音转文字。早在2013年12月,腾讯就对外发布了微信语音开放平台,基于微信平台为为移动开发者提供语音识别服务。
在腾讯发布语音识别系统的25天后,阿里巴巴在手机淘宝客户端增加语音搜索功能,正式加入语音战场。阿里巴巴集团无线事业部运营总监尚文对外称,语音技术其将成为购物的重要入口,尤其是针对中老年市场,因此,阿里巴巴必须要拥有自己独立的技术。
在云知声CEO黄伟看来,BAT在该领域对布局多是为主业做的打算,并不能称为云知声们的真正对手。
云知声属于第三阵营,思必驰,出门问问也都是这一阵营的新秀。“出门问问”是一款基于语音识别、语义理解技术,面向移动搜索领域的智能手机应用,其创始人李志飞曾任职于谷歌。今年10月,出门问问获得Google数额为数千万美元的C轮投资,并替代GoogleNow成为GoogleWear中国版官方搜索服务的提供商。
成立于2007年的苏州思必驰是与云知声最相似的一家公司,不管是定位还是战略都极为相似。面对科大讯飞这样的强大对手,思必驰目前定位于“人机智能语音交互”,在垂直应用领域最先选取里智能家居和智能车载。这一定位与策略都与云知声有异曲同工之处。
不仅这三大阵营在智能语音打得火热,传统厂商也在向线上开拓。今年5月,京东与科大讯飞成立合资公司推出首款产品叮咚智能音箱;联想、华为也动手自己开发语音交互系统。国际市场对智能语音的前景也颇为看好,亚马逊发布了智能音箱,苹果收购了VocalIQ,谷歌战略入股了上述第三阵营的出门问问。
前有狼后有虎 云知声的差异化打法
尽管前有深耕行业十余载的科大讯飞,后有虎视眈眈的BAT,侧有亦步亦趋的思必驰们,国际上还有各种巨头布局。只有三年创业历史的云知声还是获得了市场和资本的认可。
继获得启明创投的一亿元人民币A轮,云知声在去年12月获得高通领投的5000万美元B轮,黄伟称,云知声是目前语音技术领域融资额第一的公司。
资本到底看中了云知声哪些特质?作为云知声投资方之一,启明创投主管合伙人邝子平称,他看中云知声两方面,一是云知声具有“国际一流的技术团队”;二是他认可云知声“开放务实的合作方式”。作为启明创投的创始人之一,邝子平在2015后半年已经投了逻辑思维亿元B轮,找塑料网3600万美元B轮,挖财8000万美元B轮,途虎养车网5000万美元C轮,杭州同盾科技3000万美元B轮。同为云知声重要投资方的高通资本负责人也表示认可这个团队的技术优势。作为创始人,黄伟曾任职于摩托罗拉和盛大创新院,建立了盛大创新院语音分院,后随着盛大整体战略的调整,他于2012年离职选择创业。云知声员工目前接近200人,基础研发团队80%拥有博士学历,来自国内外知名企业、高校和研究所。
即便语音交互领域技术门槛已经够高了,但行业的创业热情随着智能产业被提升至国策也跟着热了起来。面对竞争,云知声在战略上选择了差异化打法。
12月16日,云知声在其品牌发布会上推出了面向IoT领域的完整解决方案。这套方案包括了智能厨房、智能客厅、智慧出行三大领域,从软件、硬件、在线服务三个维度为合作伙伴提供一站式完整方案,从“云-端-芯”三个纬度形成完整闭环。
科大讯飞早在2013年就已经就将公司1/3的人力投入在线教育,与公立学校进行合作。云知声也做在线教育,但它避开了考验政府资源实力的公立教育战场,转而与在线教育的k12学习软件应用合作。据了解,学多多、学而思培优、爽哥英语等英语学习APP接入的就是云知声语音交互系统。 智能车载是另一个语音技术商用的战场,在2014年,思必驰与阿里巴巴的车载系统进行轮合作。而云知声在车载市场目前是获得了骁勇战绩,黄伟在发布会上称,目前云知声是汽车后装市场份额的第一,具体产品包括智能后视镜、行车记录仪、抬头显示器等。
“国家队”出场布局芯片业 智能硬件前景仍广阔
虽然市场份额第一,但从硬件出货率看,智能车载硬件目前总体出货量少,并未呈现增长趋势。智能车载市场还有可为吗?
黄伟从国家智能布局层面看好并认为,这是一个存量和增量并存的可能超越传统互联网的巨大市场。黄伟说的“国家队”布局是指去年以清华紫光为代表的“国家队”通过应用并购基金、夹层基金等手段,紫光并购了展讯和RDA,后获得了INTEL的投资入股,并获得X86架构的授权。通过这两笔收购,紫光一跃称为芯片行业龙头企业。至此,中国目前已拥有海思、紫光、瑞芯微等芯片设计龙头企业。紫光、海思等是被政府重点扶持的芯片设计企业,正受惠于中国手机业的发展。而这两个企业对台湾芯片设计龙头联发科已经产生威胁,海思甚至在技术上超越了联发科。
事实上,从2014年9月中国成立芯片产业扶持基金1500亿开始,中国芯片产业正进入爆发期这一话题就被炒热了。中国大陆芯片产业眼前的目标就是台湾,相对台湾,大陆的芯片产业优势明显。有相关人士认为在扶持政策出台和行业维持高景气度的背景下,中国的芯片产业将进入爆发期,其中大陆芯片设计产值有望超越我国台湾,成为全球第二,仅次美国。
黄伟认为以智能车载为例的硬件出货量低,很大一部分原因是因为成本过高。“国家队”出场意味着芯片行业整合之后,成本就国际市场而言能够大大降低。芯片成本低降低为中国向IOT(物联网)时代进军又降低了一道门槛,所以黄伟看好未来市场低增长。
同样的“低成本思路”被云知声用在智能家居、智能机器人等多个垂直领域。拿一款智能音箱来说,亚马逊的音箱用了9个麦克作为信息源收集语音,效果固然好,产品固然精,但一个裸机但成本就要500人民币,还不说其他附加费用。对于想要开拓大众消费市场的智能硬件制造厂商来说,“高冷”的单品并不是他们想要的。云知声的解决方案是用“双麦克”方案,把语音信息源的成本控制在了10美元内。
这类“与业务结合的技术才有价值”的思维被黄伟贯穿始终。黄伟认为,语音是技术并非产品,只有与行业结合,可应用到细分领域到语音才是产品。
上市企业浙大网新科技股份有限公司执行总裁钟明博也持同一观点。钟明博就很不同意一种观点,即技术改变一切。钟明博认为,单纯的技术不能改变一切,和业务结合的技术才会成为有价值的技术,而改变一切的是有价值的技术。浙大网新是以技术外包起家的上市公司,钟明博认为就外包行业的通病来谈,开发人员偏重技术尖端和前沿性,技术开发和业务运营相对分离。接单,做单,外包行业的开发人员做着较为“一次性”的工作,而非带着“产品经理”的思维去开发“可持续”的模式。
“这几年有很多新的技术诞生了,也许这些新的技术应用会替代过去依靠人力的模式,如果这方面做成功了的话,即使我们不靠这些人,靠技术优势、创新能力也能获得成功,假如还是延续过去的模式我们肯定会输给印度。”
日后,技术公司与解决方案提供商之间边界会越来越模糊,技术型公司的存活之道在于将技术渗透到业务里去。
“用更低到成本满足用户的需求”,如果非要把云知声与竞争对手分出一个究竟,黄伟认为“把握好成本和性能二者之间的平衡”,就是他们与竞争对手的差异所在。
不同于其他纯商业模式的创新,人工智能创业是一个有着高技术门槛的事情。对已经迈入第三个年头的云知声来说,云端芯的产品战略、B2B2C的商业模式、自主创新的人才战略让云知声越来越稳健发展。
未来已来,语音交互是一场“勇敢者的游戏”
就像乐视贾跃亭前不久提出的“生态战”思维,目前单一产品和服务已不足以支撑企业战到最后。云知声早在今年就已成立教育子公司,任命云知声CMO陆勇毅兼任教育子公司CEO,引进资深教育专家,不断充实的教育专业人才。横向,“投资+强强联合”是云知声的初步生态架构;纵向,云服务+智能终端+智能芯片是云知声的产品架构。
虽然要达到人们想象或电影场景展示的人工智能还至少要5年以上的时间,但黄伟依旧看好可穿戴设备、“语音+VR”的发展。目前阻碍这些市场前行的主要是个别技术还未被攻克,一旦像智能手表的电池续航能力、无屏幕展示技术等得到突破,人工智能市场的价值将不可估量。而语音在人工智能各个场景的应用也将得到大大拓展。
不过,技术的难题恰恰证明这是一个“勇敢者的游戏”,人工智能仍需要全行业共同努力才有可能全面实现。在这场游戏里,攻克语音交互的应用难点,正是这家短短三年融资就达到近5亿的企业创立初衷。
登录后发表你的伟大言论!
立即登录 注册