在当天的功能演示现场,刘庆峰问讯飞语点:“哪里能买到汉堡包”?讯飞语点给出的答案却是德国城市汉堡的百科知识。
3月22日,在鸟巢旁边的国家会议中心的大会堂,随着科大讯飞总裁刘庆峰对语音功能的一一演示,现场不时想起一阵阵的惊叹之声。
今年这次发布会的主题是新一代语音云平台,以及官方示范应用——类似于Siri中文版的讯飞语点。去年苹果公司发布iphone4s,其中最大的亮点siri,一时间风靡无双。
科大讯飞已经成立十二年,但是直到最近的一两年才开始发力。各种关键技术的发展和突破是语音识别领域突飞猛进的技术基础:包括语音合成技术、语音识别和自然语言的理解 智能终端、无线网络以及云计算平台等。
去年科大讯飞发布语音云,科大讯飞总裁刘庆峰透露,讯飞现在有3,000万用户,每天在线用户数超120万,总请求量超过700万次。
科大讯飞的讯飞语点无疑是当天发布会的最大亮点。进入软件后,用户可以用语音完成多种操作。包括打电话、发短信、打开应用、上网搜索、提醒以及音乐。可以看到一个比较简洁清晰的对话界面。当你提出问题后,系统会自动回答并将问题结果发送给你。整个交互过程非常简单。
手机和移动终端只是语音识别技术的一小块战场,按照刘庆峰的说法,语音技术未来将成为每一台设备的标配功能,包括手机、家电、轿车甚至玩具。
“I have a dream,将来每一部手机、每一台家电、每一辆轿车和每一个玩具都具备能说的功能。”
美国大片《2012》中,用语音指令启动宾利汽车的情节给无数观众留下了深刻印象。而在2010年,科大讯飞就和上汽荣威合作,在荣威350上实现了语音导航、拨打电话、听书、资讯朗读、播放音乐等功能。
和siri相比,讯飞语点的优点无疑是对中文更加了解。讯飞语点最大的特色是对普通话的高识别率,不少讯飞论坛上的试用用户称语点可以实现近95%以上的正确识别。
Siri的技术基础包括两个方面:语音识别以及自然语言的理解。前者是将人类的语言识别为文字,后者是将人类语言文字转化为机器可执行的语言,即让机器听懂人话。
联系客服