谷歌更新了CloudSpeechAPI现已可供开发人员使用
去年7月,Google为与其语音识别有关的Google Cloud Platform客户宣布了两个新的API。这些以Beta形式提供给了少数开发人员以及Cloud Natural Language API和Cloud Speech API。除了限于一定数量的开发人员外,这些API的功能也非常有限,因为Google仍在努力增强和优化其功能。
Cloud Speech API是Google自己的自动语音识别(ASR)服务,它实际上为许多Google产品(例如Google Search,Google Now,Google Assistant)提供了语音识别功能。Google采纳了该技术,并对其进行了调整,以适应Google Cloud客户的需求,这就是Cloud Speech API诞生的方式。本周早些时候,谷歌不仅将这种技术普遍提供给开发人员,而且他们还宣布了一项重大更新。
此更新包括对以前功能的一些增强,并增加了对某些新文件类型的支持。一些开发人员抱怨说,抄录长格式音频不是很准确,因此Google表示此更新将改善这一点。在某些情况下,该服务也更快,开发人员看到它比批处理方案快三倍。此更新的最后一个亮点是增加了对WAV,Opus和Speex文件格式的支持。
自Google Cloud Speech API推出以来,该公司已经看到了该服务的两个流行用例。自然地,谷歌已经看到许多开发人员采用该服务来向其产品添加语音搜索,语音命令和交互式语音响应(IVR)。但是他们也看到它被用于语音分析,这对于从呼叫中心寻求实时洞察力的企业非常有用。