Picovoice是一家加拿大公司,希望将语音助手放在各种边缘设备上,甚至在网络浏览器中。该过程包含三个组件 - 唤醒词,语音到文本翻译和语音到意图。Picovoice之前推出了Porcupine用于唤醒单词检测,而Rhino用于处理语音到意图,但它现在添加了Cheetah语音到文本的翻译以完成三重奏。所有这些都可以通过GitHub获得。
该堆栈在设备上实时运行,无需互联网连接,并承诺极低的资源需求。Picovoice的目标是同时解决两个重大问题:隐私和资源需求。
语音助理流程通常是资源密集型并且与云相关联。但是围绕云连接存在重大的隐私问题。在这些页面中,我们讨论了大多数智能助手如何收集和存储您的语音数据以及您可以采取哪些措施来控制它。当然,苹果公司因其承包商如何收听Siri录音而受到抨击。
对于具有隐私意识的人来说,让聪明的助手远离技术巨头所拥有的麻烦的后端是必须的。问题是没有云支持就很难运行语音助手,但Picovoice声称它的产品甚至可以运行5美元的Raspberry Pi Zero。它也可以直接在浏览器中运行,通常与平台无关。据Picovoice创始人兼总裁Alireza Kenarsari-Anhari称,Cheetah可以在iOS,watchOS,Android,Linux,macOS,Windows,Raspberry Pi,Beagle Bone和“所有现代网络浏览器”上运行。
低资源要求非常重要,不仅因为计算资源通常限制在边缘设备上,而且因为更高的要求会更快地耗尽电池寿命。Picovoice减少资源需求的关键方式是保持域特定。也就是说,你可以使用不同型号的电视机和洗衣机。这具有直观意义。考虑手机上的智能助手必须处理的可能性领域。当您使用唤醒词时,它不知道您是要发送语音文本,要求播放歌曲,进行互联网搜索查询,设置会议还是什么。它必须从一切的可能性开始。
相比之下,Picovoice的技术开始深入一两级。通过将给定的应用程序限制为像咖啡机这样的特定设备,所涉及的可能请求,命令和动作的数量减少了几个数量级。通过这种方法,Picovoice声称它与谷歌和亚马逊实现了准确性。
因此,我们的想法是,品牌或公司可以使用Picovoice为客户创建自定义语音体验。表面上看,成本远低于云服务后端,虽然硬件成本尚不清楚 - 但它似乎会逐案扩大。
Picovoice的直接竞争对手包括Mycroft,Snips和Sensory。但Kenarsari-Anhari声称,Mycroft没有自己的语音到文本引擎并使用第三方,并且Snips和Sensory需要比Picovoice更多的运行时资源,并在更少的平台上工作。但是,它们确实承诺了一些相同的隐私优势。
Picovoice已经拥有一些客户,尽管除了“数十个”尚未讨论的其他名称之外,该公司还没有详细说明一些名称--LG,惠而浦和本地汽车。