Continuously recognize everything being said on Android?(持续识别Android上的所有内容?)
本文介绍了持续识别Android上的所有内容?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在做一个项目,涉及Android上的语音识别。我有一些问题在这个网站上没有明确的答案(或者实际上是任何问题)。我需要做一些类似于演讲到文本的事情,问题是我需要它连续工作,想象一个应用程序在后台运行,并将它在txt上听到的一切写下来。我知道我需要纠正很多"噪音听力",但它会在稍后出现。
我正在使用PocketShinx-Android,并尝试遵循以下教程: http://cmusphinx.sourceforge.net/wiki/tutorialandroid
当我尝试进行连续识别时,问题出现了,因为本教程只显示了从教程中获取的搜索单词的步骤:"关键字激活搜索"、"基于语法的搜索"和"语言模型搜索"。这是我第一次录音,我完全迷路了,如果有人能给我指明方向就太好了!
推荐答案
如果您想在安卓上识别大词汇量的语音,您需要进行语言模型搜索。您可以使用泛型语言模型来识别没有约束的语音:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20Generic%20Language%20Model/
然而,这将是一个相当耗费资源的过程,如果没有专门化,精确度将不会很高,您将不得不修剪模型以使其适合在移动设备上解码。因此,您的另一个选择是将音频流传输到某个服务器,在那里您可以使用更强大的模型来识别它,或者只使用现有的语音识别API,该API允许连续解码。这篇关于持续识别Android上的所有内容?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:持续识别Android上的所有内容?
基础教程推荐
猜你喜欢
- 如何让对象对 Cocos2D 中的触摸做出反应? 2022-01-01
- 如何在 UIImageView 中异步加载图像? 2022-01-01
- UIWebView 委托方法 shouldStartLoadWithRequest:在 WKWebView 中等效? 2022-01-01
- 如何在 iPhone 上显示来自 API 的 HTML 文本? 2022-01-01
- android 应用程序已发布,但在 google play 中找不到 2022-01-01
- 当从同一个组件调用时,两个 IBAction 触发的顺序是什么? 2022-01-01
- Android:对话框关闭而不调用关闭 2022-01-01
- 如何在没有IB的情况下将2个按钮添加到右侧的UINavigationbar? 2022-01-01
- Kivy Buildozer 无法构建 apk,命令失败:./distribute.sh -m “kivy"d 2022-01-01
- 在 gmail 中为 ios 应用程序检索朋友的朋友 2022-01-01