Skip to main content

什么是语音识别?

语音识别是什么原理?为啥知道我们说的是什么? (六月 2025)

语音识别是什么原理?为啥知道我们说的是什么? (六月 2025)
Anonim

语音识别是一种允许语音输入系统的技术。您可以与计算机,电话或设备通信,它使用您所说的输入来触发某些操作。该技术被用于替换其他输入方法,如打字,点击或以其他方式选择。它是一种使设备和软件更加用户友好并提高生产率的方法。

有许多应用和领域使用语音识别,包括军队,作为残疾人的帮助(想象一个残疾人或没有手或手指的人),医疗领域,机器人等。在不久的将来,由于它在计算机和移动电话等常见设备中的传播,几乎每个人都会接触到语音识别。

某些智能手机正在有趣地使用语音识别。 iPhone和Android设备就是其中的例子。通过它们,您可以通过获取“呼叫办公室”之类的语音指令来发起对联系人的呼叫。其他命令也可以被接受,例如“开启蓝牙”。

语音识别问题

语音识别在其称为语音到文本(STT)的版本中,也被用于将口语单词翻译成文本很长一段时间。 “你说话,它的类型,”正如ViaVoice所说的那样。但是我们知道STT存在一个问题。 ViaVoice是业界最好的之一,所以想象其余的。该技术已经成熟和改进,但语音文本仍然使人们提出问题。其主要困难之一是人们在发音方面的巨大差异。

并非所有语言都应该用于语音识别,而那些语言通常不受支持,也不支持英语。因此,大多数运行语音识别软件的设备仅在英语中合理地运行。

一组硬件要求使得在某些情况下难以部署语音识别。您需要一个足够智能的麦克风来滤除背景噪音,但同时又足够强大,能够自然捕捉声音。

说到背景噪音,它可能导致整个系统失败。结果,由于噪声不在用户的控制之下,语音识别在许多情况下失败。

事实证明,语音识别作为新手机和VoIP等通信技术的输入方法比作为大众文本输入的生产力工具更好。

语音识别的应用

该技术在许多领域越来越受欢迎,并在以下方面取得了成功:

  • 设备控制。只需对Android手机说“OK Google”,即可启动一个与您的语音命令完全相同的系统。
  • 车载蓝牙系统。许多汽车配备了一个系统,通过蓝牙将其无线电机制连接到您的智能手机。然后,您可以在不触摸智能手机的情况下拨打和接听电话,甚至可以通过说出来拨号。
  • 语音转录。在人们不得不打字很多的区域,一些智能软件会捕获他们的口语并将其转录成文本。这在某些文字处理软件中是最新的。语音转录也适用于可视语音信箱。