首页 > 资讯 > 后端开发 > Python >Python中怎么实现语音识别

568

分享到

Python中怎么实现语音识别

2023-06-16 17:06:00 568人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

今天就跟大家聊聊有关python中怎么实现语音识别，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。离线转换对于国内的网络环境，无法用Google api来将语音数据转换成文本文件，因为

今天就跟大家聊聊有关python中怎么实现语音识别，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

离线转换

对于国内的网络环境，无法用Google api来将语音数据转换成文本文件，因为在调用这个包的时候，需要连接到google。当然，你可以租用一个国外的VPS来做这件事情。

这里讲一下如何在不联网的情况下，依然可以通过Python来将语音文件转换成文字。这里用到的包为sphinx，sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。

安装 sphinx

我本人所用的环境为ubuntu。

imyin@develop:~/Downloads/phinx$ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 16.04.3 LTS Release: 16.04 Codename: xenial

在安装sphinx之前需要安装一些软件包

sudo apt-get install GCc automake autoconf libtool bison swig python-dev libpulse-dev

之后可以在相关网站上下载sphinxbase安装包，当然也可以直接clone GitHub上的包

下载完之后进行解压

tar zxpf sphinxbase-5prealpha.tar.gz

修改文件名

mv sphinxbase-5prealpha sphinxbase ls sphinxbase  AUTHORS doc indent.sh Makefile.am README.md src win32 autogen.sh .git LICENSE NEWS sphinxbase.pc.in swig configure.ac include m4 README sphinxbase.sln test

现在我们应该运行autogen.sh来生成Makefiles和其他一些脚本以备后续的编译和安装。

./autogen.sh

下面开始源码安装

make && sudo make install

执行完以上命令之后，如果没有出现什么报错信息，就说明已经安装成功了，但是此时你的命令并不可以生效，在运行命令时会出现这样的错误。

imyin@develop:~/Downloads/phinx/sphinxbase$ sphinx_lm_convert  sphinx_lm_convert: error while loading shared libraries: libsphinxbase.so.3: cannot open shared object file: No such file or directory

还需要让系统加载目录/usr/local/lib，为了让系统每次启动时都可以自动加载，可以修改系统配置文件ld.so.conf

sudo echo "/usr/local/lib" >> /etc/ld.so.conf sudo ldconfig

这时候，就可以通过sphinx_lm_convert命令将模型DMP文件转成bin文件

sphinx_lm_convert -i zh_broadcastnews_64000_utf8.DMP -o zh_CN.lm.bin

上面这行代码是将中文的模型DMP文件转成了bin文件。在安装完sphinx后默认只支持英文，在存放模型的路径下只有一个文件名为en-US，所以这里需要添加一个处理中文的模型，相关文件可以在这个网址中下载。

Python中怎么实现语音识别

在python中使用sphinx

想要在python中使用sphinx的话，需要安装一些依赖包。

pip install pydub -U # 负责将MP3文件转换为 wav 文件 pip install SpeechRecognition -U # 负责将语音转换成文字 sudo apt -qq install build-essential swig libpulse-dev # 为后面安装 pocketsphinx 做准备 pip install -U pocketsphinx # 为使用 sphinx  sudo apt-get install libav-tools # 为解决在调用 pydub 时出现的 warning ：RuntimeWarning: Couldn't find FFmpeg or avconv - defaulting to ffmpeg, but may not work warn("Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work", RuntimeWarning)

这时候，就可以启动ipython来试试效果了。

file_path = '/home/imyin/Downloads/phinx/test_data' r = sr.Recognizer() hello_zh = sr.AudioFile(os.path.join(file_path, 'test.wav')) with hello_zh as source:  audio = r.record(source)  r.recognize_sphinx(audio, language='zh_CN')  '今天 天气 很'

可以看出，这个语音识别器已经生效了。但是我说的是“今天天气好热啊”。

看来sphinx中的模型并非很准呐，而且这只是一个短句子。我们接下来看看长句子的效果，我录了村上春树的《当我谈跑步时我谈些什么》中的一段内容。

那一年的七月里，我去了一趟希腊，要独自从雅典跑到马拉松，将那条原始的马拉松路线&mdash;&mdash;马拉松至雅典&mdash;&mdash;逆向跑上一趟。为什么要逆向跑呢?因为清晨便从雅典市中心出发，在道路开始拥堵、空气被污染之前跑出市区，一路直奔马拉松的话，道路的交通量远远少得多，跑起来比较舒适。这不是正式的比赛，自己一个人随意去跑，当然不能指望有什么交通管制。

hello_zh = sr.AudioFile(os.path.join(file_path, 'test2.wav')) with hello_zh as source:  audio = r.record(source)  r.recognize_sphinx(audio, language='zh_CN')  '南 音 扬 的 只有 领 过 球 的 立场 是 希望 让 猪只 处理 垃圾 土木工程 上 打球 运动 充满 温情 能 成功 吗 而 中止 了 对 印尼 商报 称 他 不是 没有 立场 谈 那 一 枚 其中 春天 从 雅典 市中心 出发 寸 厂 都 可 成功 突破 寻求 对 於 能 提升 统筹 署 取缔 一路 直奔 马拉松 和 阿 惹 山 活动 等 二十 个 队 中 重申 这 不是 正常 的 比赛 自己 一个人 却 一直到 当然 不能 说明 什么 这种 共识'

呃，看到结果，我觉得可以用一个来形容：差劲。两个字来形容：太差劲！

当然，这个模型只是我直接从网上下载下来的。训练它时所用到的语料不会那么齐全，所以在测试时难免会出现不准确的情况。要想让模型更加准确，需要自己在利用sphnix继续训练模型。

相关办法在其官网上可以找到，也有相应的教程。感兴趣的朋友可以自行研究。

Q: Why my accuracy is poor  Speech recognition accuracy is not always great. To test speech recognition you need to run recognition on prerecorded reference database to see what happens and optimize parameters.  You do not need to play with unknown values, the first thing you should do is to collect a database of test samples and measure the recognition accuracy. You need to dump speech utterances into wav files, write the reference text file and use decoder to decode it. Then calculate WER using the Word_align.pl tool from Sphinxtrain. Test database size depends on the accuracy but usually it&rsquo;s enough to have 10 minutes of transcribed audio to test recognizer accuracy reliably. The process is described in tutorialtuning.

文中提到的教程网址是https://cmusphinx.github.io/wiki/tutorialtuning/

Google API

利用google API来处理语音识别则相当准确，不过需要连接google，以下是我在VPS中执行的一段代码，可以看出，它将我的录音精准地翻译成了文字。

Python中怎么实现语音识别

但是如果录音文件较大的话，会运行时间很长，并且会返回一个超时的错误，这很是让我苦恼。

不过幸运的是，speech_recognition支持将语音文件进行截取处理。例如，我可以只处理语音文件中的前15秒钟的内容。

with test as source:  audio = r.record(source, duration=15) r.recognize_google(audio, language='zh-CN') '那一年的7月里我去了一趟希腊有独自从雅典跑到马拉松江哪条原始的马拉松路线马拉松直雅典一想跑上一趟'

从上面的结果看，简直比sphnix处理的效果好太多了。

通过看帮助文档发现speech_recognition不仅可以截取前面的录音，还可以截取中间的。

In [18]: r.record? Signature: r.record(source, duration=None, offset=None) Docstring: Records up to ``duration`` seconds of audio from ``source`` (an ``AudiOSource`` instance) starting at ``offset`` (or at the beginning if not specified) into an ``AudioData`` instance, which it returns.  If ``duration`` is not specified, then it will record until there is no more audio input.

例如我想处理5秒至20秒之间的内容。

with test as source:  audio = r.record(source, offset=5, duration=15) r.recognize_google(audio, language='zh-CN')  '要独自从雅典跑到马拉松江哪条原始的马拉松路线马拉松直雅典一项跑上一趟为什么要一想到呢因为星辰变从雅典市中心出发'

看完上述内容，你们对Python中怎么实现语音识别有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注编程网Python频道，感谢大家的支持。

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python中怎么实现语音识别

本文链接: https://www.lsjlt.com/news/284528.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python中怎么实现语音识别

今天就跟大家聊聊有关Python中怎么实现语音识别，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。离线转换对于国内的网络环境，无法用google API来将语音数据转换成文本文件，因为...

99+

2023-06-16
Python调用百度api怎么实现语音识别

Python调用百度api怎么实现语音识别，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。最近在学习python，做一些python练习题github上几年前的练习题有一题是这样...

99+

2023-06-21
Linux下怎么用python实现语音识别功能

这篇文章主要介绍“Linux下怎么用python实现语音识别功能”，在日常操作中，相信很多人在Linux下怎么用python实现语音识别功能问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Linux下怎么用py...

99+

2023-07-05
android语音识别功能怎么实现

要实现Android平台的语音识别功能，可以使用Android提供的语音识别API，具体步骤如下：在AndroidManife...

99+

2023-10-22

android
基于Python实现语音识别和语音转文字

目录前言直接使用获取权限1.环境准备2.获取权限代码实现1.获取access_token2.获取转换后音频3.配置接口参数4.完整demo5.执行前言嗨嗨，大家好呀 ~ 今天给你们...

99+

2022-11-11
Python如何进行语音识别，语音转换功能实现

Python如何进行语音识别，语音转换功能实现，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。相信大家都非常喜欢那些萝莉音,看那些女装大佬,开一个变声器声音实在是很有诱惑力,下面...

99+

2023-06-02
基于C#怎么实现语音识别功能

今天小编给大家分享一下基于C#怎么实现语音识别功能的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。在.NET4.0中，我可以借...

99+

2023-06-30
Android实现语音识别代码

苹果的iphone 有语音识别用的是Google 的技术，做为Google 力推的Android 自然会将其核心技术往Android 系统里面植入，并结合google 的云端技...

99+

2022-06-06

语音识别 Android
JavaScript如何实现语音识别

这篇文章将为大家详细讲解有关JavaScript如何实现语音识别，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。这里介绍一个开源的JavaScript语言输入库，名叫ann...

99+

2022-10-19
语音识别实战（python代码）(一）

语音识别实战（python ：pyttsx、SAPI、SpeechLib实例代码）(一）本文目录：一、语音识别的基本原理（1）、语音识别的起源与发展（2）、语音识别的基本原理（3）、语音识别过程（4）、语音识别的近期发展...

99+

2023-08-31

语音识别人工智能深度学习 python 开发语言
Python语音识别API实现文字转语音的几种方法

搜狗（目前好用，免费） def textToAudio_Sougou(message, filePath): # https://ai.so gou.c...

99+

2022-11-13
Android基于讯飞语音SDK实现语音识别

一、准备工作 1、你需要android手机应用开发基础 2、科大讯飞语音识别SDK android版 3、科大讯飞语音识别开发API文档 4、android手机关于科大讯飞S...

99+

2022-06-06

讯飞 sdk 语音识别 Android
Python3.7 + Yolo3怎么实现识别语音播报功能

这篇文章将为大家详细讲解有关Python3.7 + Yolo3怎么实现识别语音播报功能，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。一、利用Python调用系统win10...

99+

2023-06-22
Python调用百度api实现语音识别详解

最近在学习python，做一些python练习题 github上几年前的练习题有一题是这样的：使用 Python 实现：对着电脑吼一声,自动打开浏览器中的默认网站。例如，对着笔...

99+

2022-11-12
Java离线中文语音文字识别功能怎么实现

这篇文章主要讲解了“Java离线中文语音文字识别功能怎么实现”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Java离线中文语音文字识别功能怎么实现”吧！1、pom文件如下：<xml&n...

99+

2023-07-02
Java中怎么通过调用jna实现语音识别功能

Java中怎么通过调用jna实现语音识别功能，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。JNAjava调用.dll获取.so一般通过JNI，但是JNI的使用比较复杂，需要用C...

99+

2023-06-17
Unity如何实现语音识别功能

小编给大家分享一下Unity如何实现语音识别功能，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！现在语音识别已经被广泛的应用到各个领域中，在Unity开发中，语音识...

99+

2023-06-15
轻松实现Android语音识别功能

苹果的iphone有语音识别用的是Google的技术，做为Google力推的Android 自然会将其核心技术往Android 系统里面植入，并结合google 的云端技术将其...

99+

2022-06-06

Android
详解Unity 实现语音识别功能

现在语音识别已经被广泛的应用到各个领域中，在Unity开发中，语音识别也非常受欢迎。大部分人都会选择科大讯飞的语音识别功能，但是在一些小的项目中，使用科大讯飞的就有点大材小用了。今天...

99+

2022-11-12
亚马逊语音识别怎么用

以下是AIV的使用方法：连接到Amazon Sphere或AWS上的Amazon Voice Recognition服务。在您的设备上启动Amazon Voice Recognition服务，然后输入您的手机号码或访问Amazon ...

99+

2023-10-27

亚马逊语音识别