iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >通过Python的speech_recognition库将声音转为文字
  • 880
分享到

通过Python的speech_recognition库将声音转为文字

语音识别人工智能 2023-09-05 21:09:12 880人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

文章目录 前言一、PortAudio1.PortAudio是什么?2.安装PortAudio 二、使用方法1.引入库2.创建一个Recognizer对象3.使用麦克风录音,从麦克风录制音频

文章目录


前言

大家好,我是空空star,本篇给大家分享一下通过python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition库,本篇将声音转为文字,除了speech_recognition库,还要依赖pyaudio库,而且Mac用户需要安装PortAudio

Python-语音转文字相关库介绍


一、PortAudio

1.PortAudio是什么?

PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台api,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如windows、Mac OS X、linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下:

brew install portaudio  

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音,从麦克风录制音频

# 使用麦克风录音with sr.Microphone() as source:    print("请说话...")    # 从麦克风录制音频    audio = r.listen(source)    print("录音结束")

4.将音频转换为文字

try:
    # 将音频转换为文字
    text = r.recognize_Google(audio, language=‘zh-CN’)
    print(“你说的是:”, text)
except sr.UnknownValueError:
    print(“Google Speech Recognition could not understand audio”)
except sr.RequestError as e:
    print(“Could not request results from Google Speech Recognition service; {0}”.fORMat(e))

5.转换结果

声音:深度神经网络模型部署
请说话…
录音结束
你说的是: 深度神经网络模型部署
Process finished with exit code 0


总结

来源地址:https://blog.csdn.net/weixin_38093452/article/details/130626278

--结束END--

本文标题: 通过Python的speech_recognition库将声音转为文字

本文链接: https://www.lsjlt.com/news/396154.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作