广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python语音识别whisper的使用
  • 683
分享到

python语音识别whisper的使用

python语音识别whisperpythonwhisper 2023-02-27 11:02:34 683人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录一、背景二、whisper语音识别三、示例四、封装工具一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模

一、背景

最近想提取一些视频的字幕,语音文案,研究了一波

二、whisper语音识别

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
stable-ts在 Openai 的 Whisper 之上修改并添加了更大的破解代码发布,生成更准确的阶段时间切换,并在无须额外推介的情况下获得申领

安装

pip install openai-whisper 
pip install stable-ts
SizeParametersEnglish-only modelMultilingual modelRequired VRAMRelative speed
tiny39 Mtiny.entiny~1 GB~32x
base74 Mbase.enbase~1 GB~16x
small244 Msmall.ensmall~2 GB~6x
medium769 Mmedium.enmedium~5 GB~2x
large1550 MN/Alarge~10 GB1x

三、示例

模型越大,越精确,相应话费的时间越长
自带语言识别功能,language最好加上,下面歌曲识别为英语,加后为中文
stable_whisper 是 whisper 进化版

import whisper
import stable_whisper as whisper

class WhisperTranscriber(object):

    def __init__(self, model_name):
        self.model = whisper.load_model(model_name)

    def whisper_transcribe(self, audio_path):
        audio = self.model.transcribe(audio_path, fp16=False, language='Chinese')
        return audio['text']

if __name__ == '__main__':

    transcriber = WhisperTranscriber("base")
    text = transcriber.whisper_transcribe("257853511.mp3")
    print(text)

可能是伴奏声音过大,你才出来这是什么歌了吗?stable_whisper 别的用法、生成字幕

import stable_whisper
model = stable_whisper.load_model('base')
results = model.transcribe('257853511.mp3', fp16=False, language='Chinese')
stable_whisper.results_to_sentence_srt(results, 'audio')
stable_whisper.results_to_sentence_Word_ass(results, 'audio.ass')

四、封装工具

buzz

如果遇到简繁转换可以石下面

pip install zhconv
  • zh-cn 大陆简体
  • zh-hant 繁體
from zhconv import convert     
convert('python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'

到此这篇关于python语音识别whisper的使用的文章就介绍到这了,更多相关python语音识别whisper内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python语音识别whisper的使用

本文链接: https://www.lsjlt.com/news/197633.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python语音识别whisper的使用
    目录一、背景二、whisper语音识别三、示例四、封装工具一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模...
    99+
    2023-02-27
    python语音识别whisper python whisper
  • python语音识别whisper如何使用
    这篇文章主要介绍了python语音识别whisper如何使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python语音识别whisper如何使用文章都会有所收获,下面我们一起来看看吧。whisper语音识别...
    99+
    2023-07-05
  • OpenAI的Whisper模型进行语音识别使用详解
    目录正文Whisper 模型介绍使用Whisper 模型进行语音识别总结正文 语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各...
    99+
    2023-02-09
    OpenAI Whisper语音识别 OpenAI Whisper模型
  • python语音识别
    语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。一、功能概述实现将语音转换为文字,调取第3方接口。比如百度ai,图灵机器人,...
    99+
    2023-01-30
    语音识别 python
  • python语音识别的转换方法
    使用pyttsx的python包,你可以将文本转换为语音。 安装命令 pip install pyttsx3 -i https://pypi.tuna.tsinghua.edu.c...
    99+
    2022-11-12
  • Python语音识别的示例分析
    这篇文章给大家分享的是有关Python语音识别的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。概述将开启一个新的深度学习章节, 为大家来讲述一下深度学习在语音识别 (Speech Recognition)...
    99+
    2023-06-25
  • 基于Python实现语音识别和语音转文字
    目录前言直接使用获取权限1.环境准备2.获取权限代码实现1.获取access_token2.获取转换后音频3.配置接口参数4.完整demo5.执行前言 嗨嗨,大家好呀 ~ 今天给你们...
    99+
    2022-11-11
  • Python中怎么实现语音识别
    今天就跟大家聊聊有关Python中怎么实现语音识别,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。离线转换对于国内的网络环境,无法用google API来将语音数据转换成文本文件,因为...
    99+
    2023-06-16
  • 语音识别实战(python代码)(一)
    语音识别实战   (python :pyttsx、SAPI、SpeechLib实例代码)(一) 本文目录: 一、语音识别的基本原理 (1)、语音识别的起源与发展 (2)、语音识别的基本原理 (3)、语音识别过程 (4)、语音识别的近期发展...
    99+
    2023-08-31
    语音识别 人工智能 深度学习 python 开发语言
  • win8语音识别怎么用?win8语音控制使用教程
    不知道win8语音识别怎么用下文将演示win8语音控制使用教程,有了语音识别功能,我们就可以完全抛弃鼠标。想要体验语音控制的朋友请参考下文步骤操作吧~    --启动语音识别功能   首先,用户需要准备一部笔记...
    99+
    2023-06-04
    win8 语音识别 语音控制 教程 语音
  • Python语音识别API实现文字转语音的几种方法
    搜狗(目前好用,免费) def textToAudio_Sougou(message, filePath): # https://ai.so gou.c...
    99+
    2022-11-13
  • Python如何进行语音识别,语音转换功能实现
    Python如何进行语音识别,语音转换功能实现,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。相信大家都非常喜欢那些萝莉音,看那些女装大佬,开一个变声器声音实在是很有诱惑力,下面...
    99+
    2023-06-02
  • 如何使用Python和创建简单语音识别引擎
    如何使用Python和创建简单语音识别引擎,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。语音识别是机器或程序识别口语中的单词和短语并将其转换为机器可读格式的能力。通常,这些...
    99+
    2023-06-16
  • Python迅速掌握语音识别之知识储备篇
    目录概述RNN计算RNN 存在的问题LSTMGRUSeq2seqAttention 模型Teacher Forcing 机制概述 从今天开始我们将开启一个新的深度学习章节, 为大家来...
    99+
    2022-11-12
  • Python调用百度api实现语音识别详解
    最近在学习python,做一些python练习题 github上几年前的练习题 有一题是这样的: 使用 Python 实现:对着电脑吼一声,自动打开浏览器中的默认网站。 例如,对着笔...
    99+
    2022-11-12
  • Python调用百度api怎么实现语音识别
    Python调用百度api怎么实现语音识别,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。最近在学习python,做一些python练习题github上几年前的练习题有一题是这样...
    99+
    2023-06-21
  • Linux下怎么用python实现语音识别功能
    这篇文章主要介绍“Linux下怎么用python实现语音识别功能”,在日常操作中,相信很多人在Linux下怎么用python实现语音识别功能问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Linux下怎么用py...
    99+
    2023-07-05
  • Android使用百度语音识别的示例代码
    本文使用百度语音识别,完成语音识别的功能,使用百度语音识别,先要申请APP ID,这个直接到百度网站上有说明文档,本文不再赘述。申请之后,下载SDK包,按照百度官网要求,合并l...
    99+
    2022-06-06
    示例 语音识别 Android
  • 亚马逊语音识别怎么用
    以下是AIV的使用方法: 连接到Amazon Sphere或AWS上的Amazon Voice Recognition服务。 在您的设备上启动Amazon Voice Recognition服务,然后输入您的手机号码或访问Amazon ...
    99+
    2023-10-27
    亚马逊 语音识别
  • win10系统如何使用语音识别功能
    这篇文章主要介绍了win10系统如何使用语音识别功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、右键点击开始菜单,在弹出的菜单中,选择“控制面板”。二、在控制面板中,以...
    99+
    2023-06-28
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作