“永久免费” “顶级AI技术”【语音转文字】—“翻译” “转写” “语音识别” —Whisper AI

作者: siediyer 分类: django,python 发布时间: 2024-02-02 01:28

在11月7号的openAI开发者大会上,openAI宣布了whisper的升级版本whisper V3,相较之前的版本,whisper V3对非英语语言的处理能力得到了极大的增强提高。 OpenAI的whisper是一个通用的语音识别模型,它可以将语音转换成文字。 它是基于一个大规模的多语言和多任务的监督数据集训练的,能够处理不同的口音、背景噪音和专业术语。 它也是一个多任务模型,可以进行多语言语音识别、语音翻译和语言识别。

Google Colaboratory部署使用Whisper, Google Colab是一个完全免费的python程序运行应用,我们通过浏览器就能免费使用google 提供的高算力gpu和tpu,无需任何环境配置,运行大部分的人工智能软件应用。 Colab Whisper 代码:

第一行:

!pip install git+https://github.com/openai/whisper.git

!sudo apt update && sudo apt install ffmpeg

第二行:

!whisper "文件名(需要替换).mp3" --model medium

语音识别后,直接翻译为英文:

!whisper "01.mp3" --model medium --task translate

使用最新的Whisper v3模型

!whisper "文件名(需要替换).mp3" --model large-v3
ffmpeg -i input_video.mp4 output_audio.mp3

 

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

Title - Artist
0:00