“永久免费” “顶级AI技术”【语音转文字】—“翻译” “转写” “语音识别” —Whisper AI

作者: siediyer 分类: django,python 发布时间: 2024-02-02 01:28

在11月7号的openAI开发者大会上，openAI宣布了whisper的升级版本whisper V3，相较之前的版本，whisper V3对非英语语言的处理能力得到了极大的增强提高。 OpenAI的whisper是一个通用的语音识别模型，它可以将语音转换成文字。它是基于一个大规模的多语言和多任务的监督数据集训练的，能够处理不同的口音、背景噪音和专业术语。它也是一个多任务模型，可以进行多语言语音识别、语音翻译和语言识别。

Google Colaboratory部署使用Whisper, Google Colab是一个完全免费的python程序运行应用，我们通过浏览器就能免费使用google 提供的高算力gpu和tpu，无需任何环境配置，运行大部分的人工智能软件应用。 Colab Whisper 代码：

第一行：

!pip install git+https://github.com/openai/whisper.git

!sudo apt update && sudo apt install ffmpeg

第二行：

!whisper "文件名（需要替换）.mp3" --model medium

语音识别后，直接翻译为英文：

!whisper "01.mp3" --model medium --task translate

使用最新的Whisper v3模型

!whisper "文件名（需要替换）.mp3" --model large-v3

ffmpeg -i input_video.mp4 output_audio.mp3

AI Whisper 翻译

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！