“永久免费” “顶级AI技术”【语音转文字】—“翻译” “转写” “语音识别” —Whisper AI
在11月7号的openAI开发者大会上,openAI宣布了whisper的升级版本whisper V3,相较之前的版本,whisper V3对非英语语言的处理能力得到了极大的增强提高。 OpenAI的whisper是一个通用的语音识别模型,它可以将语音转换成文字。 它是基于一个大规模的多语言和多任务的监督数据集训练的,能够处理不同的口音、背景噪音和专业术语。 它也是一个多任务模型,可以进行多语言语音识别、语音翻译和语言识别。
Google Colaboratory部署使用Whisper, Google Colab是一个完全免费的python程序运行应用,我们通过浏览器就能免费使用google 提供的高算力gpu和tpu,无需任何环境配置,运行大部分的人工智能软件应用。 Colab Whisper 代码:
第一行:
!pip install git+https://github.com/openai/whisper.git !sudo apt update && sudo apt install ffmpeg
第二行:
!whisper "文件名(需要替换).mp3" --model medium
语音识别后,直接翻译为英文:
!whisper "01.mp3" --model medium --task translate
使用最新的Whisper v3模型
!whisper "文件名(需要替换).mp3" --model large-v3
ffmpeg -i input_video.mp4 output_audio.mp3