Whisper

7个月前发布 49 0 0

Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

语言:
zh,en
收录时间:
2025-01-19
WhisperWhisper
Whisper

该项目的核心优势、应用场景和相关项目如下:
– **核心优势**:Whisper是一个自动语音识别(ASR)系统它在680,000小时的多语言和多任务监督数据上进行了训练这些数据是从网络上收集的。使用如此庞大和多样化的数据集可以提高对口音、背景噪声和技术语言的鲁棒性。此外它还支持多种语言的转录以及从这些语言到英语的翻译。
– **应用场景**:Whisper的高精度和易用性将允许开发人员为更广泛的应用程序添加语音界面。
– **相关项目**:
– **SpeechStew**:简单地混合所有可用的语音识别数据来训练一个大型神经网络。
– **The people’s speech**:一个大规模的多样化英语语音识别数据集用于商业用途。
– **Gigaspeech**:一个不断发展的、多领域的ASR语料库包含10,000小时的转录音频。
– **wav2vec 2.0**:一个用于自监督学习语音表示的框架。
– **Unsupervised speech recognition**:无监督语音识别。
– **BigSSL**:探索大规模半监督学习在自动语音识别中的前沿。

数据统计

相关导航