「ファインチューニング」に関する研究記事 3 件を、新しい順に掲載しています。
音声認識モデルWhisperに話者ラベル付きのテキストを「お手本」として渡すだけで、誰が話したかを区別しながら文字起こしできることがわかりました。
運動直後の息切れや途切れを含む音声に対して、主要な音声認識モデルの精度がどれだけ低下するかを体系的に検証した研究です。
従来のAI文章生成は、主に「次に来る最も可能性の高い単語」を予測することに特化していました。
ブックマークするには Google アカウントでログインしてください。端末をまたいで同期されます。