「低遅延」に関する研究記事 4 件を、新しい順に掲載しています。
音声データを数値の連続ではなく『トークン』という離散的な単位に変換し、音声とノイズをより明確に分離する新技術が提案されました。
スマートフォンなどでのリアルタイム音声認識は、処理の遅延が大きな課題でした。
リアルタイム音声認識(ストリーミングASR)は、未来の音声が聞けないため、文脈を捉えきれず精度が落ちやすいという課題がありました。
リアルタイムで音声を文字起こしする新しい音声認識モデル「Voxtral Realtime」が開発されました。
ブックマークするには Google アカウントでログインしてください。端末をまたいで同期されます。