音声AI論文研究室

「ファインチューニング」の研究記事

「ファインチューニング」に関する研究記事 3 件を、新しい順に掲載しています。

Whisperに「話者ラベル付きプロンプト」を与えるだけで、文字起こしと話者分離を同時にこなせるか？

音声認識モデルWhisperに話者ラベル付きのテキストを「お手本」として渡すだけで、誰が話したかを区別しながら文字起こしできることがわかりました。

Whisper 話者分離音声認識

2026年5月16日公開

運動直後の息切れした声を、音声AIはどこまで正しく聞き取れるのか？

運動直後の息切れや途切れを含む音声に対して、主要な音声認識モデルの精度がどれだけ低下するかを体系的に検証した研究です。

音声認識運動後音声ロバスト性

2026年4月7日公開

次の単語を当てるだけじゃない。文章全体の「らしさ」を学習する新手法EBFT

従来のAI文章生成は、主に「次に来る最も可能性の高い単語」を予測することに特化していました。

大規模言語モデルファインチューニング自然言語生成

2026年3月14日公開