研究記事一覧 | 音声AI論文研究室

音声ディープフェイク（偽の合成音声）を見抜く AI に対して、「なぜ偽物と判断したのか」を人間に分かる言葉で説明させる枠組みを提案した研究です。

音声ディープフェイク検出説明可能AI マルチモーダルLLM

2026年6月17日公開

機械学習

2026年

「悪意ある勾配」を見抜き、「善意の外れ値」を救う：連合学習の頑健な集約手法 EnCAgg

悪意ある参加者が動的に攻撃戦略を変える状況でも、信頼できる少数の参照クライアントを手がかりに「悪意ある勾配」を識別し、できる限り多くの「善意の勾配」を集約に残す新しい連合学習の集約手法 EnCAgg を提案した研究です。

「差分プライバシーで守られています」は本当か：Apple の DP 実装を監査した研究

Apple が 2016 年から掲げてきた「差分プライバシーで端末データを保護している」という主張を、研究者が公開バイナリの解析によって独立検証しました。

差分プライバシープライバシー監査セキュア集約

2026年5月21日公開

プライバシー・セキュリティ

2026年

「忘れてほしい」を高速に叶える：連合学習からデータの影響だけを外す技術

プライバシー規制に応えるため、学習済みモデルから特定データの影響だけを取り除く「機械学習の忘却」を、連合学習の文脈で扱った研究です。

「みんなのモデル」と「あなた専用のモデル」を両立する：FedCoE が示す連合学習の新しい設計

連合学習は端末からデータを出さずに学習できる一方、「全体最適なモデル」と「各端末に特化したモデル」を両立しにくいという根本的な課題を抱えています。

連合学習 Mixture-of-Experts プライバシー保護

2026年5月21日公開

プライバシー・セキュリティ

2026年

「人ごと」にプライバシーを守りながらコミュニティを推定する：ノード差分プライバシーと確率ブロックモデル

グラフを使ったコミュニティ推定で、「人（ノード）ごと」にプライバシーを守る強い保証を満たしつつ、現実的な計算量で動くアルゴリズムを提案しています。

差分プライバシーノードプライバシーグラフ解析

2026年5月21日公開

機械学習

2026年

「ほんのわずかな差」で運命が変わらない選び方：滑らかな抽選設計が問いかける、ノイズと公平性の新しいバランス

研究費助成や論文採択などで使われる「部分抽選（partial lottery）」は、評価スコアがわずかに変わるだけで当選確率が大きくぶれてしまう不安定さを抱えています。

「データを集めずに守る」侵入検知：連合学習と SHAP で IoT を可視化する研究

IoT 機器の侵入検知（IDS）は通常データをサーバへ集めますが、それ自体がプライバシーリスクとなります。

鍵管理と承認プロセスが守りの要 — Web3 インシデントから学ぶ組織的セキュリティの教訓

Web3 の大型被害の多くは、スマートコントラクトの脆弱性ではなく、組織のプロセスや人を介した運用フローの不備から生じていると本論文は指摘します。

情報セキュリティ暗号鍵管理 Human-in-the-Loop

2026年5月19日公開

プライバシー・セキュリティ

2026年

ノイズを「賢く」配る差分プライバシー：タスクに効く方向だけノイズを薄くする新手法

従来の局所差分プライバシーは全方向に一律でノイズを足すため、データの使い勝手が大きく落ちる課題がありました。

局所差分プライバシープライバシー保護データ有用性

2026年5月19日公開

機械学習

2026年

プライバシーを守りながら賢く学ぶ：連合学習の理論的な限界と効率的アルゴリズム

多数の端末に分散したデータを集めずに学習する「連合学習」で、プライバシーを守りながらどこまで精度を高められるかという理論的な限界が示されました。

暗号化すれば安全？準同型暗号の「展性」が生む意外な脆弱性

準同型暗号を使った暗号化制御システムは、暗号の「展性」という性質により、データの秘匿性は保てても改ざん防止（完全性）には脆弱であることが理論的に示されました。

準同型暗号暗号化制御ネットワーク制御システム

2026年5月16日公開

プライバシー・セキュリティ

2026年

再学習ゼロでAIのプライバシーを監査する――Zero-Run Privacy Auditing の提案

AIモデルのプライバシー保護レベルを、モデルを再学習させることなく事後的に検証できるフレームワーク「Zero-Run」が提案されました。

差分プライバシープライバシー監査メンバーシップ推論

2026年5月16日公開

音声処理

2026年

Whisperに「話者ラベル付きプロンプト」を与えるだけで、文字起こしと話者分離を同時にこなせるか？

音声認識モデルWhisperに話者ラベル付きのテキストを「お手本」として渡すだけで、誰が話したかを区別しながら文字起こしできることがわかりました。

「声」と「合言葉」で本人確認 ― テキスト依存型話者照合の軽量アンサンブル手法

「誰の声か」と「何を言ったか」を同時に確認するテキスト依存型話者照合で、最小検出コスト 0.0461・等価エラー率 1.3% という高精度を達成しました。

話者照合テキスト依存型検証アンサンブル学習

2026年5月16日公開

音声信号処理

2026年

音声だけじゃない――Whisperを環境音・音楽にも強くする「Whisper-AuT」の試み

音声認識で広く使われるWhisperのエンコーダを、環境音や音楽も理解できるように再学習させた「Whisper-AuT」が提案されました。

音声エンコーダ Whisper ドメイン適応

2026年4月19日公開

プライバシー・セキュリティ

2026年

悪意ある参加者がいても、プライバシーを守りながら学習できる？連合学習の新アルゴリズム

複数の端末でAIモデルを共同学習する「連合学習」において、悪意ある参加者の妨害とプライバシー漏洩の両方に同時に対処する新しいアルゴリズムを提案しました。

暗号の「鍵」はどこまで安全か？ ── Legendre擬似ランダム関数の拡大体における安全性分析

暗号通信の土台となる「擬似ランダム関数（PRF）」の一種であるLegendre PRFを、従来より広い数学的条件（拡大体）で使った場合の安全性を初めて体系的に分析しました。

AIモデルの『改造』が安全かどうかを数学的に証明する ― ファインチューニング完全性という新しいセキュリティ目標

AIモデルを微調整（ファインチューニング）した際に、悪意ある変更が紛れ込んでいないかを暗号技術で証明する新しい枠組み「ファインチューニング完全性（FTI）」が提案されました。

ファインチューニング完全性ゼロ知識証明モデルセキュリティ

2026年4月7日公開

音声処理

2026年

音声AIは「言い直し」や「割り込み」にどこまで対応できるのか？——リアルな会話を再現するベンチマークが明かす現在地

人間の自然な「言い直し」「言い淀み」を含む音声で音声AIを評価する新しいベンチマークが提案されました。

暗号化したまま推論できる未来へ――GPU加速で完全準同型暗号LLMが現実に近づく

データを暗号化したままAIに推論させる「完全準同型暗号（FHE）」の非線形処理を、GPUで最大17倍高速化するフレームワーク TIGER が提案されました。

完全準同型暗号プライバシー保護推論 GPU最適化

2026年4月7日公開

音声処理

2026年

運動直後の息切れした声を、音声AIはどこまで正しく聞き取れるのか？

運動直後の息切れや途切れを含む音声に対して、主要な音声認識モデルの精度がどれだけ低下するかを体系的に検証した研究です。

プライバシー予算に応じてノイズ量を自動調整――連合学習の精度を最大26%改善する適応クリッピング手法

連合学習で個人情報を守るためのノイズ量を、各端末のプライバシー設定に応じて自動で最適化する手法（PAC-DP）が提案されました。

暗号化したまま計算する技術を高速化――疎行列の「詰め替え」が拓くプライバシー保護の未来

データを暗号化したまま計算できる「準同型暗号」の処理コストを、行列の並び替え最適化により平均5.5倍削減する手法を提案しました。

準同型暗号疎行列計算プライバシー保護

2026年4月7日公開

研究記事

AIの「なぜ偽物と判断したか」を言葉で説明する：音声ディープフェイク検出に根拠ある説明を与える試み

「悪意ある勾配」を見抜き、「善意の外れ値」を救う：連合学習の頑健な集約手法 EnCAgg

「差分プライバシーで守られています」は本当か：Apple の DP 実装を監査した研究

「忘れてほしい」を高速に叶える：連合学習からデータの影響だけを外す技術

「みんなのモデル」と「あなた専用のモデル」を両立する：FedCoE が示す連合学習の新しい設計

「人ごと」にプライバシーを守りながらコミュニティを推定する：ノード差分プライバシーと確率ブロックモデル

「ほんのわずかな差」で運命が変わらない選び方：滑らかな抽選設計が問いかける、ノイズと公平性の新しいバランス

「データを集めずに守る」侵入検知：連合学習と SHAP で IoT を可視化する研究

鍵管理と承認プロセスが守りの要 — Web3 インシデントから学ぶ組織的セキュリティの教訓

ノイズを「賢く」配る差分プライバシー：タスクに効く方向だけノイズを薄くする新手法

プライバシーを守りながら賢く学ぶ：連合学習の理論的な限界と効率的アルゴリズム

暗号化すれば安全？ 準同型暗号の「展性」が生む意外な脆弱性

再学習ゼロでAIのプライバシーを監査する――Zero-Run Privacy Auditing の提案

Whisperに「話者ラベル付きプロンプト」を与えるだけで、文字起こしと話者分離を同時にこなせるか？

「声」と「合言葉」で本人確認 ― テキスト依存型話者照合の軽量アンサンブル手法

音声だけじゃない――Whisperを環境音・音楽にも強くする「Whisper-AuT」の試み

悪意ある参加者がいても、プライバシーを守りながら学習できる？連合学習の新アルゴリズム

暗号の「鍵」はどこまで安全か？ ── Legendre擬似ランダム関数の拡大体における安全性分析

AIモデルの『改造』が安全かどうかを数学的に証明する ― ファインチューニング完全性という新しいセキュリティ目標

音声AIは「言い直し」や「割り込み」にどこまで対応できるのか？——リアルな会話を再現するベンチマークが明かす現在地

暗号化したまま推論できる未来へ――GPU加速で完全準同型暗号LLMが現実に近づく

運動直後の息切れした声を、音声AIはどこまで正しく聞き取れるのか？

プライバシー予算に応じてノイズ量を自動調整――連合学習の精度を最大26%改善する適応クリッピング手法

暗号化したまま計算する技術を高速化――疎行列の「詰め替え」が拓くプライバシー保護の未来

暗号化すれば安全？準同型暗号の「展性」が生む意外な脆弱性