音声処理・プライバシー保護AIの最新研究を AI で解析し、わかりやすくまとめた記事です。
条件に一致する記事が見つかりません。
音声ディープフェイク(偽の合成音声)を見抜く AI に対して、「なぜ偽物と判断したのか」を人間に分かる言葉で説明させる枠組みを提案した研究です。
悪意ある参加者が動的に攻撃戦略を変える状況でも、信頼できる少数の参照クライアントを手がかりに「悪意ある勾配」を識別し、できる限り多くの「善意の勾配」を集約に残す新しい連合学習の集約手法 EnCAgg を提案した研究です。
Apple が 2016 年から掲げてきた「差分プライバシーで端末データを保護している」という主張を、研究者が公開バイナリの解析によって独立検証しました。
プライバシー規制に応えるため、学習済みモデルから特定データの影響だけを取り除く「機械学習の忘却」を、連合学習の文脈で扱った研究です。
連合学習は端末からデータを出さずに学習できる一方、「全体最適なモデル」と「各端末に特化したモデル」を両立しにくいという根本的な課題を抱えています。
グラフを使ったコミュニティ推定で、「人(ノード)ごと」にプライバシーを守る強い保証を満たしつつ、現実的な計算量で動くアルゴリズムを提案しています。
研究費助成や論文採択などで使われる「部分抽選(partial lottery)」は、評価スコアがわずかに変わるだけで当選確率が大きくぶれてしまう不安定さを抱えています。
IoT 機器の侵入検知(IDS)は通常データをサーバへ集めますが、それ自体がプライバシーリスクとなります。
Web3 の大型被害の多くは、スマートコントラクトの脆弱性ではなく、組織のプロセスや人を介した運用フローの不備から生じていると本論文は指摘します。
従来の局所差分プライバシーは全方向に一律でノイズを足すため、データの使い勝手が大きく落ちる課題がありました。
多数の端末に分散したデータを集めずに学習する「連合学習」で、プライバシーを守りながらどこまで精度を高められるかという理論的な限界が示されました。
準同型暗号を使った暗号化制御システムは、暗号の「展性」という性質により、データの秘匿性は保てても改ざん防止(完全性)には脆弱であることが理論的に示されました。
AIモデルのプライバシー保護レベルを、モデルを再学習させることなく事後的に検証できるフレームワーク「Zero-Run」が提案されました。
音声認識モデルWhisperに話者ラベル付きのテキストを「お手本」として渡すだけで、誰が話したかを区別しながら文字起こしできることがわかりました。
「誰の声か」と「何を言ったか」を同時に確認するテキスト依存型話者照合で、最小検出コスト 0.0461・等価エラー率 1.3% という高精度を達成しました。
音声認識で広く使われるWhisperのエンコーダを、環境音や音楽も理解できるように再学習させた「Whisper-AuT」が提案されました。
複数の端末でAIモデルを共同学習する「連合学習」において、悪意ある参加者の妨害とプライバシー漏洩の両方に同時に対処する新しいアルゴリズムを提案しました。
暗号通信の土台となる「擬似ランダム関数(PRF)」の一種であるLegendre PRFを、従来より広い数学的条件(拡大体)で使った場合の安全性を初めて体系的に分析しました。
AIモデルを微調整(ファインチューニング)した際に、悪意ある変更が紛れ込んでいないかを暗号技術で証明する新しい枠組み「ファインチューニング完全性(FTI)」が提案されました。
人間の自然な「言い直し」「言い淀み」を含む音声で音声AIを評価する新しいベンチマークが提案されました。
データを暗号化したままAIに推論させる「完全準同型暗号(FHE)」の非線形処理を、GPUで最大17倍高速化するフレームワーク TIGER が提案されました。
運動直後の息切れや途切れを含む音声に対して、主要な音声認識モデルの精度がどれだけ低下するかを体系的に検証した研究です。
連合学習で個人情報を守るためのノイズ量を、各端末のプライバシー設定に応じて自動で最適化する手法(PAC-DP)が提案されました。
データを暗号化したまま計算できる「準同型暗号」の処理コストを、行列の並び替え最適化により平均5.5倍削減する手法を提案しました。
ブックマークするには Google アカウントでログインしてください。端末をまたいで同期されます。