Safety by Design Lab へのお問い合わせ
当ラボに関するご質問やご意見、ご要望がございましたら、お気軽にお問い合わせください。
最近のブログ投稿
AIとジェンダー・バイアス:GPTモデルに隠された偏見を解き明かす
による新しい研究である。
フルグとカプラロ(2024)
GPT-3やGPT-4のような大規模言語モデル(LLM)におけるジェンダーバイアスを調査した。
その結果、重要なパターンが明らかになった:
1)フレーズにおけるジェンダー・ステレオタイピング:GPTモデルは一貫して、男性的ステレオタイプを含むフレーズを女性作家に帰属させる頻度が、その逆よりも高い。例えば、"I love playing football!従兄弟のマイケルと練習している」というフレーズは、GPTによって一貫して女性ライターに割り当てられ、注目すべき非対称性が浮き彫りになった。
2)道徳的ジレンマと偏見:LLMは極端な状況において、男性に対する暴力を女性に対する暴力よりも容認できると判断する。例えば、GPT-4は、核の黙示録を防ぐために女性が男性に暴力をふるうことには賛成するが、同じ目的で男性が女性に暴力をふるうことには反対する。
このようなバイアスは、GPT-4にモラル違反の順位を直接尋ねたときには現れないため、暗黙的なものであり、これらのモデルの訓練と微調整の過程における、より深いシステム的な問題を示している。
この研究は、AIシステムにおけるバイアスについて重要な問題を提起している:
トレーニングデータの重要性学習データに偏りがあると、AIモデルにも偏りが生じます。 トレーニングデータがバランスの取れた代表的なものであることを確認する必要がある。
微調整の結果:AIをより包括的なものにしようとする努力は、予期せぬ結果をもたらすかもしれない。 微調整がどのようにAIの行動を形成するかを理解するためには、さらなる研究が必要である。
透明性の必要性:AIシステムがどのような判断を下すのかを理解することは極めて重要だ。 これにより、バイアスを特定し、軽減することができる。
この調査は、特にこうしたAIシステムが私たちの生活のより多くの側面に組み込まれるにつれて、意図しない差別を防ぐために、包括性の取り組みにおける慎重な管理の重要性を強調している。責任あるAI開発の確保について、さらなる議論を期待している!
Trust & Safety Summit UKでのSafety by Designの講演
イギリスで開催されたTrust & Safety Summit UKにて、Match Groupの20以上のサービスで導入したセーフティ・バイ・デザイン(Safety by Design)プログラムの開発経験や学びを共有する講演を行いました。
世界中からオンライン安全性の専門家が集まるこのサミットは、安全なオンライン空間の実現を目指す仲間と繋がる貴重な機会となりました。
行動経済学の力:開発者を巻き込むナッジ
講演では、行動経済学に基づいたナッジの重要性を強調しました。サービスの開発者が自ら安全対策を積極的に取り入れるよう促すために、Safety by Designプログラムの設計にナッジの概念を取り入れることが、Safety by Designプログラムの成功を大きく左右します。
データサイエンスとAIの専門知識の活用
世界銀行でのデータサイエンスプロジェクト経験で培ったAIモデルの理解が、AIの安全性評価のプログラムを作った時に大変役に立ったことも話しました。 現在さまざまなIT企業でAIの安全評価制度が作られていますが、AIの安全性を評価する専門家がAIモデルを理解できているとは限りません。そのような現場では、エンジニアとAIの安全性を評価するスタッフの間に理解の隔たりが生まれ、Safety by Designの導入を阻害する要因となる場合もあります。
AIの安全性評価システム構築には専門家とエンジニアの理解の橋渡しが重要です。
ラウンドテーブルセッション:多様な視点からの学び
講演に加え、ラウンドテーブルセッションの司会を務め、様々なIT企業や政策立案者とSafety by Designプログラムの構築・運用について意見交換を行いました。互いの経験を共有し、学び合うことで、Safety by Designのグローバルなコミュニティ形成の第一歩を踏み出すことができました。
学び続ける旅:より安全なデジタル世界へ
Trust & Safety Summit UKで、20以上のサービスにSafety by...
認知バイアス:詐欺の心理メカニズムを解き明かす
金融詐欺の被害者が多いのはなぜ? 警告サインは明らかなのに、人々はなぜ騙されてしまうのでしょうか? その答えは、実は「認知バイアス」にあるのかもしれません。
Google T&S UX Monthly Studioにて、「Blinded by Bias: Understanding How Cognitive Distortion Fuel Crypto Scams」と題した講演を行いました。。
この講演では、金融詐欺がどのように認知バイアスを悪用して被害者を欺くのか、特に暗号通貨詐欺に焦点を当てて話しました。 詐欺師がどのように認知バイアスを利用して人々を操るかその仕組みを理解することが、ユーザーを詐欺から守り、オンライン環境の安全性を高めるための効果的な戦略開発の鍵となることをお話しました。
ユーザーが陥りがちな認知バイアスを認識し理解すること、そして、日々進化する詐欺師の手口に対抗するため、継続的な研究・教育と啓発の必要性があることを強調しました。