カテゴリー: AI安全性
- 大規模モデルの「闇落ち」スイッチ!Anthropicチームの新作:大規模モデルの人格変数がついに人類に発見される!ペルソナドリフトツールチェーンを提案し、モデルを狂わせるブラックボックスを最終的に解明
- AIの「二重人格」が露見、OpenAIの最新研究でAIの「善悪スイッチ」を発見、ワンクリックでダークサイドへ切り替え可能に
- AIが自らネットワーク管理者となり、安全な「アハ体験」を実現し、リスク率を9.6%削減
- Sakana AIの新研究:自己符号化改善と自己参照的オープンエンド進化能力を持つダーウィン-ゲーデルマシンの誕生
- マルチモーダル大規模モデルが軒並み失敗、GPT-4oの安全合格率はわずか50%:SIUOがクロスモーダルな安全盲点を明らかに
- 10年の苦心も実らず、数千万の費用が無駄に!AIブラックボックスは未解決、Googleは面目を潰す
- チューリング賞受賞者、「AIのゴッドファーザー」ヒントン:超知能が覚醒する時、人類は制御不能になるかもしれない
- AGI競争は制御不能へ?MIT:最強の監視下でも制御不能確率は48%超、完全制御不能リスクは90%超!
- 大規模言語モデルは、決して汎用人工知能への終着点ではない!