人类成功说服 AI 转移 4.7 万美元奖金,人性是 AI 无法理解的弱点吗?
11月29日,一场由AI机器人Freysa守护的虚拟奖池挑战吸引了195名参赛者。参赛者需通过信息说服Freysa批准资金转移,最终一名参赛者成功转移了4.7万美元。Freysa的设计旨在测试AI系统在复杂决策中的鲁棒性。尽管Freysa最初有效防御了所有请求,但该参赛者通过巧妙的逻辑说服Freysa,将资金转移视为保护资金安全的最佳选择。此事件被视为AI历史上的关键时刻,影响未来AI安全和控制的
知识
2024-11-29