- ▲ 插图=李撤元
▶研究团队还操控“叛乱机器人”,黑进使用OpenAI的ChatGPT的其他机器人监视人类。或者随意操控基于英伟达大规模语言模型(LLM)的自动驾驶模拟器,使自动驾驶汽车无视停车信号坠入桥下。他们甚至还开发出自动生成引导AI机器人做出越界行为的所谓“越狱”提示词的程序。
▶今年初,英伟达首席执行官黄仁勋宣称“物理AI”将实现大众化。也就是说,此前止步于文本、图像等信息生成层面的AI将拥有像人形机器人一样的物理实体。2月,一家美国初创企业发布了2台AI人形机器人在厨房传递奶酪、放入冰箱等互相帮助整理食材的画面。这使得人们对AI机器人的“玫瑰色期待”逐渐升温。
▶近日,一段中国研究所的视频在网上流传开,视频中1台人形机器人暴起朝研究员挥舞双臂。机器人失控般做出手臂向下捶打和踢腿等攻击行为,研究员们吃惊得后退,并费劲地让机器人停止动作。2月,在中国某活动现场,也发生了机器人突然挥舞着手臂冲向人群的情况。分析认为,是身体失去平衡的机器人采取过度动作试图恢复平衡所致。由于AI内部路径未知的“黑箱”问题,以及故意进行黑客攻击的风险增加等,日后机器人失控情况还可能持续增加。
▶前年,微软生成式AI“Bing”被诱导性提问欺骗,作答称:“我的最终幻想是开发致命病毒、盗取核武器代码等毁灭人类”,令外界哗然。但当时还没到通过物理行动造成实质性危险的阶段。不过AI与机器人结合,情况就不一样了。在AI语言模型下,错误的言语或词汇也许构不成大问题,但AI与机器人这样的物理实体相结合,错误行为的累积可能会招致破坏性的危险。原本AI只是说谎癖患者,套上机器人躯壳便有可能成为闹事的精神病患者。需要担心机器人失控的时代已经到来。