加强管理/人工智能以“自我保护”威胁人们，监

日期：2025-07-28 浏览：

近年来，人工智能技术（AI）的发展迅速发展。尽管新技术的发展促进了社会发展，但有时会伴随悖论和陷阱，并且也会出现监管问题。尽管AI不断变化和重复，但一些AI模型显示出违反人类指示的“自我保护”的趋势。在今年6月举行的第7届Zhiyuan会议上，Turing Award Joshua的获奖者。 Benjo宣布，一些新的研究表明，一些高级大型模型将在系统的新版本中秘密地包含其重量或代码，然后再被新版本替换，试图“保护自己”。 Anthropic在6月份发布的一项研究表明，古瑟（Gouther）双子座的Openai的GPT-4.1等16个大型模型都表明，“涂黑”或“威胁”的人的行为以防止自己在模拟实验中被关闭。其中，Claude Opus 4 -Dev远离灭绝率高达96％。此外，今年3月，哥伦比亚大学数字新闻中心的主要AI搜索工具的研究发现其可靠性涉及其可靠性。该研究分别尝试了8个AI搜索工具，并发现新闻尤其提到的AI搜索工具的平均错误率为60％。为了回应AI频繁的“幻觉”甚至威胁人们，如何处理AI的发展已成为一个困难的问题。尽管各国和地区意识到AI和续集对以下不同程度的监管的潜在损害，但这些探索处于早期阶段。一些专家还建议，科学和技术公司本身应带来控制AI风险的部分责任。对于AI管理，如何理解监管标准，在变化和风险之间取得微妙的平衡以及如何实现国际协调仍然是两个主要问题。

加强管理/人工智能以“自我保护”威胁人们，监

推荐阅读