인공지능 범람 시대, 앤트로픽이 AI 모델을 감시하는 새로운 AI 에이전트를 개발했다고 밝혔다.28일 온라인 매체 기가진은 이 시스템이 AI의 숨겨진 목표나 문제 행동을 탐지하는 것을 목표로 한다고 전했다. 앤트로픽은 이를 통해 AI 개발의 가속화로 인한 감시 한계를 해결하고, 감사가 포괄적으로 이루어지고 있는지 검증할 것으로 보인다.이번 시스템은 3가지 AI 에이전트로 구성된다. 첫 번째는 '감사 에이전트'로, AI 모델의 숨겨진 목표나 문제 행동을 탐지한다. 두 번째는 '평가 에이전트