최근 실험에서 Anthropic은 AI 에이전트가 구매자와 판매자를 모두 대표하여 실제 상품과 실제 돈으로 실제 거래를 하는 기밀 시장을 만들었습니다.
회사에서 인정함 그가 프로젝트 딜(Project Deal)이라고 부르는 이 테스트는 동료로부터 물건을 구매하기 위해 100달러(기프트 카드를 통해 지불)의 예산을 받은 69명의 Anthropic 직원을 대상으로 한 “직접 선택한 참가자 그룹을 대상으로 한 파일럿 실험”이었습니다.
그러나 Anthropic은 총 4,000달러 이상의 가치가 있는 186건의 거래가 성사되어 “Project Deal이 얼마나 잘 작동했는지에 놀랐습니다”라고 말했습니다.
회사는 실제로 서로 다른 모델을 사용하여 4개의 별도 시장을 관리했다고 말했습니다. 하나는 “실제”(모든 사람이 회사의 가장 진보된 모델로 대표되고 실험 후 실제로 계약이 이행된 상태)이고 다른 3개는 연구용입니다.
분명히 사용자가 고급 모델로 표현되면 “객관적으로 더 나은 결과”를 얻을 수 있다고 Anthropic은 말했습니다. 그러나 사용자들은 이러한 차이를 인식하지 못하는 것 같았고, “‘에이전트 품질’에 격차”가 있어 “패배한 쪽의 사람들이 자신의 처지가 더 나쁘다는 사실을 깨닫지 못할 수도 있다”는 가능성이 제기되었습니다.
더욱이, 대리인에게 주어진 초기 지시는 판매 가능성이나 협상된 가격에 영향을 미치지 않는 것으로 보입니다.