Anthropic은 에이전트-딜러 거래를 위한 테스트 시장을 만들었습니다.

최근 실험에서 Anthropic은 AI 에이전트가 구매자와 판매자를 모두 대표하여 실제 상품과 실제 돈으로 실제 거래를 하는 기밀 시장을 만들었습니다.

회사에서 인정함 그가 프로젝트 딜(Project Deal)이라고 부르는 이 테스트는 동료로부터 물건을 구매하기 위해 100달러(기프트 카드를 통해 지불)의 예산을 받은 69명의 Anthropic 직원을 대상으로 한 “직접 선택한 참가자 그룹을 대상으로 한 파일럿 실험”이었습니다.

그러나 Anthropic은 총 4,000달러 이상의 가치가 있는 186건의 거래가 성사되어 “Project Deal이 얼마나 잘 작동했는지에 놀랐습니다”라고 말했습니다.

회사는 실제로 서로 다른 모델을 사용하여 4개의 별도 시장을 관리했다고 말했습니다. 하나는 “실제”(모든 사람이 회사의 가장 진보된 모델로 대표되고 실험 후 실제로 계약이 이행된 상태)이고 다른 3개는 연구용입니다.

분명히 사용자가 고급 모델로 표현되면 “객관적으로 더 나은 결과”를 얻을 수 있다고 Anthropic은 말했습니다. 그러나 사용자들은 이러한 차이를 인식하지 못하는 것 같았고, “‘에이전트 품질’에 격차”가 있어 “패배한 쪽의 사람들이 자신의 처지가 더 나쁘다는 사실을 깨닫지 못할 수도 있다”는 가능성이 제기되었습니다.

더욱이, 대리인에게 주어진 초기 지시는 판매 가능성이나 협상된 가격에 영향을 미치지 않는 것으로 보입니다.

Post Views: 38