인공지능의 정확도가 높아지면서 챗GPT, 코파일럿, 제미나이 등 일상적인 대화에서도 불편함 없이 사용할 수 있는 AI 챗봇이 속속 등장하고 있다.28일 온라인 매체 기가진에 따르면, 이 가운데 월스트리트저널이 인공지능 챗봇 5종을 대상으로 일상 대화에 대한 응답을 비교한 결과를 공개했다. AI 기업이나 연구자들은 AI의 성능을 홍보할 때 벤치마킹 도구를 사용한 측정 점수를 종종 인용한다. 그러나 벤치마크 테스트 점수가 좋다고 해서 일상적인 대화에서 나오는 질문에 정확하게