AI 도구 도입에 관한 리더십 결정은 종종 속도, 타당성 또는 투자 수익률(ROI)을 중심으로 구성됩니다. 하지만 그것들이 올바른 출발점은 아닙니다. 가장 중요한 것은 책임감, 책임감, 그리고 사람들이 우리에게 주는 신뢰를 관리하는 것입니다. AI가 모든 문제의 기본 해결책이 되어서는 안 됩니다. 근본적인 함의를 이해하지 못한 채 적용하면, 특히 AI가 생성한 결과가 사람들의 미래에 실질적인 영향을 미칠 때 위험이 더 클 수 있습니다. 그런 맥락에서 리더십은 AI에 '아니오'라고 말하는 것도, 주저함 없이 '예'라고 말하는 것도 아닙니다. 대규모로 유지될 수 있는 명확하고 규율된 '예'를 정의하는 것이 중요합니다.
신뢰 테스트
지금 모든 리더에게 주는 압박은 빠르게 움직여야 한다는 것입니다. 모델을 배송하세요. 요원을 발사해. 모든 것을 개인화하세요. 하지만 대중은 주목하고 있으며, 어떤 대가를 치르더라도 속도를 중시하는 편이 아닙니다. 2025년 KPMG와 멜버른 대학교가 47개국 48,000명 이상을 대상으로 조사한 연구에 따르면, AI 사용은 증가하고 있지만 신뢰가 핵심 문제이며 대중은 더 강력한 거버넌스를 원한다고 밝혔습니다. 2025년 12월 YouGov 설문조사는 좀 더 직설적으로 말했습니다: 미국인의 68%가 특정 인간의 승인 없이는 AI 시스템이 행동하도록 허용하지 않을 것이라고 답했습니다.
ETS가 운영되는 교육 평가에서는 고위험 시험의 단 한 점이 학습자의 전체 경력을 좌우할 수 있습니다. 우리 분야에서 AI를 잘못 활용하는 비용은 사용자 불만이 아니라 잃어버린 기회로 측정됩니다.
올바른 선택은 속도를 늦추는 것, 즉 이 순간의 리더십은 AI 기반 혁신에 '아니오'라고 말하는 것이라고 결론짓기 쉽습니다. 저는 동의하지 않습니다. 리더로서 우리의 역할은 AI가 어디에 가치를 더하는지 정의하고, 책임감 있게 사용할 수 있는 조건을 마련하며, 신뢰를 희생하지 않고 자신감 있게 더 빠르게 움직이는 것입니다.
AI 리더십이 실제로 어떤 모습인지는
ETS에서는 AI에 '예'라고 말할 수 있다는 자신감이 그 주변에 두는 안전장치에서 나옵니다. 우리는 2000년대 초반부터 AI와 자연어 처리를 사용해 왔으며, 그 시작은 에세이 채점이나 음성 응답 같은 응용 분야였습니다. 연말까지 테스트 문항의 거의 90%가 내부 AI 엔진에 의해 생성될 것입니다. 하지만 그 모든 아이템에는 우리가 절대 제거하지 않을 인간 체크포인트가 있습니다. 그리고 AI 점수와 인간 점수가 의미 있게 차이가 날 때, 인간이 승리하여 미래를 위한 모델에 대한 추가 검토와 개선을 촉진합니다.
시험 문제가 학습자에게 전달되기 전에 공정성과 접근성 검토를 거칩니다. 배송 후에는 모든 주요 제품에 대해 심리측정 프로그램 감사를 실시하여 하위 그룹 간 체계적인 차이를 찾습니다. 우리는 단일 공급업체의 도구가 아닌 AI 모델을 하나의 집합체로 사용하며, 어느 시스템의 사각지대가 우리에게 전락하지 않도록 합니다. 또한 전 세계 시험 응시자들의 TOEFL 연설 샘플을 포함한 독점적이고 국제적으로 다양한 데이터를 기성 모델의 좁은 범위에 대한 검증 수단으로 활용합니다.
ETS는 공정한 평가 기준에 관한 책을 썼고, AI의 등장이 기준을 낮추지는 않습니다. 이 정도면 상당히 높아집니다. 예전에는 3년에 한 번씩 주요 프로그램을 감사했지만, 이제는 AI가 개입할 때 더 자주 확인합니다. 예전에는 훈련된 인간 심사자들이 기준을 올바르게 적용한다고 가정했지만, 이제는 과정 중간에 명시적인 점검을 도입하고 있습니다. 어떤 분야에서는 AI가 제기하는 질문들이 10년 전에는 존재하지 않았기 때문에 완전히 새로운 표준을 만들고 있습니다.
도메인 전문성이 깊은 회사에서 일하는 장점 중 하나는 처음부터 이를 적용한다는 점입니다. 수십 년 동안 우리는 편향, 저작권, 공정성, 사실 정확성 등 다양한 부분을 엄격히 점검해왔습니다. ETS의 AI 역량은 77년의 경험과 검증된 지적 재산권을 기반으로 구축되었습니다. AI 모델과 결합되어 이 기반이 새로운 상품을 구동하고 고객과의 신뢰를 뒷받침합니다.
앞으로의 도전
더 근본적으로, 현재 비즈니스에서 AI에 대한 가장 큰 오해는 목표를 사람을 대체하는 것이라는 점입니다. 인간을 보강하고 더 많은 일을 하도록 돕는 것이 정말 중요해요. 진짜 기회는 새로운 가치를 창출하고, 사람들이 더 어려운 문제를 해결할 수 있도록 해방시키며, 시간이 지남에 따라 더 많은 일을 할 수 있도록 신뢰를 얻는 것입니다. 그 길은 더 느리고, 현실과의 접촉을 견디는 유일한 길입니다.
그게 바로 일입니다. AI 모델이 더 강력해질수록, 고위험 환경이 요구하는 규율, 측정 과학, 인간의 판단력을 바탕으로 적용하는 것이 더욱 중요해집니다. 더 강력한 모델과 공정성, 타당성, 일관성에 대한 더 강한 기준이 결합될 때, 우리는 단순히 더 빠르게 움직이는 것 이상의 것을 할 수 있습니다. 가능한 것을 확장하고, 사람들이 의존하는 시스템에 대한 신뢰를 깊게 하며, 전 세계적으로 우리의 사명이 미치는 긍정적인 영향을 기하급수적으로 증대시킵니다.