수능 AI는 아직 멀었다고요? 그 말은 틀리지 않습니다

STARTUP NOTE

수능 AI는 아직 멀었다고요? 그 말, 틀리지 않습니다. 다만 "어떤 AI를 어떤 구조 안에서 쓰고 있느냐"를 빼면 절반만 맞는 말입니다.

"AI로 수능 공부한다고?" 이 반응은 아주 자연스럽습니다.

무료 ChatGPT에 킬러 문항 하나 넣어봤는데 풀이가 엉망이었다거나, 국어 지문을 넣었더니 핵심은 놓친 채 두루뭉술한 요약만 내놨다거나, 조금만 꼬아 물어보면 자신 있게 틀린 말을 하더라는 경험. 그런 경험이 있다면 결론은 대체로 하나로 모입니다. "수능 AI? 아직 멀었네."

그런데 저는 정반대의 장면도 현장에서 오래 봐 왔습니다. 기숙학원을 10년 넘게 운영하면서, 학생들의 오답과 학습 패턴을 매일 마주해 왔습니다. 결론은 분명합니다. 문제는 "AI냐 아니냐"가 아닙니다. 어떤 AI를, 어떤 구조 안에서 쓰고 있느냐입니다.

무료 범용 챗봇에 수능 문제 하나를 던져 보는 것은, 동네 문방구에서 산 돋보기로 세포를 관찰하려는 것과 비슷합니다. 잘 안 보이는 것이 이상한 일이 아닙니다. 그 도구가 나쁜 것이 아니라, 애초에 그 용도로 설계된 것이 아니기 때문입니다.

수능 특화 AI는 출발점부터 다릅니다

핵심은 단순히 "문제를 맞히느냐"가 아닙니다. 학생이 무엇을 풀었는지, 무엇을 틀렸는지, 어느 문제에서 오래 멈췄는지, 어떤 유형에서 반복적으로 흔들리는지를 누적해서 보고 연결해서 해석하는 구조가 있어야 합니다.

즉, 좋은 수능 AI는 문제를 대신 풀어 주는 기계가 아니라, 학생의 실수 구조를 추적하는 시스템으로 작동합니다.

현장에서 반복해 본 패턴

개념을 몰라서가 아니라, 같은 조건을 계속 놓쳐서 틀린다.
문제를 풀 줄은 아는데, 검증 단계에서 같은 실수를 반복한다.
국어는 독해가 아니라 선지 근거 대조 단계에서 무너진다.

수학 진단 (미적분)

그래프 개형은 정확히 잡는다. 그런데 개형 이후 극값·변곡점 조건을 식으로 연결하는 단계에서 반복적으로 막힌다.

확통 진단

경우를 나누는 기준은 아는데, 중복 계산을 제어하지 못한다.

국어 진단

선지 판단 시 근거 문장을 끝까지 대조하지 않는 패턴이 반복된다.

그리고 여기서 멈추지 않습니다. 틀린 문제를 다시 묶고, 평가원이 자주 쓰는 출제 구조를 찾고, 같은 실수를 점검할 유사 문항까지 연결할 수 있습니다.

범용 챗봇과 수능 특화 AI는 다른 물건입니다

많은 사람들이 "AI는 아직 멀었다"고 말할 때, 실제로는 범용 챗봇의 한계를 이야기하는 경우가 많습니다. 일반 챗봇은 질문이 들어오면 그 순간 대답하는 도구에 가깝습니다. 반면 수능 특화 AI는 학생의 오답, 풀이 기록, 반복 실수, 취약 유형을 누적하면서 다음에 어디서 다시 흔들릴 가능성이 높은지를 읽어내는 쪽에 더 가깝습니다. 저희가 만들어 온 SNarGPT도 그 방향을 목표로 설계되고 있습니다.

한마디로 말하면, 문제를 한 번 푸는 AI와 학생의 실수를 계속 기억하는 AI는 전혀 다른 물건입니다.

그래서 실제로, 무엇이 되고 무엇이 아직 어려운가?

이 부분은 냉정하게 말해야 합니다. AI를 과장해서도 안 되고, 뭉뚱그려 폄하해서도 안 됩니다.

이미 강한 영역

오답 패턴 정리
취약 단원 추적
반복 실수 탐지
유사 문항 연결
학생별 복습 우선순위 추천
문제 원문이 정확히 확보된 상태에서의 풀이 보조와 해설 정리

수능은 AI가 성능을 올리기 유리한 조건이 많습니다. 정답/오답 판별이 비교적 명확하고, 출제 의도와 문항 구조가 반복되며, 학생 데이터가 누적되기 때문입니다.

조건이 갖춰질수록 강해지는 영역

고난도 수학 해설, 국어 지문-선지 분석, 학생별 맞춤 문항 재구성, 장기 학습 전략 추천은 아무 정보 없이 던졌을 때보다 정확한 문제 원문, 충분한 학생 데이터, 구조화된 기출 정보가 붙을수록 성능 차이가 크게 벌어집니다. "AI가 전혀 못한다"가 아니라, 아무렇게나 던져서는 안정적으로 잘하기 어렵다가 더 정확한 표현입니다.

아직 사람의 판단이 중요한 영역

평가원 수준의 문항 완성도 판별
- 좋은 문제의 기준이 AI와 사람 사이에 다를 수 있다
데이터가 거의 없는 학생에 대한 종합 진단
학생의 동기와 멘탈을 깊은 맥락 속에서 다루는 일
해설의 교과과정 준수 보증
- 더 효율적인 풀이라도 교과과정 밖의 방법인지 아닌지를 최종 판단하는 일

이 차이를 구분하지 않으면 사람들은 두 가지 극단으로 갑니다. "AI가 다 해준다"는 과장이거나, "AI는 아직 아무것도 안 된다"는 뭉뚱그린 폄하. 둘 다 현실과는 거리가 있습니다.

현실은 이렇습니다.

어떤 영역은 이미 AI가 사람보다 빠르고 체계적으로 잘합니다.
어떤 영역은 조건이 갖춰질수록 강해집니다.
어떤 영역은 아직 사람의 최종 판단이 반드시 필요합니다.

중요한 것은 "AI가 되느냐 안 되느냐"가 아닙니다. 어느 영역은 이미 강하고, 어느 영역은 아직 사람의 검증이 필요한지 경계를 정확히 이해하는 것입니다.

그래서 수능 AI는 무엇을 하는가

좋은 수능 AI는 공부를 대신하지 않습니다. 다만, 학생이 어디서 무너지는지 더 빨리 찾고, 왜 틀리는지 더 정확하게 짚고, 반복되는 약점을 더 집요하게 추적합니다.

앞으로 수능과 공부에서의 격차는, 얼마나 열심히 하느냐만큼이나 어떤 AI를 어떻게 쓰느냐에서도 벌어질 겁니다. 같은 시간을 공부해도, 자신의 실수 구조를 정확히 파악하고 있는 학생과 그렇지 않은 학생 사이의 간격은 생각보다 빠르게 벌어집니다.

수능 AI의 시대는 "올까 말까"의 문제가 아닙니다. 이미 시작되고 있습니다. 다만 아직 많은 사람들은 범용 AI를 보고 수능 AI까지 함께 판단하고 있을 뿐입니다. 어떤 AI를 쓰느냐의 차이를 먼저 이해하는 쪽이, 결국 먼저 움직이게 됩니다.

내 공부는 어디서 무너지는가

정답률보다 먼저, 반복 실수의 구조를 확인해 보세요. 그 지점이 다음 성적 상승의 시작점입니다.

SNarGPT 알아보기 →