카테고리 없음

AI 챗GPT 수능 국어 성적 1등급 97점 이유는 학습이 아닌 추론

태공망71 2024. 11. 25. 15:30

AI 챗GPT 수능 국어 성적이 1등급 97점을 맞았다는 보도가 나왔습니다. 이는 2025학년도 수능 국어입니다. 올해 국어가 전반적으로 쉽게 나왔다고 해도, 인공지능이 1문제 틀린 97점 1등급을 맞은 것은 처음입니다. 이게 가능한 이유는 대량의 학습이 아니라 인공지능이 스스로 추론이 가능해져서라고 합니다. 

 

AI 챗GPT 수능 국어


거대언어모델 LLM이 수능 국어를 풀어봤습니다. 대표적인 LLM은 오픈AI가 9월에 출시한 o1-프리뷰 모델입니다. 5월에 출시한 GPT-4o도 함께 2025학년도 수능 국어를 풀었습니다.

 

참고로 국어를 풀게 하는 것은 다른 과목에 비해 반복 패턴이나, 문제 은행 같은 학습량으로 풀기 어려운 것이 국어이기 때문입니다. 즉 인공지능이 대규모의 학습량으로 문제를 푸는 것과 달리, 문제의 성향을 파악하여 추론하여 답을 찾는 것이기 때문입니다. 

 

성적 결과 o1-프리뷰는 1문제 틀린 97점을 맞았습니다. 반면 5월에 출시한 GPT-4o는 3등급 정도의 수준이었습니다. 뭐가 달라졌을까요?

 

 

AI-로봇-가상-이미지-문제-풀다
AI 로봇 가상 이미지 문제를 풀다

 

 

 

애플 아이패드 미니 7세대 스펙 인텔리전스 가격

오는 10월 23일 애플 아이패드 미니 7세대가 정식 출시가 됩니다. 가격은 한화 74만 9000 원부터입니다. 또 최근 AI 기능인 인텔리전스를 사용하기 위해 스펙을 상향 조정하였습니다. 대표적으로 D램

upek.tistory.com

 

높은 점수를 받은 이유


대체로 최근 인공지능 LLM은 다량의 학습량으로 정보를 제공합니다. 그래서 기억력을 테스트하는 것이지만 사실은 AI에겐 커닝에 불과합니다. 그래서 문제 은행식이나 인터넷상으로 검색하는 자료들은 모두 학습으로 정보를 제공할 수 있습니다. 

 

그래서 수능의 다른 과목을 몰라도 국어의 경우는 단순히 다량의 학습이나 기존의 수능 문제의 패턴을 학습했다고 해서, 새로 나오는 수능 국어 문제를 풀기는 어렵습니다. 

 

하지만 이번에 출시된 o1-프리뷰는 단순히 학습량으로 문제를 해결하는 것이 아니고, 자체적으로 추론을 하는 방법으로 답에 접근합니다. 그래서 다른 인공지능보다 시간이 걸립니다. 또 규모도 더 엄청 큽니다. 비용은 당연히 큰 차이가 있습니다. 

 

그래서 국어 문제 접근해서 AI가 지문과 지문들을 비교하고, 여러 개의 답을 추정하여, 근접하게 추려가는 과정을 담은 것이 o1-프리뷰 모델입니다. 추론에서는 가장 압도적인 인공지능 LLM 버전이라 할 수 있습니다. 

 

앞으로 어려운 국어 문제는 o1-프리뷰를 통해서 해결할 수 있을 것 같습니다. 또 o1-프리뷰는 2025학년도 수능 국어 45문항을 푸는 데 걸리는 시간은 35분 정도입니다. 제한 시간이 80분과 비교하면 넉넉한 시간이지만 인공지능과 비교하면 상당한 시간이 걸린다고 보면 됩니다. 그만큼 AI가 심사숙고하는 과정을 걸친다고 보면 됩니다. 

 

 

AI-로봇
AI 로봇 AGI

 

 

그런데 이런 인공지능이 정말 아이들 학습에 도움이 될까요?

 

 

갤럭시 S24 FE 가격 스펙 AI 공시지원금 통역 서클 투 서치

삼성전자가 11월 1일 갤럭시 S24 FE를 출시하였습니다. 기존 S24보다 사양이 조금 낮지만 기본적으로 사용할 수 있는 실용적 기능은 모두 갖추고 있습니다. 그럼에도 가격은 94만 6000원입니다. 그리

upek.tistory.com

 

AI 디지털교과서 효과


솔직히 효과는 있습니다. 예를 들어 수학의 경우, 단계별로 또는 수준별로 인공지능이 맞춤형으로 문제를 제공하고, 풀이 과정을 학생 수준에 맞게 풀이할 수 있습니다. 일률적으로 수업을 하던 시절은 이제 공교육에서 사라질 수 있습니다. 

 

마치 수학을 공부하는 학생은 과외를 하는 것과 매우 유사합니다. 거기다 틀린 문제는 수준이 비슷한 문제 유형을 계속 인공지능이 제공하고, 또 상황에 따라 단계별로 문제를 제공할 수 있습니다. 이는 선생보다 더 정확하고, 확실하고, 친구들과 비교가 되지 않을 수도 있습니다.

 

이는 수학은 물론이고 다른 모든 과목이 비슷할 전망입니다. 물론 국어는 좀 다릅니다. 특히 기억해야 하는 과목은 문제 은행처럼 완전히 숙지할 때까지 반복적으로 주입할 수 있습니다. 

 

 

태블릿-PC-AI-공부하는-학생들
태블릿 PC로 공부하는 학생들 AI

 

 

 

AI 디지털교과서 맞춤형 수업 수학 영어 장점 단점 - upek1.com

AI 디지털교과서 맞춤형 수업이 내년 3월부터 시행합니다. 우선 초3, 초4, 중1, 고1, 국어 수학, 영어, 정보 과목에 도입하여 2028년까지 단계적으로 확대할 계획입니다. 다만 디지털교과서를 대체제

upek1.com

 

그런데 인공지능 교육이 문제가 되는 것은 다량의 학습 정보가 편향적일 때 문제가 됩니다. 기본적인 사고나 상식을 기반으로 하는 문제들은 크게 걱정이 되지 않지만, 사회적 이슈가 되거나 정확한 정답을 갖지 않는 문제들은 편향적으로 사고를 유도할 수 있습니다. 

 

예를 들어, 낙태 문제를 이슈화하면 인공지능이 찬성도 하고 반대도 할 수 있습니다. 하지만 사용자가 찬성 쪽으로 관심을 가지게 되면 낙태를 찬성하는 정보나 기사가 계속 줄이어 나올 수 있습니다. 지금의 검색 시스템은 고객이 원하는 방향으로 정보를 또는 상품을 제공하는 방식입니다.

 

거기다 낙태를 찬성하는 사람들이 평소 관심사까지 뉴스나 정보를 제공하게 됩니다. 낙태를 찬성하는 사람이 동성결혼을 찬성하는 부류가 많다면 역시 동성결혼 찬성에 대한 정보를 접하게 됩니다. 

 

그러면 인공지능을 접하는 학생이나 일반 시민들은 편향적으로 낙태 찬성과 동성결혼의 찬성 등 그리고 원전 반대 등에 대한 성향이 높아질 수 있습니다. 이는 반대 경우도 마찬가지입니다. 낙태를 반대하거나, 동성결혼을 반대하거나 원전을 찬성하는 편향적인 사고가 늘어날 수 있습니다.

 

즉 인공지능이 아무리 추론을 한다고 해도, 결국 데이터를 기반으로 정보를 제공하기 때문에 편향적인 사고에서 벗어날 수 없습니다. 결국 해결 방법은 사용자가 비판적인 사고를 가지고 의심하고 토론하고 논의를 해야 하는데, AI 시대에서 모든지 답변을 해주는 인터넷이 있는데 굳이 사람들과 피곤하게 토론하고 논쟁하고 싸울 필요가 있을까 싶습니다. 

 

결국 AI 챗GPT 수능 국어 성적 1등급 97점이 중요한 것이 아니라, 인공지능이 어떻게 인간에게 올바른 비판적 사고를 가질 수 있게 도와주는 지를 점검해야 합니다. 물론 인공지능이 윤리적 문제도 해결해야 합니다. 인간을 넘어서는 정보량과 두뇌를 가지는 로봇이 필요한 것이 아니라 인간을 더 풍요롭게 도와줄 인공지능이 필요한 것입니다. 그러려면 인간이 스스로 비판하고 의심하고 경계할 수 있는 능력이 필요합니다. 그래서 고도의 인공지능 AI에게는 반드시 인간이 컨트롤할 수 있는 제어 기능이 있어야 합니다. 그렇지 않으면 누군가의 의해 인간이 인공지능에 지배당할 수 있습니다.

 

 

애플 아이폰 AI 시리 챗GPT 인텔리전스 기능 - upek1.com

애플 아이폰 AI 시리 공개되었습니다. 기존 시리에서 AI를 강화한 음성 비서 역할을 하게 됩니다. 이는 온디바이스 형식입니다. 만약 검색의 범위가 벗어나면 챗GPT를 사용하게 됩니다. 이는 클라

upek1.com