BrainBox [1196575] · MS 2022 (수정됨) · 쪽지

2023-12-26 21:30:43
조회수 20,433

[피오르] 정시지원자 필독)2. 낙지를 신뢰할 수 없는 이유

게시글 주소: https://i1000psi.orbi.kr/00066160640

안녕하세요. BrainBox입니다.

글을 시작하기에 앞서, 오르비 컨설팅 팀 "피오르"로 부터 스카우트를 받아 "피오르 컨설팅"에서 컨설팅을 진행하고 있음을 밝힙니다.

저는 현재 피오르 컨설팅 으로 부터 스카우트를 받은 후, 메디컬 팀 소속으로 인서울, 메이저 의대 라인을 전담으로 컨설팅하고 있습니다.


제가 컨설팅 하는 학교들은 다음과 같습니다


서울대, 연세대, 가톨릭대, 성균관대, 울산대, 고려대, 한양대, 경희대, 중앙대, 인하대, 순천향대, 단국대


위의 학교들의 의과대학에 대해서만 컨설팅을 진행하고 있습니다.


이번에는 상담을 진행하면서 느낀, 낙지의 한계들에 대해 다뤄보려고 합니다.

이 이유가 동시에 컨설팅이나 표본 분석 등을 진행해야 하는 이유이기도 하니, 위 라인을 노리시는 분들이 아니더라도 꼭 정독하셔서, 후회 없는 원서영역 치르시기를 바랍니다.


글에서는 가독성을 높이기 위해 최대한 간결한 문체로 이어나가도록 하겠습니다.




1. 낙지도 결국 기업이다


낙지는 앞의 글에서 말한 것과 같이 "표본 분석"이라는 방법으로 정시 예측을 진행하는 플랫폼이다. 표본과, 실제 지원자 차이간의 간극을 최대한 반영하여, 주어진 표본을 가지고 실제 컷을 예측해 주는 것이 낙지가 기본적으로 작동하는 원리이다. 


낙지는 "칸 수" 라는 시스템으로 학생들의 합격 확률을 직관적으로 나타낸다. 칸수가 높을 수록 학생의 합격 확률이 높다는 것이고, 낮을 수록 합격 확률을 낮아진다.
그리고 "5칸"이 합격/불합격을 결정하는 기준 칸 수이다. 즉, 5칸 이상부터 합격할 것이고, 4칸 이하부터 불합격 할 것이라고 예측한다는 것이다.


그렇다면, 낙지에서 알려주는 "칸 수"의 정확도는 어느정도 일까? 이를 확인하기 위해 낙지에서 발표한 칸 수 당 합격 확률을 살펴보자. 

학교마다 상이하긴 하지만, 모든 과를 비교하는 것은 현실적으로 불가능하기에 가장 많은 학생이 

지원하는 과 중 하나인 연세대학교(서울)를 기준으로 살펴보겠다.


낙지에서 발표한 칸 수 별 합격률은 다음과 같다.

낙지는 6칸 이상과 3칸 이하의 경우에서는 100프로에 달하는 적중률을 자랑하였다.

그런데, 가장 중요한 4칸과 5칸의 경우는 그 양상이 조금 다르다.
5칸의 경우부터 살펴보자.
5칸의 경우 합격률은 86.2%로, 합격할 것이라는 예측을 받은 학생들 중 13.8가 원서영역에서 고배를 마셨다. 86.2%라는 확률이 제 3자의 입장에서는 충분히 훌륭한 확률인 것은 자명한 사실이다. 그것만으로 낙지의 위상이 이렇게 높아진 과정을 충분히 설명할 수 있을 것이다.


그런데 당사자의 입장에서도 과연 같은 판단을 할 수 있을까?


13.8%라는 확률이 낮은 확률이긴 하나, 청춘의 1년 혹은 그 이상을 바친 수험생활에, 진심으로 자신을 던져 넣어 본 수험생이라면 안심하고 본인의 미래에 대한 모든 것을 맡길 만한 확률이라고는 할 수 없으리라 생각한다.


4칸의 경우는 그 정확도가 훨씬 더 낮아진다.
4칸의 경우, 불합격할 것이라는 진단을 받은 학생들 중 45.5%만이 예측과 같은 불합격 판정을 받았다.
물론 떨어질 것이라는 예측을 받았던 학생이 합격을 하는 것이 그 반대의 경우가 발생하는 것보다는 훨씬 나을 것이다.
그리고 낙지도 이를 알고 있기에, 컷을 일부러 조금 짜게잡아, 5칸 불합격의 경우보단, 4칸 합격의 경우를 늘리는 방향으로 첫을 예측하였을 것이다.


즉 낙지의 컷은, 명확한 확률을 구하는 것에 가장 집중한 컷이라기 보다는, 소비자들의 미움을 받지 않기 위해 다소 방어적인 태도로 형성된 컷이라는 것이다.

소비자들의 선택을 받아야 하는 기업의 입장에서 이러한 선택은 지극히 당연한 것이나, 이와 별개로 이러한 상황은 낙지가 제시하는 "칸 수"가 원서영역에 있어 낙지가 무한 신뢰의 대상이 될 정도로 정확하지는 않다는 것에 대한 방증이기도 하다.


2. 경향성이 없는 변수는 독립적으로 고려해야 한다.


정시 원서영역을 공부하다보면, 가장 명확히 해야하는 구분이 있다.
가/나/다 군 구분도 아니고, 대학별 반영비율 구분도 아니다. 가장 중요하면서 필수적으로 구분지어야 하는 부분은 바로 이것이다. 


원서영역 = 이미 알고 있는 사실 + 경향성이 있는 것 + 경향성이 없는 것


위에 대한 구분을 명확하게 하지 않고, 정시 원서영역을 치르면 예측의 정확도가 매우 떨어지게 된다.

이중에서 가장 중요한 것은 단연 "경향성이 없는 것"에 대한 구분이다. '경향성이 없는 것' 역시 우리가 모르는 부분이기에 상당수의 사람들이 "경향성이 있는 것"과 이를 혼동한다. 심지어 낙지 마저 이 부분을 명확히 구분하지 못하는 모습을 보여준다.

둘을 혼동해서 작년과 같거나 비슷하다는 판단하에 원서영역을 치르는 것이다.


그 중 가장 대표적인 것이 바로 "수시 이월 인원" 과 "경쟁률" 이다.


"경쟁률"은 수시 이월 인원에 대해 다루다 보면 자연스레 등장하는 내용이니, "수시 이월 인원"에 대해 먼저 이야기 해 볼 예정이다.


수시 이월 인원에 대해 이어나가기 전에, 수시 이월 인원이 무엇인지 모를 입린이 들을 위해 수시 이월 인원에 대해 간단하게 설명하고 글을 이어나가도록 하겠다.

대학의 정원은 크게 수시인원+정시인원으로 구성되어 있다. 그리고 뽑는 순서는 모두가 알다시피 수시 -> 정시 의 순이다.
즉, 수시인원을 먼저 전부 선정한 후에, 정시 인원을 뽑는다.
그런데 수시전형에서, 대학이 꼭 정원을 꽉 채워서 학생들을 뽑지 않는 경우가 발생한다.


이때 수시정원에서 남는 인원이 정시 정원으로 이월되는 상황이 발생하고, 이 이월되는 사람의 수를 수시 이월 인원이라고 한다.


정시 최종 정원 = 최초 정시 정원 + 수시 이월 인원


으로 정리해 볼 수 있다.
그렇다면 수시 이월 인월을 왜 예측하면 안될까? 그 이유는 수시 이월 인원이 정원을 직접적으로 결정하는 이유이기 떄문이다.


그렇다면 왜 정원을 예측하면 안될까? 그 이유는 바로 정원이 표본들의 이동에 직접적인 영향을 미치기 때문이다.

이 말 만으로는 수시 이월 인원의 영향력을 이해하기 힘들테니, 그 영향력을 명확하게 이해할 수 있게 하기 위해 예시를 하나 들어보려고 한다.


다음은 한 대학의 2022학년도와 2023학년도의 수시 이월 인원에 따른 경쟁률의 변화이다.

개인적으로 위의 경우만큼, 수시 이월 인원과 경쟁률 간의 상관관계를 잘 드러내는 경우는 없다고 생각한다.


위의 대학에서 22년의 경우, 무려 9명의 인원이나 정시로 이월되었었다.
사람들의, 정원이 많은 학교일수록 안정적이라고 생각하는 경향과 맞물려 무려 5.38의 경쟁률을 달성해 5.38 x 24 = 129 명이나 지원을 하였고, 자리가 많으면 보다 여유로울 것이라는 예측과는 달리, 당해 가장 치열한 경쟁이 일어난 곳 중 하나게 되었다.


반면, 작년에는 0명이 이월 인원으로 결정되어 15명으로 최종 정시 정원이 결정되었다. 

정원이 적을 수록, 경쟁이 치열할 것이라는 우려와 달리, 오히려 작년에는 많은 사람들이 낮은 정원에 불안해 하며, 이 학교에 지원하지 않았다.


따라서 경쟁률이 3.8에 불과해 고작 3.8 x 15 = 57명 정도밖에 지원하지 않았고, 엎친데 덮친 격으로 추합이 10명이나 돌아 사실상 25등까지 합격증을 받은 학교로 작년 입시를 마무리하였다.



낙지는 항상 수시 이월 인원을 작년도과 같다고 전제하고 예측을 진행한 후, 수시 이월 인원이 발표되면 이를 정정한다. 

작년의 경우, 올해와는 약간 다르나 다음과 같은 형식으로 예측 인원을 결정하였다.



위의 부분에서 "예상 수시 이월 인원" 이라는 란이 보일 텐에, "예상" 이라고 쓰고 "작년"이라고 읽으면 된다.


예상이라는 말이 무색하게, 그저 작년의 이월인원을 그대로 붙여넣었다.


그런데 다른 것들과 달리 이월 인원은 전적으로 당 해 대학의 마음에 달려있다. 경향성이라는 것 자체가 존재하지 않는 부분인 것이다.


그런데 이것을 작년과 같다고 전제하고 분석하였으니 당연히 완전히 정원이 달라질 수 밖에 없었다.

그렇다면 정원이 달라지는 것이 무엇이 문제일까?


낙지는 전체 정원과 경쟁률을 곱해 실제 지원자 수를 예측한 후, 얼마나 표본이 유입되었는지 계산해 컷을 형성한다. 

그런데 정원이 달라지면 이 핵심 알고리즘이 완전히 꼬여버리는 것이다.


예시를 들어 보다 자세하게 설명해 보도록 하겠다.


다음의 조건을 갖는 학교가 있다고 가정해보자
작년 정원: 30+ 5(이월)
작년 경쟁률: 3.5
확보한 표본 수 : 40
위의 경우, 실제로 지원할 사람의 수는 총 35 x 3.5 = 122명이라고 예측되는데, 그중 오직 40명의 표본만이 있는 상황으로 판단하게 된다.
이때 표본의 수가 매우 적으므로 30명 중 10등 정도까지만 합격할 것이라고 커트라인을 형성하게된다.
남은 25명은 유입되지 않은 표본에 포함되어 있다는 것을 반영한 결과일 것이다.
그런데 입시가 끝난 후 확인해 보니, 실제 상황이 다음과 같았다.
정원: 30 + 0(이월)
실제 경쟁률: 1.5
확보한 표본 수 40

다음과 같은 상황에서 실제로 지원한 사람의 수는 고작 30 x 1.5 = 45명에 불과했고, 그중 40명의 표본을 이미 확보했던 것이었다.
그래서 실제로 표본 40명중 28등 까지 합격할 수 있었던 것이다. 


이 경우 표본 상 11등-28등에 해당하는 17명의 학생들은 합격할 수 있었는데, 합격할 수 없다는 예측 결과를 받게 되어버린 것이다.


그럼 이런 상황에서 입시에 대해 어느 정도 아는 누군가는 이런 질문을 던질 수 있다.


Q. 수시 이월 인원은 어차피 발표되니, 잘못 예측해도 정정되는 오류가 아닌가?


그런데 이는 입시를 반만 아는 자의 질문이다. 이월 인원은 정정되나, 수시 이월 인원이 영향을 미치는 경쟁률에는 정정된 수시 이월 인원이 반영되지 않기 때문이다.

앞서 말한 예시에서 확인할 수 있듯이, 수시 이월 인원은 정원을 결정하고, 정원은 실제 경쟁률에 결정적인 영향을 미친다.


그렇기에 작년 경쟁률은, 사실은 작년의 수시 이월 인원을 반영하는 변수이다.
그런데 낙지는 올해를 예측할 때 작년의 "수시 이월 인원" 만 정정할 뿐, 그것에 영향을 받은 "경쟁률"은 정정하지 않는다.

올바르게 컷을 예측하기 위해서는 "올해 수시 이월 인원에 따른 예상 경쟁률"을 구해야 하는데 낙지는 이 부분에 대해 인지하고 반영하기는 커녕, 이를 해결 하기위한 일체의 노력을 기하고 있지 않은 것으로 보인다.


이것이 실제 상황에서 어떤 일을 초래했는지 예시를 들며 이부분을 마무리 하려고 한다.


다음은 위에서 한 번 언급했던 경우이다.

낙지가 작년에 처음 예측했던 전체 지원자의 수는 다음과 같았다.


예상 정원: 15+9(22 이월자 수)=24
예상 경쟁률: 5.38(=22 경쟁률)
예상 지원자 수 : 5.38 x 24 = 129


수시 이월 인원이 발표된 후에는 다음과 같이 예측하였다.


예상정원: 15 + 0
예상 경쟁률: 5.38(=22 경쟁률)
예상 지원자 수 : 5.38 x 15 = 81


그런데 당시 들어와 있는 표본의 수는 고작 40명 정도였다. 따라서 충분한 표본이 형성되지 않았다고 판단되었고, 실제보다 높게 컷이 형성되었다.


작년에 낙지에서 불합격할 것이라는 예측을 받은 2-3명의 학생들이 실제로는 합격을 할 수 있었다는 것이다.


올해는 "예상 이월 인원"이라는 말도 안되는 항목은 없어졌으나, 경쟁률은 작년의 것을 그대로 이용하고 있는 것으로 보인다.

이 부분은 그냥 "오차"로 치부하기에는 영향력이 지대한 부분이다.


특히 이런 잘못된 경쟁률 설정으로 인한 오차는, 전체 표본수가 적은 집단일 수록 큰 영향을 받는다. 

내가 전문으로 컨설팅하는 인서울 의대 라인에서는 위와 같은 변수에 따른 차이가 정말 크다.

그러므로 꼭 분석할 때에 이를 고려해 예측 결과를 도출해 내는 것의 필요성을 더욱 절감한다.


그러나 꼭 이 라인의 속한 사람이 아니더라로, 위와 같은 오차를 정정할 필요성을 분명히 존재한다.
그리고 그것이, 대부분의 사람들이 낙지만 보는  것이 아니라 컨설팅을 받고, 직접 분석을 하는 이유이리라 생각한다.



글이 너무 길어져 어떤 식으로 예측하느냐에 대한 부분은 다음에 기회가 되면 올려볼 예정입니다

낙지를 맹신하는 사람이 상담하면 종종 보여, 이 부분에 대한 경계심이 필요할 것 같아 글을 작성하였습니다.


최종 업데이트나, 이러한 표본 이동을 관찰하며 사람들이 새롭게 지원 전략을 수립하며 희망 대학을 수정하는 것을 감안해, 대형 플랫폼에 대한 절대적인 믿음을 지양하고 부수적인 노력이 투입되어야 충분한 정확도를 확보할 수 있다는 것을 주장하기 위함임을 밝힙니다.


추가로 피오르 컨설팅다음 링크로 들어가서 신청해 주시면 됩니다!
어떤 팀보다 정확하고 섬세하게 컨설팅 할 수 있다는 자부심이 있습니다.
감사합니다 :)

"링크"


또, 저의 다른 글들은 제 개인 블로그에서 읽어보실 수 있습니다!





[입시에 도움이 되는 글 모음]

https://orbi.kr/00065216335 : 유인우 - [입결표] 20~23학년도 메디컬,문이과 주요대학 추정 입결표
https://orbi.kr/00065221190 : 유인우 - 24학년도 정시 주안점
https://orbi.kr/00065232324 : 군툰문 - 불수능과 표본분석
https://orbi.kr/00065580165 : 군툰문 - 어디서 펑크가 날 것인가
https://orbi.kr/00065277552 : Cogito - 표준점수, 누적백분위, 펑크, 폭발
https://orbi.kr/00065300256 : Cogito - 표본의 이동방향, 대체학과, 기피학과

https://orbi.kr/00065251112 : 정시기다리는 - 변환표준점수란 무엇인가?
https://orbi.kr/00065410392 : 종냥 - 2024학년도 메디컬계열 정시 지역인재 칼럼
https://orbi.kr/00064084053 : 종냥 - 메디컬 입시요강을 볼 때 확인할 4가지 포인트
https://orbi.kr/00065458030 : 종냥 - 모의지원에서의 허수 이야기

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.