원서영역 도구(chapter2: 표본분석법)
앞선 글들을 읽고 오시길 권장합니다!
저번 글에서 객관성, 일반성에 대한 피드백을 받았습니다. 경험과 추론을 이용한 것이 아닌, 논리적으로 생각하여 최대한 모두가 공감할 수 있는 내용만을 전해드리도록 노력해보겠습니다.
이번 글은 표본분석법에 대한 글입니다. 표본 하나하나에 대한 판단부터 전체적 분포에 대한 내용으로 확대해 나가며 진행하겠습니다.
---------------------------------------------------------------------------------------------------------------------
표본분석법
1.표본분석의 한계
표본분석을 하는 것은 상향지원 할 학과의 합격확률을 조금이라도 더 높이고, 안정지원 할 학과의 확실함을 조금이라도 더 보증하기 위해서 입니다. 표본분석은 만능이 아닙니다.
철저한 분석을 통해 확신을 가지고 상향지원한 학과에 모의지원 사이트 상 단 한번도 찾아볼 수 없었던 표본이 실제지원에 몇 명만 등장해도 노력은 물거품이 됩니다.
애초에 모집인원이 100명이 넘어가는 대형과는 하루에도 자신 앞에 수십명의 표본이 들락날락 할 수 있습니다. 그런 학과의 표본을 하나하나 판단하고 매일 상태를 체크하는 것은 불가능합니다.
저는 당연히 표본분석 방법에 관련된 모든 정보와 진리를 전달해 드릴 수는 없습니다. 불충분한 정보들을 차곡차곡 쌓아 완벽하게 해나갈 자신이 없다면 컨설팅 팀에 맡기거나 타임머신, 페잇등을 이용하는 것이 훨씬 나을 수 있습니다.
그럼에도 고된 수험생활 끝의 휴식이라고 할 만한 12월을 표본분석에 갈아 넣을 준비가 된 수험생은, 1%라도 합격확률을 높이기 위한 그 희생이 가치가 있다고 판단한 것 이겠지요!
2.모의지원 사이트의 예상합격자 산출방식
저번 글에서 말씀드렸듯이 자세한 수식이나 산출법은 각 회사의 기밀인 것으로 압니다. 하지만 관찰에 따라 대강 다음과 같은 방식을 따르는 것을 알 수 있습니다.
지난 경쟁률 등으로 예상경쟁률 산출 - 예상지원자 수와 모의지원자 수의 비율로 예상최초합격자 수 계산 – 각 표본의 가,나,다군 우선순위에 따라 추가합격자 수 계산
예를 들어 봅시다. (당연히 실제 수치와 다릅니다)
모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것이고, 추가합격자들의 지원상황에 따라 2차 추가합격자가 같은 방식으로 계산될 것입니다.
복잡한 메커니즘이 있겠지만 그 방식을 대강이라도 알고 있는 것이 좋을 것 같습니다. (자세히 알기가 힘들기 때문입니다 ㅜㅜ)
저번 글에도 말씀드렸듯, 각 합격예측 프로그램의 원리를 알면 알수록 그들을 남들보다 잘 이용할 수 있습니다!
3. 허수 거르기
표본들 중에는 가짜표본이 있습니다. 실제 수능 응시자가 아닌데 재미로 넣어 보거나, 점수를 허위로 입력하거나, 어쩌면 다른 수험생들을 교란하기 위해 누군가 만들어낸 표본이 있을 수도 있습니다.
우선 각 모의지원 사이트는 자체적으로 어떤 알고리즘을 이용하여 허수들을 걸러냅니다. 이번 오르비 모의지원에는 인공지능이 사용된다고 들은 것 같습니다.
작년 가장 큰 모의지원 사이트에서 제거된 허수는 2만건에 육박했던 것으로 기억합니다. 하지만 이와 같은 노력에도 허수표본들은 완전히 제거되지 못합니다.
저번 글에 말씀드렸듯이 저는 개인 수험생이 자신만의 생각으로 표본들의 허수 여부를 마구 판단하는 것은 좋지 않다고 생각합니다. 다만 여러가지 조건을 통해 어떤 표본이 허수일 ‘확률’이 높을지 생각하는 것은 유의미하다고 생각합니다.
여태 오르비에 표본분석에 대한 글을 남겨 주신 분들은 허수의 판단에 쓰일 수 있는 몇 가지 주된 요소를 언급하셨습니다. 주로 다음과 같습니다.
-전혀 상관없는 학과들의 조합
-더 높은 대학/학과를 쓸 수 있음에도 굳이 낮춰 쓴 듯한 표본
-움직이지 않는 표본
-지원할 만한 대학이 있음에도 특정 군에 지원하지 않은 표본
이 요소들에 해당되더라도 그 표본이 허수라는 확신을 할 수 없습니다. 하지만 한가지가 아닌 여러가지 요소를 가지고 있는 표본이라면, 허수일 확률이 비교적 높아진다고 할 수 있겠지요.
특히나 움직이지 않는 표본은 확률이 높다고 생각합니다. 취향이 확고한 수험생이라도 12월초부터 원서접수 직전까지 단 한번도 다른 학교, 다른 학과에 모의지원조차 안해보는 수험생은 굉장히 적을 것입니다.
반면 상관없는 학과들의 조합은 그닥 허수의 조건이 아니라고 생각합니다. 실제지원자 중에 상관없는 학과의 조합으로 지원하는 학생이 오히려 더 많은 것 같습니다.
이는 본인의 판단에 맡깁니다.
제가 지원 했었던 학과의 실제 있었던 허수 표본을 예로 들겠습니다.
Ex)
가군 해당 학과 (1순위)-사이버 국방과 전혀 연관성 x
나군 고려대 사이버국방학과(2순위)
다군 지원x
해당 표본의 성적은 고대식 누백 0프로 중반으로 기억합니다.
전혀 상관없는 학과의 조합 에다가, 성적이 남는 학과를 1순위로 하였고, 다군을 지원하지 않았으며 무엇보다 전혀 움직임이 없었습니다.
실제로 차후 허수였던 것으로 확인했습니다.
그럼에도 다시 말씀드리지만, 100%는 없습니다.
4.표본 카테고리화, 추적
허수일 확률이 있는 표본들을 분리하고 나면, 실제표본들이 남습니다. 이제 앞으로의 판단을 위해이 표본들을 종류에 따라 대충 나눌 필요가 있겠습니다.
어떻게 나눠서 생각해볼지는 개인의 판단입니다. 저는 대강 다음과 같이 나눴습니다.
-해당 군에는 이 학과를 쓰는 것으로 확고한 표본
-고민하는 표본
-밀려 내려오는 표본
이를 위해서는 표본을 추적해볼 필요가 있습니다. 먼저 표본들의 점수와 각 군의 희망학과를 메모 해 둡시다. 가군의 학과에서 어떤 표본이 사라졌다 나타났다 한다면, 나,다군에 그 표본이 썼던 학과에 모의지원을 하여 그 표본을 찾아 볼 수 있습니다. 어떤 학과를 두고 고민하고 있는지 알 수 있는 방법입니다.
이는 최상위권에서 강력한 방법입니다.
하지만 성적대가 내려갈수록, 스쳐 지나가는 표본이 많아지고 나중에는 전체적으로 칸수가 떨어지며 더 안정적인 학과로 엄청나게 밀려 내려오는 표본들 때문에 미리 해 뒀던 표본분석 자료들의 표본들은 온데간데 없어질 수도 있습니다.
5.유동성
이제 개개의 표본에 집중하기보다 좀더 멀리서 바라보도록 합시다.
매일매일 지원예정 학과들 에서의 자신의 등수와 상위표본의 출입을 지켜보며 기록하다 보면 차이점을 발견할 때가 있습니다.
어떤 학과에서는 자신의 등수가 14~16등 사이를 진동하는데, 어떤 학과에서는 10~20등 사이를 오르내립니다.
그 학과에 지원하는 것을 망설이고 고민하는 표본이 많다면, 실제지원에서 모의지원과 결과가 달라질 확률이 그렇지 않은 학과보다 조금이라도 높은 것은 공감하실 수 있을 것입니다.
이는 합격선이 예상보다 낮아질 확률도,높아질 확률도 높인다고 할 수 있습니다.
하지만 반복해 말했듯 단지 조금이라도 확률을 높이기 위한 일들입니다. 유동성이 적었던 과가 오히려 크게 폭발하거나 빵구날 수도 있습니다.
그저 최선의 선택을 하기위해 참고할 만한 이야기입니다.
6.도미노
상향지원을 위해 표본분석을 하는 분들을 위한 내용입니다. 이는 모의지원 사이트의 예상합격인원 산출법과 관련이 있습니다.
2번에서 말했던 예시를 그대로 가져와 봅시다.
(모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것입니다.)
이때 1차 예상 추가합격자 2명 모두 해당학과를 1순위로 설정해 놓았다고 합시다. 모의지원 프로그램은 여기서 예상 합격자를 마감할 것입니다.
하지만 그 뒤 표본들의 우선순위와 다른 군의 예상합격 현황이 변수가 될 수 있습니다.
최종추가합격자와 나 사이에 5명의 불합격자 표본이 있다고 합시다.
만약 5명 모두 해당 학과의 우선순위가 낮고 우선순위가 높은 다른 학과에 합격할 것으로 예상된다면, 모의지원 프로그램이 모의지원자들 중 합격예상 인원을 한명만 더 잡아도 추가합격자가 도미노 쓰러지듯 늘어나 자신까지 합격할 수 있게 됩니다.
이런 조건을 찾는 것 또한 상향지원의 합격확률을 조금이라도 높일 방법이 될 것입니다.
7. 점수절벽
6번과 관련하여 추가적인 내용입니다.
보통 지원자들의 분포는 x축을 성적, y축을 학생수로 했을 때 정규분포를 그리게 됩니다.
이를 모의지원사이트에서 볼 수 있는 흔히 y축을 성적, x축을 등수로 하여 표본들을 점으로 표현해 놓는 그래프로 보면 ‘~’자를 좌우반전 후 시계방향으로 약간 돌려놓은 모양새가 됩니다. (마땅히 표현할 방법이 없네요,,)
통계학적인 이유에 따라 지원자가 많은 대형과들의 경우 특히 크게 벗어나는 일이 없겠지만,
지원자도 적고 모집인원도 적은 작은 모집단위 에서는 이 모양을 벗어나곤 합니다.
이때 ~표 모양의 허리가 끊어져 중간에 표본의 점수가 뚝 떨어진다거나 하는 현상이 있고,
그것이 6번의 도미노 구간에 걸쳐 있다면
해당학과의 입결이 소위 말하는 ‘배치표’상의 점수보다 많이 떨어질 가능성이 있는 것이겠지요!
8.정리
표본 분석법에 대한 글은 이미 오르비에 꽤 많은 걸로 압니다.
이 글 말고도 다양한 내용과 근거들을 조합하여 2번에 대입해보고 생각해 봅시다. 자신이 판단한 예상합격 표본 수를 산출할 수 있을 것입니다. 거기에 추가적으로 비 모의지원자까지 고려해서 생각해 본다면 예상되는 최종합격 예비번호 등을 계산해 낼 수 있을 것입니다!
절대적으로 맞출 수 있는게 아닌, 확률을 높이는 시도일 뿐이라는 것을 마지막으로 다시 강조해서 말씀드립니다.
---------------------------------------------------------------------------------------------------------
글이 길어져서 정리한다고 힘들었네요 ㅜㅜ
글 중간중간에도 언급했지만 절대적인 내용이 아니기에 수험생 여러분들이 각자 판단하시고 객관성과 일반성이 부족하다고 생각되는 부분은 스스로 생각해 주시고,
부족한 내용, 틀린 부분 있다면 피드백 해주시면 감사하겠습니다!
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
빵의 시그널 0
비슷한 라인의 과에 비해서 컷 자체는 낮은 것 같은데 칸수는 짬 + 약 20명 정도...
-
아는 동생 원서접수 도와줬는데 실지원자수 시간마다 비교중인데 고대공대 훅 늘어남요...
-
쪽지로 죄송하다고 내려달라하는거는 뭔 심리지..? 양심 어디감 ㅋㅋㅋㅋㅋㅋㅋ
-
그냥 좀 붙여줘!!!!!!
-
제가 쓰려는 학교의 A학과랑 B학과가 군, 입결, 배우는거 등 거의 비슷한...
-
설사는 몬가 느낌이 안삼
-
한약학과 생기고 20년간은 높다가 10년대초반에 잠깐주춤하고 다사 입결회복하는건데...
-
서성한 5칸 0
이거 붙나요? 진학사 낙지 5카
-
진학사기준 6칸 최초합 나군이고 8명뽑음 실지원자 18명중 4등 소수과인데...
-
진짜 이대로 다 빵꾸야?
-
아 ㅋㅋㅋ 나중에 탐구 후기글 누가 저대신 작성해주셈 딮피드 기준을 모르겠네
-
워낙 촘촘해서? 제 재수학원 담당쌤도 상향쓸거면 대형과 절대 쓰지 말라하셨어서
-
연대 인문 제일 낮게 걸리는 과 몇까지 내려갈 거 같음 1
예상 ㄱㄱ
-
빵은 아무도 관심이 없어야 나고 언급 많이되는 순간 폭일 가능성이 올라감 그러니까...
-
아직 텅텅임
-
살 안쪗을땐 뒤에서 여자애들이 얼굴 훈남이다 나쁘지 않다 몰래하는 얘기 들었고...
-
서울대지리학과 2
이과에요?? 제발
-
고대 어문 왜저래
-
80명 정도 뽑는 대형과입니다
-
다군 건대 시스템생명공 홍대 건축 둘 다 4칸이고 딱히 쓸거없어서 적는거라 꼭...
-
한양대식 933.64 고려대식 639.97 둘다 터무니없는 점수라는건 잘아는데...
-
이랬던 적이 있었나 어문만 유독 이러네
-
보1ㅣ 3
?
-
떨어지면 그냥 연경 가지 뭐.. 그래도 붙여줭
-
그렇게 믿을게
-
한양대 미리 자퇴해놓게요
-
합치면 2.9 뜰거같은데 어디가나요 학종 생명쪽으로 채움 고2모고 11112이고...
-
스나할거 ㅊㅊ좀 3
건대 공대 2학년까지 했음 군대에서 봤는데 조져가지고 걍 스나 조지려는데 (진학사도...
-
서성한은 고사하고 중대 높과도 1칸 나오는데 고대 어문이 3칸 나오고 있네ㅋㅋㅋ 이게 뭐람…
-
막 25632이러는데도 높은데 붙는건가... 문득 궁금해졌음
-
다군인데요 추가합격 가운데인데 안정으로 넣어도 될까요? 고속에는 연초입니다.
-
이거 왜 제출서류가 도착하지 않았다고 뜨는건가요? 원래 낼거 없으면 제출할 서류가...
-
아제발 0
36명 뽑는데 31등이면 되려나
-
서울대 학부대학 0
높공인데 직전경쟁률 낮아서 여기로 튈란다 아니면 첨융으로 튀자 튄자가 승리를 쟁취한다
-
통계학과가 1지망이고 진로가 금융통계나 데이터분석쪽이면 문헌정보 가는게 맞나요? 둘...
-
1학년 송도유배가는데 왜죠??
-
흠.
-
안 비어있는 것 같다면 갳 우 ㅋㅋ 일단나부터
-
흠..... 9
고대 원서비 아시는분?
-
건대 ㄷ 경희대 2
건대 전전이랑 경희대 원자력공학과중 뭐가 더 나을까요??
-
칸수 조합 1
이번에 대학 가야하는 재수생 칸수 조합 추천 부탁드립니다
-
자전 2
올해 자전 추합 한 배수 씩 돌려나... 3개년 정보가 없으니까 막막해 죽겟다
-
아무리 생각해도 그걸로 보는 이익이 없는 것 같은데 남한테 손해를 끼치기...
-
흐흐ㅡ
-
그옆에전기톱시동거는나무꾼은나예요
-
입학전까지 하나요? 교문도 눈치보고 들어감? 뭐하눈거야 얘들아?
-
연고대생이 될 수 있는 기회. 54분 남았습니다. 지원 ㄱㄱ
-
전과,복전 0
한양대 낮공이라서 복전아니면 전과도 생각중인데 한양대 복전,전과 쉽나요?
선추
닥추
사실 허수인걸 거르는과정이
허수임이 확실하다는 걸러지는 허수 10개중 1개 정도고
나머지 9개는 '허수였으면 좋겠다 ㅎㅎ' 라는 심정으로 거르는거.. ㅋㅋㅋ
ㅜㅠ 수험생의 마음이 그렇지요
너네들이 찾는건 허수
이글을 읽는 나는 하수
yo
비 모의지원자는 몇%정도 있겠다고 잡는게 좋을까요?
쪽지 드리겠습니다 ㅎㅎ
저도 궁금합니다!
저도 쪽지 부탁드려봐요ㅠㅠ
쪽지 드렸습니다 ㅎㅎ
로켓님 제가 가입한지 10일이 안되서 못보내나봐요ㅠㅠ 어떻게하죠?
저도 궁금하네요.. 조심스럽게 쪽지 부탁드려도 될까요ㅎㅎ
저도 부탁드려도 될까요ㅠㅠ
쪽지 보내주실 수 있나요?ㅠ
저도 쪽지 주시면 감사하겠습니다아아!!
저도 궁금합니다
저도 부탁드립니다!^^ 항상 감사해요
저도 쪽지부탁드려도될까요?ㅜㅜ
저도 부탁드려요 ㅠㅠ
국숭세단라인 성적대에서 표본분석을 통해 유의미한 원서영역 성공을 거두려면 어떤식으로 해야할까요?
수능때 대학 급간이 너무 떨어져서 ㅠㅠ
쪽지 드리겠습니다 ㅎㅎ
저도 쪽지 부탁드립니다
저도 같은 질문으로 쪽지 부탁드립니다!! ㅎㅎ
저도 쪽지 부탁드립니다
저도 부탁드려요ㅠㅠ
쪽지 부탁드립니다!!
저도 쪽지 부탁드려요!
저도 쪽지 부탁드려요ㅠㅜ
저도 쪽지 부탁드려요 퓨ㅠㅠ 감사합니당
글 잘 읽었습니다. 1년 전 글이지만 혹시 댓글을 보신다면 저도 쪽지 부탁드려도 될까요? 비모의지원자는 몇퍼센트로 잡아야 하는지, 모의지원사이트가 예측한 합격인원에 맞춰서 해도 되는지, 지거국 상위라인과 교대 지원에서 표본분석으로 유의미한 결과를 얻으려면 어떻게 하면 좋을지 조언 부탁드립니다. 메리크리스마스!
너무잘읽었어요 ㅎㅎㅎ
쪽지 봐 주시겠어요??
적절한 분석 시기가 언제부터인가요?
빨리 시작하신다면..성적표가 나오고 나서 몇일 후가 좋지 않을까 합니다 ㅎㅎ
감사합니당
감사합니다!
사람이 많아서 헷갈리네요 ㅜㅜ
개인적 질문 있으신 분들은 내용을 쪽지로 보내주시기 부탁드립니다!
좋은 글 감사합니다~
어렵다...
표본은 어떤 식으로 얻는건가요? 건동홍~국숭세단같이 중위권 학교들은 어떤 식으로 해아 하는지도 궁금해요!
저도 이게 궁금하네요 ㅠㅜ
글 감사히 잘 읽었습니다. 많은 도움이 됐어요 ~ ^^
이런 방법이 인서울 하위권 (국숭세단 이하)에서도 도움이 되는 방법일까요? 상위권은 몰라도... 이 구간은 약간 표본에 변수가 많은 걸로 알거든요 ㅠㅠ 어떻게 하면 좋을까요?