계획했던 마지막 시험이었다...
제안서 작성을 공부하다 다시 파이썬을 하려니 너무 낯설었다.
시험볼 때를 생각해보니 시험장 에어컨이 너무 강해서 손을 덜덜 떨면서 코딩을 했던 기억이 있었다.
아무튼 좋은 결과를 얻었으니 실기 합격 후기를 작성해보려 한다!
[시험개요]
실기시험은 필기와 다르게 과목마다 과락이 존재하지 않는다.
단순히 60점만 챙기면 되니 당연 전략적으로 공부하는게 효과적일 것이다.
작업형 제1유형 | 데이터 수집 및 전처리 |
작업형 제2유형 | 데이터 모델링 |
작업형 제3유형 | 가설검정 |
시험은 3시간동안 진행이 되며, 내 기억에 절반이 지나간 이후부터 화장실 이용이 가능했던 것으로 기억이 난다.
시험 문제는 큰 문제 안에 작은 소문제들이 여러개 있는 형태이다.
따라서 부분점수도 있기 때문에 부분점수를 잘 이용한다면 합격하기도 쉬울 것이라 생각이 든다.
내가 생각했을 때, 각 유형을 이렇게 나눌 수 있을 것 같다.
특히 작업형 제2유형의 경우 배점도 높고 푸는 방법 또한 어렵지 않기 때문에 작업형 제2유형은 기계적으로 코딩이 될 정도로 공부하는 것이 효과적일 것이라 생각한다.
[시험준비]
교재는 예문에듀의 빅분기 실기 대비 책으로 하였는데, 빅분기 실기 교재도 많이 없기도 하였고 모의고사 정리가 잘 된 것 같아 구매를 하였다.
시작은 일주일 전부터 하려 했지만 본격적인 공부는 시험 이틀전부터 진행을 하였다.
전공자이기 때문에 파이썬 앞부분을 공부하지 않아도 괜찮을 것 같아 바로 작업형 제1유형 문제부터 풀기 시작하였다.
오랜만에 파이썬을 해서 낯설어서 틀리더라도 감을 다시 잡으려고 노력을 하였다.
같이 빅분기 실기를 준비하던 사람들은 데이터마님(?), 퇴근 후 데이터 공부(?) 이런 사이트를 이용해서 공부를 한다고 했다. (사이트 이름이 기억이 잘 나지 않아서... 검색을 진행해 보는 것이 좋을 것 같아요...)
나도 한번 들어가서 공부하려 했지만 광고도 많고 보기도 힘들어서 그냥 책에 있는 문제들을 활용하여 공부를 하였다.
특히 제1유형은 하드코딩을 하는 것이 아닌 이상 코딩 방식에는 답이 없다고 생각을 한다.
따라서 답에 의존하는 것이 아니라 자신을 믿고 코딩을 진행했으면 좋겠다.
작업형 제2유형의 경우, 들었던 생각은 '40점을 거저주는 것이 아닌가?'라고 생각이 들 정도였다.
작업형 제2유형은 데이터셋을 읽고 데이터를 확인한 후 결측치가 있다면 평균값 혹은 중앙값 대치, imputer를 사용한 대치를 하여 결측치를 대치해준다. (만약 결측치가 적다면 제거해도 무방할 것 같다.)
그 후, 범주형 변수의 경우 인코딩을 진행해야 하는데 방법에는 제한이 없기 때문에 Label 인코딩을 진행하는 것이 편리할 것이다.
그리고 각 변수 간 범위의 차이가 크다면 스케일링을 고민할 수 있는데 그것은 모델링 방식에 따라 굳이 진행하지 않아도 된다.
그 후, train 데이터를 train과 valid 데이터로 나눈 후 모델링을 진행한다. (이때, 비율은 7:3, 8:2 선택이긴 한데 나는 데이터 크기가 작으면 8:2, 크면 7:3으로 진행한다.)
따라서 모델링이 스케일링을 정할텐데 랜덤포레스트를 사용하는 것이 효과적이다.
랜덤포레스트는 import할 때 분류모델인지 회귀모델인지만 정하면 되기 때문에 쉽고 정확하다. (그리고 스케일링도 할 필요가 없다.)
랜덤포레스트의 하이퍼 파라미터의 경우 선언하지 않는다.
유튜브나 리뷰들을 보면 다들 진행하지 않는다고 한다.
Grid Search를 통해 하이퍼 파라미터를 튜닝을 할 경우 과적합이 되어 점수가 감점이 되는 경우가 많다고 하니 하이퍼 파라미터 튜닝은 진행하지 않는 것이 좋을 것이다.
모델을 학습시킨 후 예측을 하면 2유형은 끝이다.
말을 길게 했을 뿐 사실 코드는 그리 길지 않다.
제3유형이 나에겐 제일 걸림돌이었는데 가설 검증의 경우 이해가 필수적으로 동반이 되어야 한다.
가설 검정을 진행하기 전 정규성 검정이나 등분산성 검정 등 검정 방법 마다 그 전에 수반되어야 할 과정들이 있고 만약 정규성을 만족하지 않는다면 단일 표본 T 검정이 아닌 윌콕슨 검정을 진행하는 등 정말 많은 방법이 있기 때문에 상세히 공부를 해야할 것이다.
따라서 이 부분은 이해를 먼저 하고 공부를 해야 좋은 점수를 얻을 수 있을 것이라 생각이 든다.
마지막 시험이라고 생각이 들어, 끝까지 해보자 해서 역시 졸업한 학교에서 밤새 공부를 하였다.
시험은 아침 10시였기 때문에, 오후에 잠을 좀 자두고 저녁에 학교를 갔다.
피곤하긴 했지만 물과 껌을 씹으면서 잠을 깼고, 시험장으로 향했다.처음 시험을 마주하였을 때, 기존에 내가 코딩하던 환경과 조금 달랐다.
빅분기 실기를 준비하며 이 글을 보는 사람이 있다면 꼭 응시환경을 체험해보고 시험장에 가는 것을 추천한다.
시험장의 코딩환경은 시험을 푸는 파일과 답을 적는 파일이 따로 있었고 너무 낯설어서 그 환경을 이해하는데 시간이 조금 걸렸던 것으로 기억한다.
정말 이렇게 답을 적는 것이 맞는지 의구심이 계속 들어 처음에는 집중도 잘 하지 못했다.
시험 난이도 자체는 2유형 > 1유형 > 3유형이었다.
물론 내 주관적인 생각이지만 2유형의 경우 기계적으로 나올 정도로 공부를 했기 때문에 5분만에 스르륵 풀어갔고, 1유형은 내가 생각했을 때 책에서 공부한 1유형보다 쉬웠던 것으로 기억한다.
오히려 3유형이 매우 어려웠다고 생각이 드는데 문제는 선형회귀와 로지스틱회귀가 나온 것으로 기억한다.
책에 있던 가설검정 문제들과 비슷한 형식이었는데 마지막 로지스틱회귀의 오즈비 문제가 조금 어려웠다.
밤을 새서 그런가 집중도 잘 되지 못했는데 '변수가 5증가하면 오즈비가 얼마나 증가할까?' 문제였다. (자세한 문제는 검색을 한다면 쉽게 찾을 수 있다)
이 문제가 빅분기 실기 8회에서 가장 어려웠던 문제가 아니였나 생각이 든다.
시험장은 광운 인공지능 고등학교였고, 많이 추웠다.
잠 깨려고 커피랑 물도 많이 마셔 화장실도 들리기도 하였고 시험 시험은 3시간이지만 한시간 일찍 나왔던 것으로 기억이 든다.
나오자마자 비가 많이 와서 그냥 비맞으며 집을 갔다... (저녁에 나올 때 우산을 들고가지 않아 비참히 걸어갔다.)
전체적인 시험 난이도 자체는 쉬웠다고 생각이 들고 빅분기 필기를 붙은 사람이라면 쉽게 합격할 수 있을 것이라 생각이 든다.
파이썬 자체가 처음이라면 1~2주 정도는 파이썬과 친해진다고 생각하고 pandas를 같이 익혀나간다면 좋은 결과를 얻을 것이다.
시험도 결과도 나온지 오래되었는데... 그동안 너무 바빠 밀린 글을 쓰고 있다...
빅프로젝트를 시작하고 처음 해보는 QGIS 툴을 만지다 보니 바쁘지만 생각보다 재미가 있다.
계획했던 것 보다 열심히 글을 쓰지 못하고 있지만 시간이 나는 대로 틈틈히 글을 작성을 해야겠다...
돌아보면 매달 2번씩은 시험을 본 것 같은데 대견하기도 하다 ㅎㅎ
아무튼 빅분기를 준비하는 분이 이 글을 본다면 다들 좋은 결과를 얻었으면 좋겠다
끄읕!
'Certificates > 빅데이터 분석기사 (Complete!)' 카테고리의 다른 글
[빅데이터 분석기사] 빅분기 8회 필기 합격 후기 (0) | 2024.04.23 |
---|