대외활동/포스코 청년 AI 빅데이터 아카데미 17기

[ 청년 AI 빅데이터 아카데미 17기 ] 빅데이터 주간 두 번의 시험, 두 번의 종합과제 그리고 대망의 프로젝트

hae-koos 2022. 3. 21. 14:41
728x90
반응형

 

또 다시 3주가 지났다. 제목처럼 두 번의 시험이 있었고, 두 번의 종합실습 과제와 대망의

프로젝트 및 발표까지 모두 마치고 주말을 맞이했다. 지난주 일요일 조원들과 이태원에서

합숙을 시작하면서 금요일 발표까지 정말 많이 쳐줘야 20시간 잔 것 같다. 사람이 오래

앉아있으면 다리가 붓는다는 것, 아니 그냥 다리가 붓는다는 느낌을 처음 받아봤다 ㅋㅋㅋ

무지막지한 일주일이었지만 정말 오랫동안 기억에 남을 것이다. 사조캐피탈 고생했다 👏

시간 순으로 돌이켜보자.

 

 

마지막 한 주는 빅데이터 과제수행 교재에 따라 프로젝트에 집중했으니 차치하고,

나머지 다섯 권의 교재를 12일에 걸쳐 모두 나갔다. 각 반에 두 분씩 교수님이 배정되고

교수님들은 빅데이터 프로젝트 피드백까지 도맡아 해당 반을 이끌어주신다.

3주가 지나 지금, 허교수님, 황교수님께 굉장히 큰 마음 담아 감사드린다,,,,

사실 중간중간에는 강한 피드백에 조금 섭섭하기도,,, 미워하기도,,, 했다...ㅋㅋㅋ

교수님들 피드백 덕분에 프로젝트를 잘 마쳤고, 개인적으로는 만족스러운 결과물을 냈다.

 

지금까지 학부 내 프로젝트나 병원에서 인턴을 하며 맡았던 과제를 수행함에 있어서

과정에 치우쳐 작업을 했다는 생각을 많이 할 수 있었던 시간이었다. 데이터 분석과 모델링은

결국 비지니스를 해결하기 위한 수단이 되어야지, 수단을 위한 결과를 만들면 쓸모가 없다.

철저히 문제 해결에 집중하여 데이터를 뜯어보고, 플로팅하고, 전처리하는 모든 순간에

왜 이걸 하고 있는지 그 목적에 대해 자주 생각하는 습관을 가져야겠다고 생각했다.

그리고 개선안 도출. 왜 이렇게 내가 만들지도 않은 모델 성능에 집착했었는지 모르겠다.

지금도 기억나는 게, 황교수님이 어떤 모델이 제일 마음에 드냐고 물으셨을 때, GB 모델이

성능도 좋고, 과대적합 양상도 보이지 않아서 좋다고 했다가 말로 두들겨 맞았었다.

지금 생각해보면 데이터마다 모델 성능은 달라지고, 또 같은 데이터라도 어떻게 데이터를

분할해서 실험하느냐에 따라 성능은 또 달라진다. 그리고 무엇보다 성능은 나중 이야기다.

해석과 개선안을 도출할 수 있느냐 없느냐가 포인트다. 이건 앞으로도 꼭 기억하자.

 

다시 돌아오면 위 교재를 차례차례 배교수님까지 세 분이 번갈아 수업을 진행하신다.

크게 데이터 전처리, 이상치와 결측치 파악, 회귀모델, 분류모델, 군집 분석, 연관 규칙 정도?

매 주제마다 실습 과제가 붙어있고, 중간에 종합실습 과제가 회귀에 한 번, 분류에 한 번.

종합실습 과제가 무슨 다 정제된 예쁜 데이터 ? 아니다. POSCO 현업 데이터 던져주신다.

어쩌다보니 두 과제 제출 일자가 선거일로 같았는데 두 번째 과제가 더 포스코에 가까운

주제라 하나에 집중해야 된다면 그 과제에 집중하자 싶어 정말 쏟아부었다. 하지만 다른

반원 분들과 공유해보니 역시.. 세상에는 똑똑한 사람들이 많다. 

 

 

또, 회귀 관련 강의가 끝나면 첫 번째 시험이 있는데 그나마 시험을 준비할 시간이 있다.

반면, 분류 강의가 끝나고 치루는 두 번째 시험은 종합실습과제 한다고 준비할 시간? 없다.

강의 듣고, 실습 과제 본인이 코드 하나하나 치면서 학습하는 것이 최선이다. 성적은 아직

나오지 않았는데.. 그렇게 기대하진 않는다. 예비 18기 분들은 코드 공부 꼭 꼼꼼히 하시길

 

 

노션에 정리한 To do list 인데 정말 이것저것 많다.. 이 글 역시 하루에 다 쓴 게 아니라

지금은 인공지능 주간을 시작한 첫 날인 3월 21일이다. 아두이노 IDE인 Worki를 통해

실시간으로 온도와 습도를 감지하는 센서 관련 구현을 진행했다. 사물인터넷에는 필연적으로

다양한 센서와 통신 모듈이 이용될텐데 그 특성에 적합한 마이크로컨트롤러가 아두이노다.

C 언어 기반의 코드지만 코드 자체가 어렵진 않아서 교재 + 구글링으로 따라가고 있다.

 

배경지식 부재가 가득 묻은 질문에도 자세히 알려주신다...

 

어차피 다음에 다시 쓸 테니까 차치하고, 두 번의 시험이 끝나자마자 선거일에 하루 쉬고(?)

본격적으로 프로젝트가 시작되었다. 우리 조가 맡은 프로젝트는 캐피탈 사 관련 프로젝트.

고객 정보와 대출 정보를 활용해서 매출 증대를 목표로 하는 프로젝트였다. 자세한 내용은

밝히기 어렵겠지만 결과적으로는 연체 확률을 예측하고, 자체적인 신용점수 체계를 확립하여

수익성을 증대한다는 방향성으로 진행하였다. 이제 막 학부를 졸업한 학생들이 캐피탈 사

관련 도메인 지식이 얼마나 있었겠나..전혀 없었다. 단어도 어려웠고, 뭐 이리 비슷한 이름이

많은지 프로젝트가 끝이 보일 때에도 서로 질문을 하면 한참 머리로 정리하고 대답하곤 했다.

 

 

개인 폴더에 있는 파일만 해도 이만큼이다. 6명이 한 조를 이뤄 프로젝트를 진행하니 합하면

어마무시하겠다. 공유 노션에 각자 돌린 결과들이나 파일들을 정리했고, 이번 프로젝트에

가장 큰 공은 노션과 스케치북 ㅋㅋㅋ 이다. 우리 조는 인공지능 플젝도 스케치북과 함께다.

합숙하면서 틈틈이 찍어놓은 사진들로 이번 글은 마무리 !

 

 

오랜만에 아무 걱정없이 주말 푹 쉬었고, 월요일인데 벌써 AI 프로젝트 이야기가 오고간다.

아두이노 관련 일일 과제는 벌써 나왔고, 오늘 스터디 발표도 있고 ~ 목요일 주제 발표도 ~

다시 작업 텐션을 올려보자 - !

728x90
반응형