카테고리 없음

2022 데이터 청년캠퍼스 한국외대 (자연어처리과정) 회고

oogieon_n_on 2022. 8. 31. 19:18

많은 고민끝에 지원후 시작했던 데이터청년캠퍼스가 벌써 끝이났다.

 

매일 왕복 4시간거리를 통학하면서 정말 너무도 길게 느껴졌던 시간들이 막상 몰입하며 팀원들과 프로젝트를 진행하다보니 순식간에 지나가 버려서 너무 당황스럽다. 벌써 가을이 와버렸다니. 살면서 가장 바쁘게 보내본 여름이어서 일주일정도는 푹 쉬면서 남들 쉬는 방학기간을 늦게라도 즐기자 했지만 아예 손을 놓고 있다가는 다시 떠올리기 어려울 것 같은 것들을 더 잊어버리기 전에 정리해놓으려고 한다. 

 

우선 프로그램이 마무리 된 시점에서 전체적인 느낌을 말하면 내가 생각했던 것 만큼 만족스럽지는 않았다.

 

내가 프로그램에 참여하며 느낀 가장 큰 불만 사항은 해당 사업에 참여하는 10여개의 대학중 유일하게 자연어처리 과정을 표방하고 있음에도 딱히 특화된 교육을 깊이있게 제공하지 않는다는 점이었다. 자교생의 비율이 압도적으로 높긴 했지만 같은 조에 속해있던 팀원의 경우에도 외대가 자연어처리 특화 커리큘럼을 선전했기 때문에 굳이 자교의 프로그램을 지원하지 않고 외대까지 왔지만 정작 중요하게 자연어처리에 특화된 내용에 관해 수업을 할때는 허겁지겁 넘어가는 느낌이 너무 강했다. Transformer나 Bert와 같은 최신 논문들은 조교님은 물론이고 교수님도 같이 배워가는 느낌마저 들었고 현업에서 NLP 엔지니어로 일하시는 강사분이 강의를 해주시긴 했지만 할당된 시간이 너무 짧다보니 깊이있는 설명을 기대하기는 어려웠다. 그렇다고 자연어처리까지 가기 이전의 내용들은 충실하게 강의해주는가 하면 그것도 아니다. 듣기로 데이터분석과정을 이야기하는 다른 학교 프로그램의 경우 3주차정도까지는 객체지향의 개념이나 파이썬 기본과 같은 부분에 대해 꽤나 자세하게 학생들에게 알려주는 시간이 많았다고 들었지만 외대 과정은 그런건 없었다. 본격적인 팀프로젝트를 하기 이전까지의 모든 강의 내용들은 학생들에게 공부할 주제를 던져주고 알아서 공부해라 하는 식이었다. 첫주차에 듣던 언어공학 수업이 가장 수업같은 수업일줄은 꿈에도 몰랐었다. 물론 담당교수님 수업때는 배워갈 점도 많고 좋은 수업들도 많았지만 하나씩 내용을 뜯어보면서 이해하고 강의를 꼼꼼하게 하시기에는 시간이 많이 부족해보였다. 할당된 시간이 얼마 없어서 정작 중요하게 듣고 이해해야 될 부분에서는 방치당하는 느낌. 

 

물론 이과정이 요즘 들어 부쩍 늘어난 대부분의 부트캠프의 과정과 상당히 유사하다고 생각한다. 일정수준의 강의를 제공하고 팀원들과의 피어세션을 많이 가지면서 얘기하고 협업하고 발전할 수 있는 플랫폼을 제공하는 그런느낌인거지. 하지만 그런것을 감안하더라도 확실히 외대과정은 강의 내용이 많이 부실했다. 

 

두번째로 어찌보면 첫 불만사항과 이어지는 부분이지만 프로그램을 진행하는 과정에서 쓸데없이 낭비되는 시간들이 많아도 너무 많았다. 특히 초반부에 다들 처음 모인자리이기 때문에 팀별로 자신의 목표를 알아보고 간단하게 레크레이션같은 걸 진행하는 시간들이 있었는데 하루 이틀정도는 이해하지만 생각보다 이 시간들이 2주차 정도까지 길어졌다. 자기계발에 관련된 내용들을 학생들에게 얘기하고 이미지메이킹 강의 같은걸로 하루를 채우기도 하는가 하면 원래 강의를 하시기로 한 머신러닝 수업 교수님은 줌으로 수업을 진행하시거나 일정이 뒤로 밀리는등 힘들게 하루하루 통학하는 입장에서는 짜증이 좀 많이 났다. 

 

더군다나 처음 선택했던 조의 팀원들이 절반이 넘게 중간에 그만두면서 이탈하는 상황이 발생해서 더 멘탈잡기가 힘들었던 것 같다. 세번째 불만사항에 해당하는 부분인데 모집때 부터 인원이 부족해서 추가모집을 하는 등 여러가지 애로사항들이 운영측에서도 있었겠지만 아예 과정자체를 그냥 경험정도로만 여기고 지원해서 오거나 딥러닝이나 자연어처리를 그냥 한번 어떤건지 해보고싶었는데 막상와보니 도저히 아닌것같다 싶어서 나가는 인원들이 특히 우리팀에 많았다. 물론 덕분에 7명에서 3명이 된 팀원들끼리 고생하며 논문 세미나도 성공적으로 마무리하고 개인적으로는 더 성장할 수 있는 기회가 되었던 것 같지만 나처럼 해당분야에 진심이고 어떻게든 따라가서 완주해내겠다라는 마인드를 가진 사람들을 적어도 뽑았으면 좋겠다라는 생각을 많이했다

 

그럼에도 불구하고. 얻은게 정말 많은 프로그램이었다는 생각을 과정이 다 끝나고 나서는 많이 했다.

 

우선 공부해야할 거리들을 정말 많이 얻었다. 해당과정에서 제공해주는 딥러닝과 자연어처리 분야의 책들을 과정이 끝나면 다시 꼼꼼히 읽어보며 공부하고 싶다는 생각이 과정내내 많이 들었다. 팀원들과 프로젝트를 하면서 팀원들이 공부했던 자료들을 새로 알게 되기도 했다. 나는 내가 알고있다고 생각했던 것 보다 아는 것이 없었고 멍청하다고 생각했던것보다는 똑똑했기 때문에 과정에서 겪은 어려움들을 다시 혼자 공부하고 복기하는 과정을 거친다면 제대로 이해할 수 있을 것이라고 확신했다. 특히 그동안 애써 외면하던 알고리즘 공부나 판다스, 넘파이 같은 기본적인 툴들을 정말 능숙하게 다루는 것이 필요하다는 걸 프로젝트를 하면서 정말 많이 느꼈다. 쓰여진 코드들을 따라써보며 이해하는것과 from scratch부터 직접 작성할 줄 아는 것은 완전히 다른 것이라는 걸 최종프로젝트를 진행하면서 뼈저리게 느꼈다. 프로그램 초반부에 낭비된다고 느꼈던 시간들을 혼자서라도 이런 공부들을 하며 보냈다면 더 의미있는 시간이 되지 않았을까 하는 아쉬움이 많이 남는다. 

 

두번째는 정말 귀중한 프로젝트 경험을 했다는 점이다. 첫 팀에서 절반이 넘는 팀원이 이탈하는 상황에서도 논문세미나를 정말 성공적으로 마쳤고 특히 내가 담당했던 부분이 다른 팀원들이 어려워서 기피하던 부분이라 더 뿌듯한 기억으로 남는다. 영어 논문을 직접 읽고 모르겠는 부분들을 유튜브든 블로그든 온갖 자료들을 뒤져가며 어떻게든 완성해낸 나만의 ppt와 설명들이 앞으로도 내가 이길을 가는 것에 있어 큰 자산으로 남을 것 같다.

 

또 최종 프로젝트를 진행하면서는 기존팀의 인원이 부족해졌기 때문에 팀원들과 찢어져 새로운 팀에서 프로젝트를 한달동안 진행했는데 이때의 팀원들이 다들 정말 열심히 참여해줘서 힘든 길이었어도 끝까지 할 수 있었던 것 같다. 주제를 선정하고 결과물을 만들어내는 과정에서 프로젝트의 목표나 필요성, 실현 가능성이라는 문제에 부딪혀 고민도 정말 많이하고 다른 팀에 비해 본격적인 프로젝트에 돌입하는 것이 많이 늦어졌지만 다들 밤낮을 반납하고 어떻게든 프로젝트를 완성해야겠다는 목표를 가지고 달렸던 경험을 할 수 있어서 정말 감사했다. 이 과정을 겪으면서 팀단위의 일을 할때 팀원을 믿기보다는 답답한 마음에 혼자서 많은 부분들을 해결하려 했던 기존의 버릇도 많이 고쳐진 것 같다. 그리고 내가 이해한 내용을 어떻게든 팀원에게 전달하여 하고 있는 작업의 큰 그림에 대해 팀원 모두가 동일한 수준으로 이해하고 프로젝트를 진행하는 것이 진행상황이 조금 느려지더라도 꼭 필요한 프로세스라는 것을 깨달았다. 꽤나 만족스러운 결과물로 프로젝트를 완성해내서 그런지 초기에 목표했던 학교대표로 선발되는 것에는 실패했지만 그 결과에 대해 아쉬움이 남지는 않았다. 직접 버트를 사용해 모델링을 해보고 데이터들을 크롤링을 통해 수집하고 학습에 사용될 수 있게 전처리해주고 매일 새롭게 나타나는 문제점을 어떻게든 나의 방식대로 해결해낸 그 과정들이 정말 기억에 많이 남는다. 최종 15분의 발표에 약 한달간 우리팀이 했던 고민과 해결과정을 상세하게 다 담기에는 시간이 너무 부족했고 그래서 평가의 결과보다는 그 과정을 생생하게 기억하고 또다른 결과물로서 가져가려고 한다. 

 

결과에 큰 의미를 두지 않기로 했으니 이제 남은 것은 그동안의 과정이 머리속에서 미지근해지기 전에 차곡차곡 잘 정리해서 기록해 놓는 것이다. 이번 프로젝트에서 겪었던 어려움들을 어떻게 해결했는지, 그리고 그 부분때문에 앞으로 어떤 부분의 공부가 더 필요하다고 느꼈는지 이런것들을 잘 기억해낸다면 다음 프로젝트때는 좀 더 의미있는 결과물을 낼 수 있지 않을까 생각한다. 다른 곳에서 새로운 프로젝트를 시작하기 전까지 나의 정신이 좀 더 부지런해지길 바라며 글을 마친다.