전체 글 31

[알고리즘연습] 실패율 , 삼총사

1. 실패율 05/04 풀이시간 50분 ; https://school.programmers.co.kr/learn/courses/30/lessons/42889?language=python3 프로그래머스 LV1 / 2019 카카오 신입공채 나의 풀이: def solution(N, stages): rates = {} for i in range(N): rate = stages.count(i+1) if rate == 0: rates[i+1] = 0 continue rate = rate / len([j for j in stages if j >= i+1]) rates[i+1] = rate srted_res = sorted(rates.items(), key = (lambda x: x[1]), reverse=True) ..

카테고리 없음 2023.05.04

LinearAlgebra, Statistics, ML,DL 기초개념 정리

2023.04.23 2023.06.05 수정 선형대수 norm norm이란 벡터의 길이를 나타내는 표현, 2norm을 일반적으로 의미하고 제곱합의 squreroot를 취한 형태로 계산. optimization process에서는 주로, weight을 constraint하는 regularization term. 으로 사용, 최적화문제에서 벡터의 크기를 제한하는 역할을 함. linearly independent란? 선형독립이란, vectorspace V에 속한 원소 {v1,v2,…} 의 선형결합을 동일한 수의 스칼라와의 곱의 합 형태로 나타냈을때 각 원소의 결과값이 전부 0이 되도록 만족하는 경우가 오직 스칼라 람다값이 0인 경우만 존재할 경우, 벡터공간의 원소 v1,v2,..vn을 선형독립이라고 합니다. ..

카테고리 없음 2023.04.23

2022 빅콘테스트 데이터분석 챔피언부문 대상 수상후기

2022년이 벌써 열흘정도밖에 남지 않았다. 정말 바쁘게 보냈던 만큼 믿기지 않을 정도로 빠르게 지나갔던 한해였던 것 같다. 12월이 그동안의 나에게는 늘 좋지 않은 기억이 많은 달이었다. 남들보다 길었던 수험생활과 여러번 쌓인 실패로 인해 우울한 겨울이 많았던 기억때문인지 나는 늘 이런 연말 분위기와 한겨울 찬공기가 싫었다. 아직도 본격적인 추위가 찾아오는 이맘때 쯤이면 그때 생각이 많이난다. 주변은 전부 크리스마스 장식과 연말모임으로 떠들썩한게 나와는 다른 세상의 이야기였고 습관이 되어서 그런지 연말은 집에서 조용히 보낸적이 많다. 이맘때쯤 티비를 틀면 매일같이 진행되는 연말 시상식도 비슷한 맥락으로 나와는 전혀 상관없는 얘기였다. 어렸을때 아빠의 가족으로 회사 시상식에 다닐때는 별 생각이 없었는데 ..

카테고리 없음 2022.12.23

용인시 전기차 충전소 입지선정(1): feature importance

빅콘 데이터분석리그 챔피언부문에서 9월초부터 10월중순까지 진행했던 전기차충전소 입지선정 프로젝트가 끝났다. 팀원들과 몇일밤을 잠 못자가며 하나의 프로젝트를 완성해냈다는 것에서 많이 뿌듯함을 느끼고 있고 한달동안 그동안 접해보지 않은 내용들을 공부하면서 얻은게 많은 것 같다. 해당 프로젝트를 진행하면서 겪었던 내용이나 새로 배운내용들을 머리속에서 지워지기 전에 기록해놓을 예정이다. 프로젝트를 진행하면서 새롭게 진행해본 부분 중 가장 큰 비중을 차지했던 것이 데이터를 바탕으로 분석대상의 특성을 측정해줄 수 있는 정량적인 지수를 만드는 것이었다. "충전소의 입지가 어디에 위치하는 것이 가장 최적일까"를 고민하는 것이 프로젝트의 주제였기 때문에 최종적인 입지를 선정하기 위한 타당한 근거가 필요했고 그러기 위해..

카테고리 없음 2022.10.19

folium 활용해 격자 데이터 만들기

이번 가을에 빅콘 데이터분석리그에서 진행하는 '용인시 전기차 충전소 입지선정' 공모전에 참여하게 되었다. 위치정보를 지도에 매핑하고 특정격자를 학습데이터로 사용하는 모델을 개발해야하는 과제가 생겨서 관련 데이터들을 파이썬으로 다루는 방법을 공부하는데 인터넷에 정보가 생각보다 당황스러울 정도로 없어서 특히 오래걸린 부분을 포스트로 남겨놓고자 한다. 우선 입지선정을 진행하는 기본적인 아이디어는 용인시내에 전기차 충전에 대한 수요가 가장 높은 지점을 선정해서 해당 지점에 충전소를 설치해야하기 때문에 가장 수요가 높은 지역(지점)을 찾는 프로세스가 필요하다. 이 과정에서 설정한 변수들과 수요의 관계를 기계에 학습시켜서 수요를 예측하는 모델을 개발한다고 가정하면 결국 하나의 학습데이터로 쓰이는 것이 하나의 지역이..

카테고리 없음 2022.09.29

MS AI SCHOOL 면접 /합격 후기

학교를 쉬는 동안 AI관련 교육을 수강하기 위한 AI부트캠프에 지원했다. 독학과 부트캠프 사이에서 많은 고민을 하다 부트캠프 지원을 선택한 이유는 우선 데이터청년캠퍼스 과정에서 프로젝트 경험을 해보니 혼자서 공부하는 것도 중요하지만 시작부터 끝까지 완성된 프로젝트 하나 만들어내는 것이 훨씬 더 컴팩트한 경험이라는 확신이 생겼기 때문이다. 또 나는 독학을 하더라도 무엇을 공부해야할지 정확히 알고있는 사람이라고 생각해서 크게 문제되지 않을 거라는 생각을 하긴 했지만 학교라는 공식적인 소속이 없는 상태에서 혼자하는 공부로 시간을 전부 채우려는 계획은 다소 위험하고 지나치게 낙관적인 것이 아닌가 하는 의심이 들었다. 데청캠 과정이 순탄치는 않았지만 얻은게 많은 시간이었기 때문에 데청캠 진행하면서도 과정을 마치고..

카테고리 없음 2022.09.22

2022 데이터 청년캠퍼스 한국외대 (자연어처리과정) 회고

많은 고민끝에 지원후 시작했던 데이터청년캠퍼스가 벌써 끝이났다. 매일 왕복 4시간거리를 통학하면서 정말 너무도 길게 느껴졌던 시간들이 막상 몰입하며 팀원들과 프로젝트를 진행하다보니 순식간에 지나가 버려서 너무 당황스럽다. 벌써 가을이 와버렸다니. 살면서 가장 바쁘게 보내본 여름이어서 일주일정도는 푹 쉬면서 남들 쉬는 방학기간을 늦게라도 즐기자 했지만 아예 손을 놓고 있다가는 다시 떠올리기 어려울 것 같은 것들을 더 잊어버리기 전에 정리해놓으려고 한다. 우선 프로그램이 마무리 된 시점에서 전체적인 느낌을 말하면 내가 생각했던 것 만큼 만족스럽지는 않았다. 내가 프로그램에 참여하며 느낀 가장 큰 불만 사항은 해당 사업에 참여하는 10여개의 대학중 유일하게 자연어처리 과정을 표방하고 있음에도 딱히 특화된 교육..

카테고리 없음 2022.08.31

코딩테스트 with <이코테>, 구현

시뮬레이션 구현 1. 상하좌우 - 첫째 줄에 공간의 크기를 나타내는 n이 주어진다. - 둘째 줄에 여행가 a가 이동할 계획서 내용이 주어진다. - 첫째줄에 여행가 a가 최종적으로 도착할 지점의 좌표(x,y)를 공백으로 구분하여 출력한다. - 입력예시: 5 R R R U D - 출력예시: 3 4 단순한 접근으로 푼 나의 풀이 # 나의 풀이 n = int(input()) plans = input().split() # plans = R R R U D x,y = 1,1 for plan in plans: if plan == 'L': if y == 1: # 이동할 수 없으면 무시 y += 0 else: y -= 1 # 그렇지않으면 이동 elif plan == 'R': if y < n: y += 1 else: y +..

카테고리 없음 2022.07.24

코딩테스트 with <이코테>, Greedy algorithm

당장 좋은 것만 선택하는 그리디 1. 동빈이의 큰수의 법칙 - 떠올려야 할 아이디어 : 1. 가장 큰 수를 k번 더하고 더할때마다 남은 카운트를 줄인다. k 카운트가 다 차면 두번째 큰수로 넘어가서 한번을 더해주고 다시 큰수를 k 만큼 카운트 한다. 이 과정을 m의 남은 카운트가 0이 될때 까지 반복한다. - 입력예시 : 5 8 3 2 4 5 4 6 - 출력예시 : 46 # naive solution # n = 배열의 크기 , m = 숫자가 더해지는 횟수 , k = 최대 반복 수 n, m, k = map(int,input().split()) # n = 5, m= 8 , k =3 data = list(map(int, input().split())) data.sort() first = data[n-1] # ..

카테고리 없음 2022.07.23

Transformer 논문 review (Attention is all you need)

* 2022 데이터청년캠퍼스 한국외대 자연어처리과정 논문세미나 진행하며 사용했던 발표 자료입니다. model architecture설명부분의 모든 이미지 자료들을 직접 제작했습니다. 자연어처리 분야에서 상당히 중요한 논문인 에서 제안된 Transformer model 을 리뷰해보자 2017년 구글이 발표한 논문인 에서 제안된 Transformer는 기존의 seq2seq구조의 인코더 디코더 포맷을 따르면서도 어텐션만으로 구현된 모델 구조를 갖는다. 기존에 널리 사용되던 RNN을 사용하지 않고 더 좋은 성능을 보여주었다는 점에서 NLP분야에서 일종의 game changer가 되었다. 논문이 발표되기 전까지 기존의 언어모델들은 RNN기반의 혹은 CNN기반의 seq2seq모델을 채택해왔다. 이러한 모델은 seq..

카테고리 없음 2022.07.19