본문 바로가기

Industry Analysis [Data Science]/Kaggle 데이터 분석

(2)
#2 [문돌이들을 위한 캐글 개론 - 2] 캐글 방법론 How To Kaggle? 모든 캐글 competition의 문제들은 각자 다른 방법론과, 다양한 접근이 필요하다. 이는 부정할 수 없는 사실이다. 캐글은 데이터 사이언스 분석의 큰 부분을 맡고 있으며 데이터 수집을 제외한 모든 부분을 직접 해야한다. 캐글 전체를 구성하는 풀이는 공통점을 띈다. 여러 설명글, 책과 초급자를 위한 글을 참고하였으며, 아래의 편집된 부분은 작성자의 주관적인 판단하에 작성된 것이다. 오늘은 이에 대해서 알아보자!! 전통(이라고 할만큼 오래되지는 않았지만)적으로 데이터 마이닝 Data Mining은 다음과 같은 6단계 과정을 거친다. #1 문제 정의 Clarification #2 데이터 수집 & 분석 Data Collection & Analysis #3 데이터 전처리 Data ..
#1 [문돌이들을 위한 캐글 개론 - 1] Why Kaggle? Why Kaggle? 데이터 사이언티스트가 되기 위해 무조건 거쳐야 할 첫 번째(파이썬과 자료구조)도 아니고 두 번째(알고리즘)도 아니고 세 번째 정도 되는 관문이 바로 캐글(Kaggle)이다. 첫 번째와 두 번째를 통과한 소수의 문돌이, 혹은 비전공자들에게 박수를 보낸다. 이제 우리는 캐글과 데이터 사이언스를 시작해볼 아주 미미한 준비가 되었다. 지금까지 해왔던 모든 코딩, 백준, 자료구조와는 딴판인 세계가 준비되어있다. 지금까지 우리는 세상에서 가장 핫한 언어인 영어(파이썬)를 배우고 여러 단어(자료구조)와 문법(알고리즘)을 배웠다. 이제 쓸모 있는 이메일, 레쥬메, 소설(부정적인 경우)을 써야 한다. 사람들이 읽을 만한 가치가 있는 글(대충 데이터 사이언스를 통한 의미 분석)을 써야 한다는 것이다!..