일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- KNN모델
- 2차프로젝트
- 취업연계
- 크롤링
- 오픈소스깃허브사용
- semantic_segmentation
- 선형모델 분류
- 프로젝트
- 스마트인재개발원
- 백엔드
- randomForest
- JSP/Servlet
- 활성화함수
- 교차검증
- 1차프로젝트
- 손실함수
- gitclone
- 비스포크시네마
- 하이퍼파라미터튜닝
- 안드로이드
- 취업성공패키지
- 국비지원
- intent
- 머신러닝
- MVCmodel
- ERD
- springSTS
- 내일배움카드
- 2차 실전프로젝트
- MSE
- Today
- Total
목록분류 전체보기 (79)
또자의 코딩교실
이번시간에는 과대적합을 막기위해 고안된 방법인 교차검증에 대해 알아보자. Cross Validation(CV)이란? 학습-평가 데이터 나누기를 여러 번 반복하여 일반화 에러를 평가하는 방법이다. K-fold cross-validation이란 Train data를 k번만큼 쪼개고 쪼개 얘네를 suffle 시켜서 여러개의 train data에서 임의로 짜집기한 가짜 test data로 정확도를 계산하는 과정을 k번 반복한 뒤, 최후의 test data로 최종 예측점수를 가져오는 방법으로 train data를 굉장히 낯설게 만드는 방법이다. K-fold cross-validation의 동작방법에 대해 알아보자. 데이터 셋을 k개로 나눈다. 첫 번째 세트를 제외하고 나머지에 대해 모델을 학습한다. 그리고 첫 번..
Decision Tree Model이란? = 컴퓨터가 혼자 질문과 답을 진행하는 스무고개. = 질문에 따라 예/아니오로 답하며 데이터를 나누며 나눠지지 않을 때 까지 나누는 과정을 반복하여 학습하는 모델. 분류와 회귀에 모두 사용가능하다. 새로운 데이터가 들어오면 해당하는 범주를 찾아 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구하는 방식으로 작동한다. 특성중요도를 계산하여 어떤 특성이 분류를 가장 효율적으로 수행하는지 계산하여 제공할 수 있다. Decision Tree Model은 어떤식으로 모델이 학습을 진행했는지 시각화 하여 display하기 좋지만, 질문에 따라 데이터를 흑/백으로 일일히 나누려하는 기본적인 작동방식때문에 질문들이 많아질수록 train data에 대해 세세한 공부를 해버..
이번 포스팅에서는 iris데이터를 이용한 knn 분류문제를 실습코드와 함께 알아보자. 아아! iris머신러닝의 향기로운 붓꽃향이란! 무려 1988년에 수집된 이 데이터는 많은 머신러닝 입문자들에게 필수로 거쳐가는 코스일만큼 머신러닝을 실습하기에 사용되는 가장 흔한 데이터이다. 따라서 sklearn library에서 import를 통해 불러올 수 있다. iris데이터를 이용한 KNN분류 실습에서는 꽃들의 Sepal, Petal등의 세부적인 개체의 속성들을 통해 3개~ 4개 여개 중의 붓꽃의 품종(species)를 맞추는 다중 분류의 문제이다. 0 : setosa 품종 1 : versicolor 품종 2 : virginica 품종 iris 데이터에는 약 150여개의 data가 존재한다. 지금부터 파이썬 코드..
하이퍼파라미터와 파라미터의 차이점을 알아봅시다. 야매지만 제가 사용하는 하이퍼파라미터 찾는 법도 기록합니다. Parameter : 파라미터는 데이터를 통해 구해지며 모델 내부적으로 결정되는 값. 사용자에 의해 조정되지 않음. Hyper-Parameter : 사용자가 직접 설정하면 하이퍼 파라미터, 모델 혹은 데이터에 의해 결정되면 파라미터 하이퍼 파라미터 튜닝(Hyper Parameter Tunning)은 KNN 모델의 경우, X1의 갯수만큼 k를 돌리는 반복문을 쓰는 방식으로 하이퍼 파라미터 튜닝을 진행한다. KNN 모델 설정시 세부적으로 설정해 줄 수 있는 변수인 이웃(n_neighbor)의 수를 X1 train data의 전체범위로 하여 이웃의 수가 얼마일때 가장 정확도가 높은지 검증하는 방식으로 ..
스마트 인재개발원의 후반과정을 듣다보면 머신러닝을 배우게 된다. 이때 많이 어려운 머신러닝 공부도 더 하고 2차프로젝트의 탄탄한 기술적 배경을 다지기위해 자체적으로 Kaggle 대회를 개최한다. Kaggle은 이전에 내 블로그 내에서도 타이타닉 분석을 통해 다룬적이 있지만, 캐글은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 이번 Kaggle 대회의 문제는 이진분류 문제로, 쿠팡의 전자 상거래 물품 배송 예측이다. 즉, 물건이 제 시간에 잘 도착했는지, 도착하지 못했는지를 최종 예측하는 문제이다. 현재 총 24명(선생님 한분-팀)의 같은 과정을 수료하는 분들이 참여하고 있다. 한팀 당 6명..
드디어 안드로이드 첫 포스팅! 안드로이드는 굉장히 세세하게 하나하나 다룰 내용이 많다 ㅠ.ㅠ 화면구성 Layout.xml은 다음과 같다. 문제 해결과정 1.입력되는 값과 출력, 전달하는 값을 모두 숫자형 배열의 형태로 정의한다. 2. intent에 입력한 값을 저장하고 출력 activity로 보낸다. 3. 출력/판단 activity에 랜덤수를 6개 생성하고(중복체크 포함) 숫자형 배열에 저장한다. 4. 랜덤수배열과 사용자 입력수배열(두 배열 모두 숫자형 배열)을 생성하고 비교해 정답수를 저장하는 객체생성. 5. 정답수에 따라 다른 결과를 출력하는 if문을 만든뒤 setText 다음은 기존에 작성했던 코드이다. 반복문으로 숫자형 배열을 처리하는것이 아닌 일일히 모든 변수를 설정하여 코드의 효율성이 떨어졌었..
두근두근 최종발표의 날! 힘들던 코딩의 나날들... 가위바위보로 발표 순서를 정했다. 우리 조는 리더의 역량이 부족하고 아무래도 전원이 비전공자여서 그런지 기능을 하나하나 구현하는데도 큰 어려움이 있었고, 프로젝트를 진행하면서 많이 배울 수 있었다. 다음은 Typecast 음성더빙을 사용하여 사이트 시연영상을 만든 것이다. 사이트 시연영상 만약 당신도 프로젝트를 진행하면서 발표를 진행해야 할 일이 있다면, 적극적으로 시연영상을 만들기를 권장한다. 얍삽하게 기술적인 결함이나 부분이 있다면 영상내 편집으로 해결할 수 있고, 직접 앞에서 시연을 하면서 웹사이트에 접속했다가 오류가 나서 뻘쭘해지는 상황을 피할 수 있다. 또한 영상의 형태가 사람들의 이목을 집중하기 쉽다. 최종발표는 내가 맡았었다. 조장의 무게...
이번 포스팅에서는 실제 개발했던 프로젝트 사이트의 이동경로에 맞춘 Back-end Process중 마이페이지 수정 - 영화 메인 페이지 - 영화 상세보기 페이지를 유즈케이스와 화면설계서를 동반하여 설명하고자 한다. 사이트의 서비스 흐름도는 다음과 같다. 사이트 이용 흐름도 이제 각 사이트들의 최종 결과 화면을 보며 백엔드적인 요소들을 살펴보자. 위는 마이 페이지의 화면설계서이다. 코딩이 진행된 View에서 중요한 body 부분만 발췌하겠다. BESPOKE CINEMA Main 캘린더 로그아웃 MBTI 수정 :       INTJ INTP ENTJ ENTP INFJ INFP ENFJ ENFP ISTJ ISFJ ESTJ ESFJ ISTP ISFP ESTP ESFP 수정완료 다음은 사용했..