일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- intent
- 오픈소스깃허브사용
- 선형모델 분류
- 머신러닝
- 취업성공패키지
- 하이퍼파라미터튜닝
- MSE
- gitclone
- springSTS
- 활성화함수
- 2차 실전프로젝트
- 손실함수
- 국비지원
- MVCmodel
- semantic_segmentation
- 2차프로젝트
- 내일배움카드
- randomForest
- 비스포크시네마
- 안드로이드
- 크롤링
- 취업연계
- JSP/Servlet
- 교차검증
- ERD
- 1차프로젝트
- 스마트인재개발원
- 백엔드
- KNN모델
- 프로젝트
- Today
- Total
목록스마트인재개발원 (10)
또자의 코딩교실
✅ Source of data collection Stanford Dog set - 'http://vision.stanford.edu/aditya86/ImageNetDogs/' DogFaceNet - 'https://github.com/GuillaumeMougeot/DogFaceNet' Web Crwaling - Various dogs of emoji Animation - Howl's Moving Castle(2004), Spirited Away(2001), My Neighbor Totoro(1988) ✅ 기존 데이터 수집 단계 [현재 확정된 할일] ~ 21/12/21 강아지 데이터 수집(웹 크롤링) 및 데이터 전처리(확실히 전처리) : 실사와 그림데이터 수집. 추후 자세한 사항 안내 예정. ~ 21/1..
(제가 만든 기획 발표 ppt의 저작권은 블로그 주인인 저에게 있습니다.) 이번 스마트 인재개발원에서 진행하는 2차 프로젝트가 본격적으로 시작되었습니다. 2차 프로젝트는 수료를 얼마 남지 않은 시점에서 진행하는 만큼, 모두가 열심히 참여하고 퀄리티또한 좋은 모두 심혈을 기울이는 프로젝트라 할 수 있습니다. 1차 프로젝트와 다른 점은, 2차 프로젝트는 공모전이나 협약 기업의 멘토링을 받으면서 진행할 수 있단 점입니다. 일정은 이렇게 진행되었습니다. 블로그 글 작성이 뜸했던 이유또한 이렇습니다. (ㅠㅠ) 팀원들과의 공유문서를 통한 협업으로 진행되었습니다. 다음은 저희 팀의 기획서를 열람하실 수 있는 공유문서 링크입니다. 반려 동물 시장규모는 급격하게 증가하고 있으며, 관련 산업 분야또한 급격하게 활성화 되고..
선형모델 : 데이터를 선형 함수로 구분하는 모델. 학습에서 나온 선형함수로 새로운 데이터를 예측함 ✅ 작동방식 입력 특성에 대한 선형 함수를 만들어 예측을 수행함 선형모델은 분류와 회귀문제 모두 해결 가능함 - 분류 : 정답으로 사용할 수 있는 label이 정해져 있음. (=정해진 정답의 종류 중에서 하나를 예측) - 회귀 : 정답으로 사용할 수 있는 label이 정해져 있지 않음. (=정답으로 삼을 수 있는 종류가 엄청나게 많으며 주로 숫자를 예측함.) ✅ 장단점 결과 예측(추론)속도가 빠르다. 대용량 데이터에도 충분히 활용 가능하다. 특성이 많은 데이터 세트라면 훌륭한 성능을 낼 수 있다. 특성이 적은 저 차원 데이터에서는 다른 모델의 일반화 성능이 더 좋을 수 있다. >> 특성확장 필요 과대적합되기..
이번 포스팅에서 다루는 모델들 Random forest Ada Boosting Gradient Boosting Machine XGBoost(lightGBM) Random Forest 과대적합을 이용해서 Bagging을 활용해 진행되는 머신러닝모델 작동방식 Random Sampling을 진행하여 서로 다른 방향으로 과대적합된 트리를 많이 만들고 평균을 내어 일반화 시킴. 각각의 변조된 데이터들을 다 만들고 모델에 돌려버린뒤 다수결로 밀어버리는 방식으로 최종 라벨값을 뽑아내는 모델 수정 가능한 Parameter들은 기존 Decision Tree 모델들과 동일하다 과대적합(Overfitting)문제를 회피하며 모델 정확도를 향상시키려고 개발되었음 장점 단점 - 실제값에 대한 추정값 오차 평균화 - 과대적합 감..
이번 포스팅에서는 iris데이터를 이용한 knn 분류문제를 실습코드와 함께 알아보자. 아아! iris머신러닝의 향기로운 붓꽃향이란! 무려 1988년에 수집된 이 데이터는 많은 머신러닝 입문자들에게 필수로 거쳐가는 코스일만큼 머신러닝을 실습하기에 사용되는 가장 흔한 데이터이다. 따라서 sklearn library에서 import를 통해 불러올 수 있다. iris데이터를 이용한 KNN분류 실습에서는 꽃들의 Sepal, Petal등의 세부적인 개체의 속성들을 통해 3개~ 4개 여개 중의 붓꽃의 품종(species)를 맞추는 다중 분류의 문제이다. 0 : setosa 품종 1 : versicolor 품종 2 : virginica 품종 iris 데이터에는 약 150여개의 data가 존재한다. 지금부터 파이썬 코드..
스마트 인재개발원의 후반과정을 듣다보면 머신러닝을 배우게 된다. 이때 많이 어려운 머신러닝 공부도 더 하고 2차프로젝트의 탄탄한 기술적 배경을 다지기위해 자체적으로 Kaggle 대회를 개최한다. Kaggle은 이전에 내 블로그 내에서도 타이타닉 분석을 통해 다룬적이 있지만, 캐글은 2010년 설립된 예측모델 및 분석 대회 플랫폼이다. 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 이번 Kaggle 대회의 문제는 이진분류 문제로, 쿠팡의 전자 상거래 물품 배송 예측이다. 즉, 물건이 제 시간에 잘 도착했는지, 도착하지 못했는지를 최종 예측하는 문제이다. 현재 총 24명(선생님 한분-팀)의 같은 과정을 수료하는 분들이 참여하고 있다. 한팀 당 6명..
드디어 안드로이드 첫 포스팅! 안드로이드는 굉장히 세세하게 하나하나 다룰 내용이 많다 ㅠ.ㅠ 화면구성 Layout.xml은 다음과 같다. 문제 해결과정 1.입력되는 값과 출력, 전달하는 값을 모두 숫자형 배열의 형태로 정의한다. 2. intent에 입력한 값을 저장하고 출력 activity로 보낸다. 3. 출력/판단 activity에 랜덤수를 6개 생성하고(중복체크 포함) 숫자형 배열에 저장한다. 4. 랜덤수배열과 사용자 입력수배열(두 배열 모두 숫자형 배열)을 생성하고 비교해 정답수를 저장하는 객체생성. 5. 정답수에 따라 다른 결과를 출력하는 if문을 만든뒤 setText 다음은 기존에 작성했던 코드이다. 반복문으로 숫자형 배열을 처리하는것이 아닌 일일히 모든 변수를 설정하여 코드의 효율성이 떨어졌었..
이번 포스팅에서는 실제 개발했던 프로젝트 사이트의 이동경로에 맞춘 Back-end Process중 첫화면 - 회원가입 - 로그인 - MBTI추천 메인사이트를 유즈케이스와 화면설계서를 동반하여 설명하고자 한다. 사이트의 서비스 흐름도는 다음과 같다. 이제 각 사이트들의 최종 결과 화면을 보며 백엔드적인 요소들을 살펴보자. 위는 첫화면의 화면설계서이다. 코딩이 진행된 View에서 중요한 body 부분만 발췌하겠다. 로그인 당신만의 영화를 찾으세요 여기,  BESPOKE CINEMA에서 회원가입 a태그에 herf 속성을 주고 사이트 내 context path뒤, Handler Mapping이 이동할 경로인 memberForm.do(회원가입) 로 이동하도록 설정하였다. 같은 방식으로 로그인또한 설정하였다..