일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 안드로이드
- randomForest
- 손실함수
- KNN모델
- 크롤링
- 백엔드
- 취업연계
- 국비지원
- 1차프로젝트
- MSE
- 오픈소스깃허브사용
- JSP/Servlet
- springSTS
- 내일배움카드
- MVCmodel
- 프로젝트
- semantic_segmentation
- intent
- gitclone
- 2차프로젝트
- 선형모델 분류
- 2차 실전프로젝트
- ERD
- 활성화함수
- 머신러닝
- 취업성공패키지
- 교차검증
- 비스포크시네마
- 스마트인재개발원
- 하이퍼파라미터튜닝
- Today
- Total
목록분류 전체보기 (79)
또자의 코딩교실
Android OS는 비독점 개발 틀랫폼을 지향하는 개발도구이다. 모바일 환경에서 인터넷을 더 많이 보급시키기 위해 만들어졌으며, 현재 4.1 Jelly bean 부터 11.0 R까지 많은 발전이 이루어 지고 있다. 안드로이드 개발 UI 화면에서 어떤 부분을 클릭하는지에 따라 동작들은 달라지는데 그런 기능들을 구현할 때 작성해야 하는 파일들에 대해 알아보자. ✅ java : 소스코드 및 model // xml : 디자인 레이아웃 및 개체 지정 java파일과 xml파일이 한쌍으로 생성되고 둘중의 하나가 없어서는 안된다. 묶여서 하나로 생성이 되는것을 확인할 수 있음. ✅ 안드로이드 화면에 관한 구성 : view를 구성하는 것들 resource의 역할 : 소리, 이미지, 폰트 등의 모든 자료들을 리소스라고 ..
activation(활성화함수) - 자극에 대한 반응여부를 결정하는 함수 ✅ 문제 유형에 따라 사용되는 활성화 함수와 오차함수 종류 문제 유형 출력층 활성화 함수 오차함수 회귀 linear mean_squared_error 이진 분류 sigmoid binary_crossentropy 다중 분류 softmax categorical_crossentropy 이진분류는 Sigmoid함수를 사용(0과 1로 분류) (0.5를 기준으로 높고 낮은지에 대한 확률 정보를 바탕으로 최종 출력을 결정함) 입력층에서 sigmoid함수는 기울기 손실이라는 단점이 발생함 softmax = 입력받은 값을 출력으로 0~1사이의 값으로 모두 정규화하며 출력 값들의 총합은 항상 1이 되는 특성을 가진 함수 ✅ Back Propagati..
딥러닝이란? = 사람의 신경망을 모방하여 기계가 병렬적 다층 구조를 통해 학습하도록 만든 기술 기계도 사람처럼 생각하게 하기 위해 뉴런을 만들어 생각하게 해보자는 것이 제일 이해하기 쉽게 딥러닝을 설명할 수 있는 방법입니다. 딥러닝은 컴퓨터가 많은 뉴런(선형모델, 즉 퍼셉트론)의 결과를 종합하여 판단을 하는 모델입니다. 딥러닝은 많은 선형모델들이 모여서 구성하고 있습니다. 많은 선형모델은 많은 생각의 가짓수를 뜻합니다. 선형 모델 하나하나 각각은 y=wx+b의 식을 가지는 선형모델이며 각 각 선형모델마다 판단한 결과를 출력합니다. 딥러닝의 특징 - 모델을 사용자가 직접 설계하며 설계하기위해 많은 코드가 필요함 - 처음 사용하는 가중치를 랜덤하게 배정하기 때문에 재시작할때마다 최종 결과값또한 여러번 실행할..
선형모델 : 데이터를 선형 함수로 구분하는 모델. 학습에서 나온 선형함수로 새로운 데이터를 예측함 ✅ 작동방식 입력 특성에 대한 선형 함수를 만들어 예측을 수행함 선형모델은 분류와 회귀문제 모두 해결 가능함 - 분류 : 정답으로 사용할 수 있는 label이 정해져 있음. (=정해진 정답의 종류 중에서 하나를 예측) - 회귀 : 정답으로 사용할 수 있는 label이 정해져 있지 않음. (=정답으로 삼을 수 있는 종류가 엄청나게 많으며 주로 숫자를 예측함.) ✅ 장단점 결과 예측(추론)속도가 빠르다. 대용량 데이터에도 충분히 활용 가능하다. 특성이 많은 데이터 세트라면 훌륭한 성능을 낼 수 있다. 특성이 적은 저 차원 데이터에서는 다른 모델의 일반화 성능이 더 좋을 수 있다. >> 특성확장 필요 과대적합되기..
이번 포스팅에서 다루는 모델들 Random forest Ada Boosting Gradient Boosting Machine XGBoost(lightGBM) Random Forest 과대적합을 이용해서 Bagging을 활용해 진행되는 머신러닝모델 작동방식 Random Sampling을 진행하여 서로 다른 방향으로 과대적합된 트리를 많이 만들고 평균을 내어 일반화 시킴. 각각의 변조된 데이터들을 다 만들고 모델에 돌려버린뒤 다수결로 밀어버리는 방식으로 최종 라벨값을 뽑아내는 모델 수정 가능한 Parameter들은 기존 Decision Tree 모델들과 동일하다 과대적합(Overfitting)문제를 회피하며 모델 정확도를 향상시키려고 개발되었음 장점 단점 - 실제값에 대한 추정값 오차 평균화 - 과대적합 감..
이번 포스팅에서는 머신러닝에 있어 정확도를 올리기 위한 앙상블모델들에 대해 알아보자. Ensemble Model = 여러 머신러닝 모델을 연결하여 더 강한 모델을 만드는 기법. =Voting, Stacking, Bagging, Boosting의 방법으로 동작한다. 우선 앙상블 모델이 동작하는 대표적인 방법 4개에 대하여 알아보자. Voting - 서로 다른 여러개의 학습 모델을 사용하여 평과 결과를 투표하는 방식. - Hard Voting과 Soft Voting의 두가지 방식이 있다. 1. Harding Voting = 여러개의 Sample data에서 나온 예측 결과 값 중 다수결으로 훨씬 표가 많은 값을 최종 예측값으로 결정한다. 2. Soft Voting = Sample data에서 나온 예측 결과..
보호되어 있는 글입니다.
이번시간에는 컬럼데이터의 분포를 정규분포로 만드는 작업인 정규화(Normaliztion)에 대해 알아보자. 대충 저런 그래프를 저런 정규화된 정규분포표 곡선을 닮게 만들도록 갱생시키는 과정이라 생각하면 제일 이해가 빠르다. 정규화(Normalization) 하는 목적은? 데이터는 정규분포를 따라가는 경향이 있고 중앙 표준편차에 맞춰서 정규화를 시키려는 목적에 따라 정규분포값에 맞춰 데이터를 조정하는 것이다. 통계학에 기반하여 정규분포형태의 데이터라면 성능이 좋아지는 경향이 있다. 방법은? 머신러닝 회귀모델을 사용하여 값을 예측해 데이터를 조정하고 정규화 과정에 log함수를 사용한다. 왜 log함수를 사용하는가? : 정규분포로 만들어주는 작업등은 로그함수 말고도 루트를 씌워서 변환하기도 하나 대표적으로 로..