[혼공머신] 혼자 공부하는 머신러닝 & 딥러닝 1주차
글 작성자: _rian
Chapter 1. 나의 첫 머신러닝
- 머신러닝 : 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 찾아내는 알고리즘을 연구하는 분야
- 딥러닝 : 인공신경망을 기반으로 한 방법들을 통칭
- 첫번째 머신러닝 프로그램 : K-Nearest Neighbors 알고리즘으로 도미, 빙어 두 생선을 분류하기
Chapter 2. 데이터 다루기
2-1. 훈련 세트와 테스트 세트
- 지도학습과 비지도 학습
- 지도학습 : 데이터와 "정답"이 있는 경우
- 훈련 세트와 테스트 세트
- 훈련 세트 : 모델 훈련에 사용되는 데이터
- 테스트 세트 : 평가에 사용되는 데이터
- 샘플링편향
- 훈련 세트와 테스트 세트에 샘플이 골고루 섞여있지 않고 한쪽으로 치우친 경우
2-2. 데이터 전처리
- 훈련 세트와 테스트 세트로 나누기
- 사이킷런의
train_test_split()
사용
- 사이킷런의
- 데이터 전처리 (data preprocessing)
- 데이터 특성값을 일정한 기준으로 맞추는 것
- 가장 널리 사용하는 방법 중 하나는 표준 점수 (standard score)
미션
기본 미션
코랩 실습 화면
선택 미션
Ch.02(02-1) 확인 문제 풀고 풀이 과정 정리하기
문제 : 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃을 알고있을 때 사용할 수 있는 학습 방법은 무엇인가요?
- 정답 : 지도학습
- 지도학습은 데이터의 정답이 주어지고 정답을 찾아나가도록 학습하는 것을 의미한다
'머신러닝 꿈나무' 카테고리의 다른 글
[혼공머신] 혼자 공부하는 머신러닝 & 딥러닝 2주차 (1) | 2024.01.14 |
---|---|
강화학습이란? 심층 강화학습에 대한 정의와 종류 (1) | 2024.01.05 |
[Python 데이터 분석 3대장] Numpy 라이브러리 (0) | 2020.08.04 |
데이터의 성능을 높이는 방법 (0) | 2020.08.02 |
[Python 데이터 분석 3대장] 판다스(Pandas) (0) | 2020.01.13 |
댓글
이 글 공유하기
다른 글
-
[혼공머신] 혼자 공부하는 머신러닝 & 딥러닝 2주차
[혼공머신] 혼자 공부하는 머신러닝 & 딥러닝 2주차
2024.01.14 -
강화학습이란? 심층 강화학습에 대한 정의와 종류
강화학습이란? 심층 강화학습에 대한 정의와 종류
2024.01.05 -
[Python 데이터 분석 3대장] Numpy 라이브러리
[Python 데이터 분석 3대장] Numpy 라이브러리
2020.08.04 -
데이터의 성능을 높이는 방법
데이터의 성능을 높이는 방법
2020.08.02