코드네임 :
🤖머신러닝🤖 2-1 본문
https://github.com/codenameVien/ML_Hongong/blob/main/BreamAndSmelt2.ipynb
ML_Hongong/BreamAndSmelt2.ipynb at main · codenameVien/ML_Hongong
Contribute to codenameVien/ML_Hongong development by creating an account on GitHub.
github.com
지도 학습 :
입력(데이터) 과 타깃(정답)(도미인지 아닌지 여부)으로 이루어진 훈련 데이터가 필요 - 그리고 입력으로 사용된 도미의 길이와 무게가 특성
즉, 입력과 타깃을 전달하여 모델 훈련 후 다음 새로운 데이터를 예측하는 데 활용
비지도 학습 : 타깃(정답) 없이 입력데이터만 사용
즉 무엇을 예측하는 것이 아닌 입력데이터에서 어떤 특징을 찾는데 주로 활용
머신러닝의 정확한 평가를 위해서는 테스트세트(평가에 사용하는 데이터) 와 훈련 세트 ( 훈련에 사용되는 데이터 ) 가 필요
샘플링 편향 주의
사이킷런은 입력 데이터(배열) 이 행은 샘플로, 열은 특성으로 구성되어있을 것으로 기대한다.
[numpy 배열] : 파이썬이 대표적인 배열 라이브러리, 고차원 배열
파이썬 리스트를 넘파이 배열로 바꾸는 법 : 넘파이 array() 함수에 파이썬 리스트를 전달하면 됨
input_arr = np.array(fish_data)
seed() : 넘파이에서 난수를 생성하기 위한 정수 초깃값을 지정
arange() : 일정한 간격의 정수 또는 실수 배열을 만듦 (이거 array + range 인듯)
print(np.arange(3))
>>> [0, 1, 2]
print(np.arange(1,3))
>>> [1, 2]
print(np.arange(1,3,0.2))
[1. , 1.2, 1.4, 1.6, 1.8, 2. , 2.2, 2.4, 2.6, 2.8]
shuffle() : 주어진 배열을 랜덤하게 섞음/ 다차원 배열인 경우 첫번째 축(행)에 대해서만 섞음
arr = np.array([1, 2], [3, 4], [5, 6]])
np.random.shuffle(arr)
print(arr)
>>> [[3 4]
>>> [5 6]
>>> [1 2]]
numpy는 "배열 인덱싱" 기능 제공
배열 인덱싱 : 1개의 인덱스가 아닌 여러개의 인덱스로 한번에 여러개의 원소 선택가능
'🤖AI > 머신러닝, 딥러닝' 카테고리의 다른 글
stable diffusion (0) | 2024.04.17 |
---|---|
🤖머신러닝🤖 3-2 (0) | 2024.04.09 |
🤖머신러닝🤖 3-1 (0) | 2024.04.02 |
🤖머신러닝🤖 2-2 (0) | 2024.03.28 |
🤖머신러닝🤖 1 (0) | 2024.03.24 |