🤖머신러닝🤖 2-1

Notice

Recent Posts

Tags more

Archives

관리 메뉴

코드네임 :

🤖AI/머신러닝, 딥러닝

비엔 Vien 2024. 3. 26. 12:13

ML_Hongong/BreamAndSmelt2.ipynb at main · codenameVien/ML_Hongong

Contribute to codenameVien/ML_Hongong development by creating an account on GitHub.

github.com

지도 학습 :

입력(데이터) 과 타깃(정답)(도미인지 아닌지 여부)으로 이루어진 훈련 데이터가 필요 - 그리고 입력으로 사용된 도미의 길이와 무게가 특성
즉, 입력과 타깃을 전달하여 모델 훈련 후 다음 새로운 데이터를 예측하는 데 활용

비지도 학습 : 타깃(정답) 없이 입력데이터만 사용

즉 무엇을 예측하는 것이 아닌 입력데이터에서 어떤 특징을 찾는데 주로 활용

머신러닝의 정확한 평가를 위해서는 테스트세트(평가에 사용하는 데이터) 와 훈련 세트 ( 훈련에 사용되는 데이터 ) 가 필요

샘플링 편향 주의

사이킷런은 입력 데이터(배열) 이 행은 샘플로, 열은 특성으로 구성되어있을 것으로 기대한다.

[numpy 배열] : 파이썬이 대표적인 배열 라이브러리, 고차원 배열

파이썬 리스트를 넘파이 배열로 바꾸는 법 : 넘파이 array() 함수에 파이썬 리스트를 전달하면 됨

input_arr = np.array(fish_data)

seed() : 넘파이에서 난수를 생성하기 위한 정수 초깃값을 지정

arange() : 일정한 간격의 정수 또는 실수 배열을 만듦 (이거 array + range 인듯)

print(np.arange(3))
>>> [0, 1, 2]

print(np.arange(1,3))
>>> [1, 2]

print(np.arange(1,3,0.2))
[1. , 1.2, 1.4, 1.6, 1.8, 2. , 2.2, 2.4, 2.6, 2.8]

shuffle() : 주어진 배열을 랜덤하게 섞음/ 다차원 배열인 경우 첫번째 축(행)에 대해서만 섞음

arr = np.array([1, 2], [3, 4], [5, 6]])
np.random.shuffle(arr)
print(arr)

>>> [[3 4]
>>>  [5 6]
>>>  [1 2]]

numpy는 "배열 인덱싱" 기능 제공
배열 인덱싱 : 1개의 인덱스가 아닌 여러개의 인덱스로 한번에 여러개의 원소 선택가능

'🤖AI/머신러닝, 딥러닝' Related Articles