인공지능 ⊃ 머신러닝 ⊃ 딥러닝
- 인공지능
- 최근에 등장한게 아니라 1950년대에 등장
- 하지만, 학습 속도도 느리고, 학습할만한 데이터도 많지 않았음
- 현재는. 기술의 발전으로 학습속도 빨라지고, 학습할 데이터도 많고, 데이터 저장 수집 장비 저렴해짐 → 빅데이터 처리 가능해짐
- 머신러닝
- 기존에 있는 메일, 스팸메일 분류한 데이터를 가지고 학습해서 새로운 메일이 왔을 때 스팸인지 아닌지 구분
- 정형 데이터는 머신러닝으로 충분히 분류 가능
- 딥러닝
- 이미지, 음성, 텍스트 같은 경우는 용량이 훨씬 크고
- 비정형 데이터는 예측할 때 인공 신경망을 사용해야 훨씬 더 좋은 성능을 낼 수 있음
머신러닝 과정
머신러닝 구분
- 정답이 있으면 🙆🏻♀️ 지도학습
- 예측할 데이터가 범주형 데이터 ➡️ 분류
- 연속된 수치 데이터 ➡️ 회귀
- 정답이 없으면 🙅🏻♀️ 비지도 학습
- 범주형 데이터 ➡️ 비슷한 범주끼리 묶어주는 군집화 clustering
- 데이터의 차원을 압축, 요약 ➡️ 차원 축소 기법 사용
지도학습에서 분류와 회귀의 차이
지도학습 과정 (for 예측)
- traing data(모델 학습시킬 데이터), test data(실전 예측)로 나눠야 해
- 데이터 내에서도 문제와 정답을 따로 나눠
- 모델을 만들어서 학습하고, 실전 문제를 가지고 예측 → 평가 (정확도 측정)
뉴런
- 모델을 만들 때, 인공신경망을 사용하는 탠서플로우를 사용한다!
- 인공신경망 : 인간의 뉴런을 본따서 만든 것
- 입력 → 연산 (임계치 값에 따라) → 출력
인공신경망 아키텍쳐 (Layer)
- 인공신경망을 층층이 쌓아서 구성함 : Layer
- input layer : 입력층
- hidden layer : 은닉층 (1개일수도, 여러개 일수도)
- output layer : 출력층
- 인공신경망 layer를 직접 구축해서 데이터 예측 가능
'👩🏻💻 강의 기록용 > 처음 시작하는 데이터 사이언스' 카테고리의 다른 글
6-② 탠서플로를 통한 자동차 연비 예측하기 (데이터셋 나누기, 딥러닝 모델 만들기, 딥러닝 모델로 학습과 예측하기) (1) | 2023.09.19 |
---|---|
05-④ 파이썬 EDA - 범주형 변수 (0) | 2023.09.17 |
05-③ 파이썬 EDA - 수치형 변수 (0) | 2023.09.17 |
05-② 판다스 기초와 데이터 요약, 탐색적 데이터 분석 도구 사용하기 (0) | 2023.09.17 |
05-① 파이썬 탐색적 데이터 분석 도구 (0) | 2023.09.12 |