본문 바로가기
👩🏻‍💻 강의 기록용/처음 시작하는 데이터 사이언스

6-① 탠서플로우를 통한 데이터 예측

by b5ingbo2ng 2023. 9. 19.

인공지능 ⊃ 머신러닝 ⊃ 딥러닝

  • 인공지능
    • 최근에 등장한게 아니라 1950년대에 등장
    • 하지만, 학습 속도도 느리고, 학습할만한 데이터도 많지 않았음
    • 현재는. 기술의 발전으로 학습속도 빨라지고, 학습할 데이터도 많고, 데이터 저장 수집 장비 저렴해짐 → 빅데이터 처리 가능해짐
  • 머신러닝
    • 기존에 있는 메일, 스팸메일 분류한 데이터를 가지고 학습해서 새로운 메일이 왔을 때 스팸인지 아닌지 구분
    • 정형 데이터는 머신러닝으로 충분히 분류 가능
  • 딥러닝
    • 이미지, 음성, 텍스트 같은 경우는 용량이 훨씬 크고
    • 비정형 데이터는 예측할 때 인공 신경망을 사용해야 훨씬 더 좋은 성능을 낼 수 있음

 

머신러닝 과정

 

머신러닝 구분

  • 정답이 있으면 🙆🏻‍♀️ 지도학습
    • 예측할 데이터가 범주형 데이터 ➡️ 분류
    • 연속된 수치 데이터 ➡️ 회귀
  • 정답이 없으면 🙅🏻‍♀️ 비지도 학습
    • 범주형 데이터 ➡️ 비슷한 범주끼리 묶어주는 군집화 clustering
    • 데이터의 차원을 압축, 요약 ➡️ 차원 축소 기법 사용

 

 

지도학습에서 분류와 회귀의 차이

 

 

지도학습 과정 (for 예측)

  • traing data(모델 학습시킬 데이터), test data(실전 예측)로 나눠야 해
  • 데이터 내에서도 문제와 정답을 따로 나눠
  • 모델을 만들어서 학습하고, 실전 문제를 가지고 예측 → 평가 (정확도 측정)

 

 

 

뉴런

  • 모델을 만들 때, 인공신경망을 사용하는 탠서플로우를 사용한다!
  • 인공신경망 : 인간의 뉴런을 본따서 만든 것
    • 입력 → 연산 (임계치 값에 따라) → 출력

 

 

인공신경망 아키텍쳐 (Layer)

  • 인공신경망을 층층이 쌓아서 구성함 : Layer
    • input layer : 입력층
    • hidden layer : 은닉층 (1개일수도, 여러개 일수도)
    • output layer : 출력층
  • 인공신경망 layer를 직접 구축해서 데이터 예측 가능