본문 바로가기
개발/ML

인공지능, 데이터 마이닝, 머신러닝, 딥러닝의 차이점

by 달사쿠 2020. 12. 9.
반응형

오늘은 AI와 관련해서 작성해보고자 합니다. 처음 AI를 접하게 되면, 비슷해보이는 개념에 다른 용어들이 마구 나오는 것을 볼 수 있습니다. 대표적으로 데이터 마이닝 (Data mining), 머신러닝(ML), 인공지능(AI), 딥러닝이 여기에 해당되는데, 뭐가 다른지 잘 모르고 용어를 혼용해서 사용하는 경우가 많습니다. 오늘은 이 4가지 용어에 대해서 차이점을 명확하게 정리해보는 시간을 갖겠습니다.


인공지능 (Artificial Intelligence)

기계학습을 뛰어 넘는 분석기법으로 시스템에 추론능력을 제공한다.

  • 인간 지능의 한 단면을 기계가 모방한 시스템
  • 이전의 패턴이나 지도를 보지 않고도 추론을 통해 구성요소들과 사건 간의 관계를 밝혀낸다.

 


데이터마이닝 (Data mining)

다양한 관점에서 데이터를 분석해 의미를 도출 (데이터의 특징을 알아내는 것이 중점)

  • 보유한 데이터를 다양한 관점에서 분석하고, 그 결과를 유용한 정보로 조합하는 일
  • 방대한 데이터 속에 숨어있던 패턴과 상관성을 통계적 수법들로 식별하여 가치를 부여
  • 숫자가 아닌 데이터도 처리한다는 점에서 통계처리와 구분
  • '데이터 마이닝' 기법에는 일반적으로 연관(association), 회귀(regression) 및 분류(classification)라는 세가지 유형이 있다.
    • 연관 분석
      • 주어진 데이터 셋에서 자주 발생하는 속성값들을 연결해주는 연관 규칙을 발견하는 일
      • ex. 고객이 구매한 쇼핑카트 내의 개별 상품간의 상관관계 식별
    • 회귀 분석
      • 독립 변수 분석을 통해 종속 변수가 무엇인지 밝혀내는 일
      • ex. 어떤 상품의 예상 판매 실적을 두고 주요 고객들의 소득 수준과 상품의 판매가격과의 상관관계로부터 예측하는 방법
    • 분류
      • 개체들을 여러 카테고리로 나누는 일

 


머신러닝 (Machine Learning)

데이터 마이닝이나 기타 학습 알고리즘을 사용하여 지식을 추출하고 이를 경험기반으로 삼아 비슷한 상황의 미래 사건의 결과를 예측(현재 데이터를 가지고 학습 한 뒤, 미래를 예측하는 것에 중점)

  • 인공지능의 한분야
  • 데이터의 패턴을 발견하는 핵심 알고리즘이 동일하지만, 기계학습은 자체 학습 알고리즘을 사용하며 시간이 경과함에 따라 경험을 축적하면서 작업 성능이 향상된다.
  • 데이터를 모델링하는 알고리즘은 여러가지가 있지만, 크게 지도학습(Supervised learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)으로 분류
    • 지도학습
      • 결과를 알고있는, 즉 label이 있는 데이터를 바탕으로 예측하거나 분류하는 것
      • 회귀 분석(Regression), 분류(Classification)
    • 비지도학습
      • label이 없는 데이터에서 패턴을 발견하고, 숨겨진 구조를 찾아내는 것
      • 군집화 (Clustering), 의사결정트리 (Decision Tree)
    • 강화학습
      경험과 시행 착오를 통해 얻어진 데이터를 기반으로 모델을 지속적으로 개선하는 방식으로, 설정된 환경 속에 보상을 주며 학습한다.

딥러닝 (Deep Learning)

여러 비선형 변환기법의 조합을 통해, 다량의 복잡한 자료들에서 핵심적인 내용만 추려내는 작업을 시도하는 머신러닝알고리즘의 집합을 의미
ANN, DNN, CNN, RNN, GAN 등이 있다

ANN (Artificial Neural Network)

  • 딥러닝은 인공신경망(, ANN)를 기초로 하고 있는데, 이는 사람의 신경망 원리와 구조를 모방하여 만든 기계학습 알고리즘이다.
  • 뇌의 뉴런들은 어떤 신호와 자극을 받았을때, 임계값(Threshold)를 넘어서면 결과신호를 전달하는데 이를 착안한 것이 ANN
  • Input Data 가 뇌에서의 자극/신호이며, 가중치(weight) 가 임계값, Output data 가 자극에 의해 하는 행동이라고 생각하면 된다.

출처: https://medium.com/coinmonks/the-artificial-neural-networks-handbook-part-1-f9ceb0e376b4

  • 입력층 (lnput Layer)와 출력층(Output Layer) 사이에 은닉층(Hidden Layer)가 존재하는데, 이 은닉층의 개수와 노드의 개수를 구성하는 것이 모델을 구성하는 것이다. 이때 모델을 잘 구성해서 Output값을 잘 예측하는 것이 우리가 할 일로, 은닉층에서는 활성화함수를 사용해 최적의 weight와 bias를 찾아낸다

DNN (Deep Neural Network)

  • 은닉층을 2개이상 가진 학습방법을 DNN이라고 함
  • 컴퓨터가 스스로 분류레이블을 만들고, 공간을 왜곡하고, 데이터를 구분짓는 과정을 반복하여 최적의 구번선을 도출
  • DNN을 응용한 것이 CNN, RNN 등이다

CNN (Convolution Neural Network)

  • 기존의 방식은 데이터에서 지식을 추출해서 학습했지만, CNN은 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조이다
  • 크게 Convoultion 과정과 Pooling 과정을 통해 진행
  • 자세한 것은 CNN 참고

 


패턴 인식

컴퓨터가 어떤 대상을 인식하는 문제를 다루는 인공지능의 한 분야로, 문자인식, 이미지 인식, 생체 인식, 인간 행동 패턴 분석 등이 속한다.

패턴을 인식하는 과정은 아래와 같다.

출처: http://jun.hansung.ac.kr/PR/02_introduction.pdf


출처 및 참고:

http://news.samsungdisplay.com/12538

https://subscription.packtpub.com/book/data/9781838826321/1/ch01lvl1sec01/defining-ai

https://ebbnflow.tistory.com/119

반응형

'개발 > ML' 카테고리의 다른 글

Machine Learning 개념  (0) 2022.06.16
Inception & Xception  (0) 2020.12.20
CNN(Convolutional Neural Network) 구조와 용어 이해하기  (0) 2020.12.09

댓글