ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 통계, 머신러닝, 데이터 마이닝, 인공지능... 학문 분야에 대한 정리
    Data miner 2019. 6. 11. 12:53
    728x90

    * 본 블로그 내용은 연세대학교 김창욱 교수님의 '고등지능정보공학'의 수업 교재 내용을 정리하였습니다(학부생 및 대학원생 분들에게 머신러닝 부분에 대해서 기초를 탄탄하게 할 수 있다는 점에서 추천하는 강좌이기도 합니다.) 개인적인 공부를 위해 작성한 것입니다.

    - 통계, 머신러닝, 데이터 마이닝, 그리고 인공지능...

       학계에서도 다양한 학문 분야들이 융합되어 학문간의 경계가 흐릿해지는 경향이 나타나고 있다. 비슷한 문제를 각각의 학문분야에서도 다루다보니, 각각의 학문이 어떤 뿌리에 근간을 두고 있는지를 알아보는지 잘 몰랐다. 이번 블로그 포스팅을 통해서 정리해보는 기회를 가지도록 한다. 

    통계학(statistics)은 수학의 하위 분야로서, x들의 변수들의 관계를 파악하고자 한다. 이에 대해서, 어떤 가정을 가지고 수학적으로 다루기 쉬운 방식으로 접근한다. 결과값에 대해서는 수학적인 측정 방식으로 검증한다. (ex. p-value, unbiased estimator, asymptotic property, etc) 

    데이터 마이닝(Data mining)은 흔히들 DB라고 불리는 데이터 베이스 영역의 하위 분야로서, 대용량의 데이터 속에서 알고리즘을 통해 패턴을 찾아서 새로운 발견을 하는 것을 의미한다. 데이터 마이닝은 머신러닝과 비교해볼 때, 데이터 자체에 더 큰 비중을 두고 연구된다. 

    인공지능(AI, Artificial intelligence)은 컴퓨터 공학의 하위 분야로서, 합리적이고 이성적인 인간의 행동을 모사하여 학습하고자 한다. 머신러닝이 인공지능의 일종이라고 보기도 하나, 학습 데이터셋(training data)에 반영되지 않은 사건들에 대해서는 학습할 수 없다는 점에서 인공지능 분야와 다르다. 머신러닝의 분야가 기술적으로 인공지능 분야의 하나의 부분이라고 보면 된다. 인공지능 분야는 이 이름에서도 알 수 있듯이, 인간의 지능(intelligence)의 과정과 비슷하게 컴퓨터가 학습해가는 과정이라고 보면 된다. 인간이 최적의 결정을 내리기까지의 과정과 유사하게 학습하며, 특히 '추론'과정을 통해서 새로운 사건을 학습할 수 있다. 

    머신러닝 분야는 인공지능 분야의 일부분으로서, 학습 데이터를 통해서 알고리즘을 다룬다는 특징을 가지고 있다. 이 분야에서는 학습 데이터셋이 아니라 새로운 데이터(test data)를 다룰 때 이에 대한 실제 반응값(y값)을 잘 예측하는 모델을 찾는 것이 주된 목표이다.

     

    이와 관련해서 참고해보면 좋은 신문기사; Forbes/ 2018/07/11

    https://www.forbes.com/sites/forbestechcouncil/2018/07/11/machine-learning-vs-artificial-intelligence-how-are-they-different/#e47249a3521e

     

     

     

     

Designed by Tistory.