본문 바로가기
머신러닝

머신러닝 소개 : 머신러닝 분야의 매력, 활용 사례, 공부 방법

by 데싸루나 2023. 1. 27.

머신러닝 소개 (Introduction to Machine Learning) 

title image
title

머신러닝은 컴퓨터가 룰(rule) 베이스로 프로그래밍되지 않고, 데이터를 통해 학습하고 예측할 수 있도록 해주는 인공지능(AI)의 일종입니다. 컴퓨터가 데이터로부터 학습할 수 있도록 하는 알고리즘과 통계 모델을 다루는 컴퓨터 공학의 한 분야이기도 합니다. 인터넷이 사용 가능해진 이례로 이용 가능한 데이터의 양이 꾸준하게 증가함에 따라, 머신러닝은 최근 몇 년 동안 인기 있고 흥미로운 분야가 되었습니다.

 

 

머신러닝은 왜 재미있고 인기가 많은 분야일까요? 

머신러닝이 인기 있고 흥미로운 주요 이유 중 하나는 기계가 자동으로 학습하고 경험을 통해 향상시키는 능력 때문입니다. 이를 통해 컴퓨터는 사람의 개입 없이 특정 작업을 자동화하고 성능을 향상시킬 수 있습니다. 머신 러닝은 또한 대량의 복잡한 데이터를 빠르게 분석할 수 있도록 해줍니다. 그리고 데이터를 계속해서 학습할수록 모델의 퍼포먼스는 더욱 향상됩니다. 머신러닝은 사람이 풀기 힘든 것을 고효율로 처리할 수 있습니다. 또한 컴퓨팅 능력이 지속적으로 향상됨에 따라 머신러닝이 더욱 폭넓고 다양한 분야에 사용하는 것이 가능해졌고 이로 인해 이 분야는 더욱 인기가 많아지고 또 재미있는 분야로 여겨지고 있습니다.  

머신러닝 활용 사례에는 어떤 것들이 있을까요?

머신러닝은 실생활 여러 곳에서 활용 사례를 찾을 수 있습니다. 

  • 이미지 인식/감지 (Image recognition) : 머신러닝 알고리즘은 이미지와 스피치 인식/감지 분야에 활용 되고 있습니다. 이미지 안에서 사람의 얼굴을 찾거나 동물을 찾아 해당 동물이 어떤 종인지 맞추는 알고리즘이 이에 해당됩니다. 또한 물건 감지(Object Detection)는 self-driving 차량 연구 등에 사용되고 있습니다. 
  • 스피치 인식/감지 (Speech recognition) : 머신러닝 알고리즘은 스피치 인식/감지 분야에도 활용되고 있습니다. 코로나19 이후 zoom 등 온라인을 통한 미팅이 전 세계적으로 활발해졌는데요. 스피커가 말할 때 실시간으로 자막이 달리는 것을 본 적이 있으실 겁니다. 이 역시 Natural Language Processing(NLP) 한국어로는 자연어처리 기술을 이용한 머신러닝 활용사례입니다. 
  • 추천시스템 (Recommendation systems) : 머신러닝 알고리즘은 이커머스나 OTT 서비스의 추천 시스템으로 많이 활용되고있습니다. 쇼핑몰에서 내가 좋아할 만한 상품을 추천해 주는 것을 본 적이 있으신가요? 또 넷플릭스 같은 OTT 서비스 이용 시 내가 좋아할 만한 영화나 드라마를 추천해 주는 것도 아마 보신 경험이 있으실 겁니다. 이렇게 사용자에게 추천을 제공해 주는 것도 머신러닝이 주로 활용되는 분야 중 하나입니다. 
  • 이상/사기 감지 (Fraud detection) : 머신러닝은 금융권에서도 활발하게 활용되고 있습니다. 사기를 감지하는 분야에서 활용되는데 영어로는 Fraud Detection이라고 불립니다. 조금 생소한 나라 온라인 쇼핑몰에서 특정 제품을 구매하기 위해 결제를 했다가 카드사로부터 전화를 받는 경험을 하신 분들이 있을 겁니다. 이 Fraud Detection 알고리즘이 평소 카드 사용 패턴과는 크게 다른 트랜잭션이 일어난 경우 분실/도난 후 사용되었을 가능성이 있기 때문에 이상 거래로 감지하기 때문입니다. 이렇게 이상(Anomaly)을 감지하기 때문에 Anomaly Detection이라고도 불립니다. 
  • 헬스케어 (Healthcare) : 머신러닝은 헬스케어 분야에서도 활발하게 이용되고 있습니다. 환자의 X-ray, CT, MRI 이미지 속에서 종양을 찾아내거나 병 진단, 처방까지 머신러닝기술로 가능해졌습니다. 또한 바이오/제약 분야에서도 복잡한 단백질 구조를 연구하거나 신약을 개발하는 데에도 사용되고 있습니다. 

이는 일부분의 예에 불과합니다. 머신러닝은 정말 폭넓게 많은 분야에 활용되고 있고 기술 또한 급속하게 발전하고 있습니다. 위에서 본 것처럼 헬스케어, 금융, 리테일, 이커머스, 실생활 등 적용될 수 있는 분야가 무궁무진합니다. 기술은 계속해서 진화함에 따라, 미래에 머신러닝이 가져다줄 새로운 가능성과 기회는 얼마나 클지 상상해보세요. 이런 분야를 공부하는 것은 정말로 즐거운 일입니다. : )

 

 

 

머신러닝 공부하려면 어떻게 해야하나요?

how to study
how to study

머신러닝 분야는 너무나도 광범위하기 때문에 공부를 시작하는 입장에서는 어렵고 막막할 수 있습니다. 머신러닝 공부를 시작하는 단계에서는 아래와 같은 기초를 다지는 게 중요합니다.  

 

  • 프로그래밍 기초 배우기: 최근에는 코딩을 배우지 않고도 단순 유저로만 패키지를 활용하거나 GUI 베이스의 툴을 사용하여 머신러닝을 돌리는 방법도 있기는 하지만, 프로그래밍을 할 수 있냐/할 수 없냐 에서 오는 차이는 정말 크다고 할 수 있습니다. 머신러닝 분야에서 가장 폭넓게 사용되는 파이썬(Python)을 추천드립니다. 파이썬은 프로그래밍 언어 중 가장 배우기 쉽고 직관적인 언어중 하나입니다. 파이썬을 다룰 줄 알면 머신러닝 분야뿐만 아니라, 업무 자동화/통계/데이터분석 등 다양한 분야에서 활용할 수 있습니다. R도 배우기 쉽고 데이터 분석 관련 폭넓게 사용되고 있습니다. 파이썬이 조금 어렵게 느껴지신다면 R부터 배워보시는 것도 방법입니다. 하지만 확장성은 파이썬이 훨씬 좋습니다.
  • 수학/통계 공부: 머신러닝은 선형회귀분석, 미적분, 확률/통계에 기반하고 있습니다. 따라서 모델을 이해하기 위해서는 이런 수학과 통계 공부가 수반됩니다. 수학이라고 해서 겁부터 내실 필요는 없습니다. 핵심 개념들에 대해서만 이해하고 있으면 되고 머신러닝 구현시 실제로 수학공식을 구현해야 할 필요는 없기 때문입니다. 파이썬에서는 머신러닝 관련 패키지들을 편리하게 사용할 수 있도록 제공하고 있습니다. 하지만 그래도 머신러닝의 동작 방법을 이해하는 것이 핵심이기 때문에 간과해서는 안되는 부분입니다. 
  • 온라인 강의 수강: 요즘엔 학교나 학원을 통하지 않아도 온라인에 머신러닝을 배울 수 있는 자원이 무궁무진합니다. 유튜브에도 Stanford 등에서 제공하는 무료강의를 포함하여 여러 가지 채널이 있고, 코세라(Coursera)나 유데미(Udemy)는 유명한 온라인 강의 플랫폼입니다. 저렴한 수강료에 여러가지 코스를 들을 수 있습니다. 다만 대부분 영어강의로 제공됩니다. 머신러닝 관련 용어들이 다 영어이기 때문에 영어로 학습하는 것이 도움이 많이 되기도 하니 영어에 크게 거부감이 없다면 영어 강의를 추천드립니다. 
  • 머신러닝 코딩 경험 쌓기: Kaggle은 데이터사이언스/머신러닝 관련 분야 엔지니어들이 실생활 데이터들에 머신러닝을 적용하면서 연습/경합하는 플랫폼입니다. 꼭 경합에 참여하지 않더라도 연습을 위한 데이터를 다운로드하거나, 다른 엔지니어들이 올려놓은 프로그래밍 노트도 참고해 볼 수 있습니다. Github나 StackOverflow 같은 곳에서 남들이 짜놓은 코드를 참조하거나 커뮤니티에서 질문/응답에 참여해 볼 수도 있습니다. 처음에는 남들이 한걸 복사해서 실행해 보는 것으로 시작했다가 차츰 스스로 프로젝트를 해보는 식으로 실력 향상을 해보세요. 

 

이렇게 머신러닝은 다양한 산업에 활용될 수 있는 정말 흥미로운 분야입니다. 공부할 내용이 많기 때문에 도전적일 수는 있습니다. 하지만 배우고자 하는 의지만 있다면 온라인상에 무료 자료들이 무궁무진하기 때문에 누구라도 이 분야에 발을 들여놓을 수 있다고 생각합니다. 머신러닝이 가져다주는 기회를 잡기 위해 지금이라도 공부해 보시는 것을 적극 추천드립니다. ^^

댓글