본문 바로가기

머신러닝24

article_rep_thumbnail 머신러닝 Cross-Validation 이란? 머신러닝 모델을 데이터 학습시키고 나서 모델이 얼마나 잘 예측하는지 평가를 해봐야 한다. 가장 기본적으로 쓰이는 방법은 데이터를 train 세트와 test 세트로 분리하는 방법이지만 오늘은 여러가지 장점이 있는 Cross-Validation 방법에 대해 알아보고자 한다. 머신러닝 모델 평가 방법 머신러닝 모델을 만들고 이 모델이 얼마나 잘 예측하는지 알아보는 방법은 테스트 데이터를 주고 예측된 값과 실제 정답이 얼마나 맞는지 비교하면 된다. 그러면 테스트 데이터를 어떻게 준비해야할까? 데이터 전체에 대해 학습을 시키고 데이터 전체에 대해 테스트를 해볼 수 있을 것이다. 하지만 이방법은 이미 해당 데이터에 대해 학습이 된 상태이므로 모델의 퍼포먼스가 높게 나올 수 밖에 없다. 그러면 다른 방법으로는 데이터.. 2023. 2. 10.
article_rep_thumbnail 머신러닝 딥러닝 AI의 개념 및 차이점 이해하기 ChatGPT 등 계속되는 AI의 발전으로 이 분야는 계속 뜨거운 관심을 받고 있다. 인공지능 분야에 대해 이야기할 때 AI, 머신러닝, 딥러닝 이 세 가지 용어가 자주 사용된다. 하지만 그 차이점에 대해서는 잘 인식하지 못하는 경우가 많아서 용어가 올바르지 않게 사용되는 경우도 있다. 이 포스팅에서는 이 세 가지 용어의 개념과 차이점에 대해 설명해보고자 한다. AI (Artificial Intelligence - 인공지능) AI(인공지능)은 세가지 중 가장 폭넓은 카테고리이다. 단순 반복적인 일이 아닌 사람의 지능이 필요하다고 인식되어 왔던 일들을 컴퓨터가 하는 것으로 대체되고 있는 분야를 통틀어 칭하는 용어다. 예를 들면 언어를 이해하는 일, 결정을 내리는 일, 복잡한 패턴을 찾아내고 이해하는 일 같.. 2023. 2. 2.
article_rep_thumbnail Classification Decision Tree (결정트리) 개념 - Information gain, impurity, Entropy 이해 Decision Tree(결정트리)는 Classification을 하기 위해 트리를 그려 마지막 leaf node에서 class가 구분되도록 하는 모델이다. Classification이 어떤 방식에 의해 결정이 됐는지 확인하기가 직관적이고 시각화하기 편리해서 많이 사용되는 모델이다. 트리를 그리는 방법 Decision Tree는 제일 처음에 데이터의 속성값들 중에서 하나를 선택해 가장 최상단의 루트 노드로 설정을 하고 그다음 차례대로 그 밑에 노드를 어떤 것을 둘지 결정해 나가며 트리를 그린다. 어떤 순서대로 속성을 선택하여 노드를 두는지 알아보기 위해서는 다음 두 가지 개념을 이해해야 한다. Impurity(불순도)와 Entropy(엔트로피) Impurity(불순도)란 구분된 데이터가 얼마나 서로 다른.. 2023. 2. 1.
article_rep_thumbnail Reinforcement Learning (강화학습) 이란? 강화 학습(Reinforcement Learning)은 에이전트가 환경과 상호 작용하여 의사 결정을 내리는 것을 배우는 머신 러닝의 한 유형입니다. 에이전트는 액션을 취하면서 환경으로부터 보상 또는 페널티를 받게 됩니다. 에이전트의 목표는 환경에서 적절한 조치를 취함으로써 보상 신호를 최대화하는 것입니다. 강화 학습은 로봇 공학, 게임, 금융 등 다양한 분야에서 사용됩니다. Reinforcement Le arning (강화학습) 이란? 강화학습의 정의와 설명 : 강화학습은 에이전트가 특정 행동을 수행하고 그 결과를 관찰함으로써 환경에서 행동하는 방법을 학습하는 머신러닝의 일종입니다. 에이전트의 목표는 바람직한 결과로 이어지는 조치를 취함으로써 보상 신호를 최대화하는 것입니다. 다른 기계 학습 기법과의 비.. 2023. 1. 30.