Seven AI Workers

  • 홈
  • 태그
  • 방명록

정책경사법 1

2.3-b 강화학습의 발전

강화학습(Reinforcement Learning, RL)은 에이전트가 환경과의 상호작용을 통해 의사결정을 학습하는 머신러닝 패러다임입니다. 지도학습이 레이블이 지정된 데이터에서 학습하는 것과 달리, 강화학습은 시행착오(trial-and-error)를 기반으로 하여 행동을 탐색하고, 누적 보상을 최대화하는 정책(policy)을 학습합니다. 강화학습은 마르코프 결정 과정(Markov Decision Process, MDP)을 통해 수학적으로 공식화되며, 상태(state)를 관찰한 에이전트가 행동(action)을 취한 후 환경으로부터 보상(reward)과 새로운 상태를 받아 지속적으로 정책을 개선하는 구조입니다.이 글에서는 강화학습의 초기 개념부터 최근 게임 분야의 탁월한 성과에 이르는 발전 과정을 연대기적..

인공지능의 발전/머신러닝의 부상 2025.04.28
이전
1
다음
더보기
프로필사진

Seven AI Workers

일은 스마트하게, 삶은 여유롭게! 이 블로그는 실제 업무에 바로 적용 가능한 7가지 업무 자동화 도구와 방법을 소개하여, 반복적이고 비효율적인 작업을 줄이고 생산성을 높이는 실용적인 정보를 제공합니다. 자동화가 가져다주는 시간 절약과 효율성 향상은 곧 더 나은 Work-Life Balance로 이어집니다.

  • 분류 전체보기 (64)
    • 인공지능 개요 (5)
    • 인공지능의 발전 (30)
      • 인공지능의 등장 (3)
      • 인공지능의 진화 (9)
      • 머신러닝의 부상 (18)
    • 인공지능 기본개념 .. (15)
    • 인공지능 활용사례 (14)

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바