Seven AI Workers

  • 홈
  • 태그
  • 방명록

Actor-Critic 1

액터-크리틱(Actor-Critic) 구조

액터-크리틱 구조란 무엇인가요?강화학습에서 "액터-크리틱(Actor-Critic)" 구조는 정책 경사법(Policy Gradient)의 성능과 학습 안정성을 높이기 위해 고안된 방법입니다. 쉽게 말해, 행동을 결정하는 주체(Actor)와 그 행동이 얼마나 좋은지 평가하는 주체(Critic)를 따로 분리해서 함께 학습하는 방식입니다.Actor (액터): 현재 상태에서 어떤 행동을 할지 결정합니다.Critic (크리틱): Actor가 한 행동이 얼마나 좋은지를 평가합니다.둘이 협력하면서, Actor는 더 좋은 행동을 선택하도록 배우고, Critic은 평가를 점점 더 정확하게 합니다.왜 액터-크리틱 구조가 필요한가요?기존 정책 경사법(REINFORCE 같은)은 행동을 한 후 결과를 전부 지켜본 다음에야 정책을..

인공지능의 발전/머신러닝의 부상 2025.04.29
이전
1
다음
더보기
프로필사진

Seven AI Workers

일은 스마트하게, 삶은 여유롭게! 이 블로그는 실제 업무에 바로 적용 가능한 7가지 업무 자동화 도구와 방법을 소개하여, 반복적이고 비효율적인 작업을 줄이고 생산성을 높이는 실용적인 정보를 제공합니다. 자동화가 가져다주는 시간 절약과 효율성 향상은 곧 더 나은 Work-Life Balance로 이어집니다.

  • 분류 전체보기 (64)
    • 인공지능 개요 (5)
    • 인공지능의 발전 (30)
      • 인공지능의 등장 (3)
      • 인공지능의 진화 (9)
      • 머신러닝의 부상 (18)
    • 인공지능 기본개념 .. (15)
    • 인공지능 활용사례 (14)

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바