ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자기지도 학습과 강화 학습
    ML&DL&AI/인공지능 2024. 6. 21. 14:46
    728x90

    자기지도 학습(self-supervised learning)

    • 자기충분한 양의 레이블이 있는 데이터를 얻기 어려울 때, 레이블이 없는 데이터로부터 학습하는 방법
    • 데이터를 전처리하거나 일부 변형한 후, 원래 데이터로부터 일부 정보를 추출하여 학습에 필요한 레이블을 생성
    • 자기지도 학습은 주로 사전 학습(pre-training) 단계에서 사용되며,
      이 후에 소량의 레이블된 데이터로 모델을 미세 조정(fine-tuning)합니다.

    Pretext Task

    원래 데이터에서 레이블을 자동으로 생성하여 모델을 학습시키기 위한 임시 작업입니다.


    Contranstive Learning

    데이터의 변형된 버전들 간의 유사성을 최대화하고, 다른 데이터들과의 차이를 최대화하여 학습합니다.

    대표적인 방법으로는 SimCLR과 MoCo가 있습니다.

     

    강화 학습 (Reinforcement Learning)

    • 강화 학습은 에이전트가 환경과 상호작용하며 보상을 최대화하는 행동을 학습하는 방법
    • 상태(state)와 행동(action)을 기반으로 보상(reward)을 받고, 이를 통해 학습하여 최적의 정책(policy)을 찾는다.
    • 대표적으로 알파고(바둑)이 있다.

     

     

    728x90

    'ML&DL&AI > 인공지능' 카테고리의 다른 글

    지도학습과 비지도 학습  (0) 2024.06.21
    인공지능, CNN, RNN, GAN  (0) 2024.06.20
Designed by Tistory.