AlphaGo | Neural Networks + Tree Search Knowledge : Human data + Domain knowledge + Known rules |
AlphaGo Zero | Human knowledge 없이 자체적으로 학습 Knowledge : Known rules |
AlphaZero | 모든 게임에 적용할 수 있는 알고리즘 이용 Knowledge : 없음 |
MuZero | Value, Policy, Reward로 환경요소를 모델링 Knowledge : 없음 |
결론 : MuZero 알고리즘이 공개되어, 이제는 규칙을 만들 필요없는 세계를 대비해야 한다. 모든 소프트웨어, 모든 하드웨어 등에 근본적인 변화가 예상된다.
출처1 : 관련기사
관련 논문 : Mastering Atari, Go, chess and shogi by planning with a learned model
관련 코드 : The Arcade Learning Environment is available open source at https://github.com/mgbellemare/Arcade-Learning-Environment. The Go and chess environments are available open source in OpenSpiel at https://github.com/deepmind/open_spiel. The pseudocode for the MuZero algorithm can be found in the file pseudocode.py in the Supplementary Information. All the neural architecture details and hyperparameters are described in Methods.
출처2 : 딥마인드
인공지능 음성, 언어, 영상 분석/처리 전문기업 bory.io/
'AI엔진 > 인공지능 알고리즘' 카테고리의 다른 글
뇌 신경망과 우주 웹 사이 놀라운 유사성 발견 (0) | 2021.03.14 |
---|---|
필기체 OCR(optical character recognition) (1) | 2021.03.09 |
최신 AI 알고리즘동향 (0) | 2021.03.05 |
최근댓글