본문 바로가기

전체 글215

OpenAI GYM 아타리게임 설치 기본 pip3 install gym-retro python3 -m retro.examples.interactive --game Airstriker-Genesis python3 -m retro.examples.random_agent --game Airstriker-Genesis 간단하게 실해하고 돌아가는것을 볼수가 있다. 출처 http://jinicoding.net/openai-gym-retro-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/ OpenAI Gym Retro 시작하기 – 지니코딩랩 Gym Retro는 게임에 대한 강화학습(reinforcement learning) 연구를 위한 플랫폼입니다. 약 70개의 Atari 게임과 30개의 Sega 게임등 다양한 지원 에뮬레이터를 통해 1.. 2021. 7. 28.
open AI GYM 소스 https://github.com/openai/gym/tree/master/gym 2021. 7. 28.
코렙에서 env.render() 오류방지 !apt-get install -y xvfb x11-utils !pip install gym[all]==0.17.* pyvirtualdisplay==0.2.* PyOpenGL==3.1.* PyOpenGL-accelerate==3.1.* !pip install pyvirtualdisplay 알려준것과 좀 다르다. 본인이 잘되지 않아서 다른것을 하나더 설치 했다. 아직 초보라서 뭐가 뭔지는 모르지만, 일단 화면이 생성되는것 같지는 않고 그냥 돌아가게만 하는 기능 같다. from pyvirtualdisplay import Display import matplotlib.pyplot as plt import random import gym display = Display(visible=False, size=(40.. 2021. 7. 28.
Open AI Gym 클래식 예제 사이트 https://gym.openai.com/envs/#classic_control Gym: A toolkit for developing and comparing reinforcement learning algorithms Open source interface to reinforcement learning tasks. The gym library provides an easy-to-use suite of reinforcement learning tasks. import gym env = gym.make("CartPole-v1") observation = env.reset() for _ in range(1000): env.render() action = env.action_ gym.openai.com 2021. 7. 27.
파이썬 넘파이 그리고 차원, reshape >>> print(a) [1, 2, 3, 4] >>> print(x) [[1 2 3 4]] >>> print(b) [[1] [2] [3] [4]] >>> print(y) [[1 2 3 4]] 일반적인 C언어와 비슷하게 배열과 list의 형태는 비슷하다고 생각 한다. 그냥 1차원의 형태다. 배열에서 확장하다 보면 2차원, 3차원으로 확장된다. 그러나 리스트는 아니다. 그냥 1차원 배열이다. 파이썬에서는 넘파이를 통해서 2, 3차 배열을 표현하고 형태도 바꾸게 된다. 본인도 많이 헷갈리는 부분이다. 리스트의 형태를 2차원 배열로 a = [1, 2, 3, 4] x= np.reshape(a , [1, 4] ) x= np.reshape(a , [1, -1] ) x= np.reshape(a , [-1, 4] ) [.. 2021. 7. 26.
강화학습 Carpole V0, V1 차이점 OpenAI Gym에는 때때로 동일한 환경의 다른 버전이 있습니다. 다른 버전은 일반적으로 기본 환경 논리를 공유하지만 일부 매개변수는 다른 값으로 구성됩니다. 이러한 버전은 레지스트리 라는 기능을 사용하여 관리됩니다 . CartPole 환경의 경우 이 소스 코드 에서 두 개의 등록된 버전을 찾을 수 있습니다 . 50~65행에서 볼 수 있듯이 v0과 v1로 태그가 지정된 두 개의 CartPole 버전이 있으며 차이점은 매개변수 max_episode_steps와 reward_threshold다음 과 같습니다. register( id='CartPole-v0', entry_point='gym.envs.classic_control:CartPoleEnv', max_episode_steps=200, reward_t.. 2021. 7. 20.
라즈베리파이 피코, 마이크로파이썬 설치하기 이전에 피코보드를 C++로 컴파일 하고 업로드한적이 있다. 한번 경험하신분들은 아시겠지만, 설치할 것도 많고 어렵다. 그래서 피코보드를 마이크로파이썬의 한 종류인 Thonny를 설치 해서 넣는것이다. https://thonny.org/ Thonny, Python IDE for beginners Download version 3.3.11 for Windows • Mac • NB! On Windows you may receive a warning dialog from Defender. Just click "More info" and"Run anyway". Thonny Python IDE for beginners Features Easy to get started. Thonny comes with Python.. 2021. 7. 18.
라즈베리3에서 텐셔 플로우 설치하기 일단 기본적으로 잘 설치되는것 부터 설치 하자. sudo apt-get install python3-pip sudo apt-get install libatlas-base-dev sudo apt-get install python-dev libatlas-base-dev sudo pip3 install gym sudo pip3 install numpy 문제는 텐셔플로우다. 라즈베리3가 arm계열이라 그냥 설치하는 기본 명령으로 설치가 안된다. sudo pip3 install --upgrade tensorflow sudo pip3 install tensorflow 소스를 받아서 컴파일 하면 되겠지만, 이것도 쉬운게 아니고 할 수 있다고 할 수 있는 레벨이 아니다. 소스 컴파일은 상당히 난이도가 있는 작업이다. .. 2021. 7. 18.
cartpole 강화학습 https://sumniya.tistory.com/13 [Part 2] Policy-based Agents(Cart-Pole Problem) 포스팅에 앞서 Reference의 contents를 review하는 글임을 밝힙니다. Part 1과 Part 1.5에 이어 이번 포스팅에서는 제대로된(perfect) 강화학습에 대해 살펴보겠습니다. Part 1.5 포스팅에서는 Part 1과 1.5의 예.. sumniya.tistory.com https://codetorial.net/articles/cartpole/index.html 강화학습 시작하기 (CartPole 게임) - Codetorial Gym 라이브러리 Gym은 강화학습 알고리즘을 개발하고 비교하기 위한 툴킷입니다. agent의 구조에 대해서 어떠한 가.. 2021. 7. 13.