본문 바로가기

AI 학습17

코렙에서 env.render() 오류방지 !apt-get install -y xvfb x11-utils !pip install gym[all]==0.17.* pyvirtualdisplay==0.2.* PyOpenGL==3.1.* PyOpenGL-accelerate==3.1.* !pip install pyvirtualdisplay 알려준것과 좀 다르다. 본인이 잘되지 않아서 다른것을 하나더 설치 했다. 아직 초보라서 뭐가 뭔지는 모르지만, 일단 화면이 생성되는것 같지는 않고 그냥 돌아가게만 하는 기능 같다. from pyvirtualdisplay import Display import matplotlib.pyplot as plt import random import gym display = Display(visible=False, size=(40.. 2021. 7. 28.
Open AI Gym 클래식 예제 사이트 https://gym.openai.com/envs/#classic_control Gym: A toolkit for developing and comparing reinforcement learning algorithms Open source interface to reinforcement learning tasks. The gym library provides an easy-to-use suite of reinforcement learning tasks. import gym env = gym.make("CartPole-v1") observation = env.reset() for _ in range(1000): env.render() action = env.action_ gym.openai.com 2021. 7. 27.
강화학습 Carpole V0, V1 차이점 OpenAI Gym에는 때때로 동일한 환경의 다른 버전이 있습니다. 다른 버전은 일반적으로 기본 환경 논리를 공유하지만 일부 매개변수는 다른 값으로 구성됩니다. 이러한 버전은 레지스트리 라는 기능을 사용하여 관리됩니다 . CartPole 환경의 경우 이 소스 코드 에서 두 개의 등록된 버전을 찾을 수 있습니다 . 50~65행에서 볼 수 있듯이 v0과 v1로 태그가 지정된 두 개의 CartPole 버전이 있으며 차이점은 매개변수 max_episode_steps와 reward_threshold다음 과 같습니다. register( id='CartPole-v0', entry_point='gym.envs.classic_control:CartPoleEnv', max_episode_steps=200, reward_t.. 2021. 7. 20.
라즈베리3에서 텐셔 플로우 설치하기 일단 기본적으로 잘 설치되는것 부터 설치 하자. sudo apt-get install python3-pip sudo apt-get install libatlas-base-dev sudo apt-get install python-dev libatlas-base-dev sudo pip3 install gym sudo pip3 install numpy 문제는 텐셔플로우다. 라즈베리3가 arm계열이라 그냥 설치하는 기본 명령으로 설치가 안된다. sudo pip3 install --upgrade tensorflow sudo pip3 install tensorflow 소스를 받아서 컴파일 하면 되겠지만, 이것도 쉬운게 아니고 할 수 있다고 할 수 있는 레벨이 아니다. 소스 컴파일은 상당히 난이도가 있는 작업이다. .. 2021. 7. 18.
cartpole 강화학습 https://sumniya.tistory.com/13 [Part 2] Policy-based Agents(Cart-Pole Problem) 포스팅에 앞서 Reference의 contents를 review하는 글임을 밝힙니다. Part 1과 Part 1.5에 이어 이번 포스팅에서는 제대로된(perfect) 강화학습에 대해 살펴보겠습니다. Part 1.5 포스팅에서는 Part 1과 1.5의 예.. sumniya.tistory.com https://codetorial.net/articles/cartpole/index.html 강화학습 시작하기 (CartPole 게임) - Codetorial Gym 라이브러리 Gym은 강화학습 알고리즘을 개발하고 비교하기 위한 툴킷입니다. agent의 구조에 대해서 어떠한 가.. 2021. 7. 13.
강화학습 frozen lake 문제 Key 입력받기 2021년 7월 현재, 파이썬 버전 3.9.6에서 키을 입력받는 방법이다. 문자키와 방향키와 같은 특수키는 다를수 있고 여기서는 특수키, 방향키에 관한 내용이다. 원도우, 리눅스, 코렙등에서 범용적인 방법과 원도우 전용 입력 방법이 있다. 아래의 두개의 코드를 유심히 보면 알수 있을것 같다. 약간의 설명을 넣자면 키를 입력받으면 1바이트 문자와 특수키와 같은 2바이트 문자가 있을수 있으면 readchar와 같은 ANSI 이스케이프 코드를 사용하는 방법과 원도우의 msvcrt의 사용법은 다르다. import readchar LEFT = 0 DOWN = 1 RIGHT = 2 UP = 3 arrow_keys = { '\x1b[A' : UP, '\x1b[B' : DOWN, '\x1b[C' : RIGHT, '\x.. 2021. 7. 12.
AI 교제와 소스 딥러닝 입문 https://github.com/airplane2230/Roadbook_deeplearning GitHub - airplane2230/Roadbook_DeepLearning: The Deep Learning Book Example code for Beginner The Deep Learning Book Example code for Beginner. Contribute to airplane2230/Roadbook_DeepLearning development by creating an account on GitHub. github.com 답러닝 텐서플로우 https://github.com/gilbutITbook/080263 gilbutITbook/080263 Contribute to gilb.. 2021. 7. 9.
AI, 인공지능 무료강의 정리 https://www.inflearn.com/course/reinforcement-learning#curriculum https://www.inflearn.com/course/%EA%B8%B0%EB%B3%B8%EC%A0%81%EC%9D%B8-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%94%A5%EB%9F%AC%EB%8B%9D-%EA%B0%95%EC%A2%8C [무료] 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌 - 인프런 | 강의 더 많은 분들이 머신 러닝과 딥러닝에 대해 더 이해하고 본인들의 문제를 이 멋진 도구를 이용해서 풀수 있게 하기위해 비디오 강의를 준비하였습니다. 더 나아가 이론에만 그치지 않고 최근 구 www.inflearn.com 2021. 6. 23.