본문 바로가기

분류 전체보기210

강화학습 Carpole V0, V1 차이점 OpenAI Gym에는 때때로 동일한 환경의 다른 버전이 있습니다. 다른 버전은 일반적으로 기본 환경 논리를 공유하지만 일부 매개변수는 다른 값으로 구성됩니다. 이러한 버전은 레지스트리 라는 기능을 사용하여 관리됩니다 . CartPole 환경의 경우 이 소스 코드 에서 두 개의 등록된 버전을 찾을 수 있습니다 . 50~65행에서 볼 수 있듯이 v0과 v1로 태그가 지정된 두 개의 CartPole 버전이 있으며 차이점은 매개변수 max_episode_steps와 reward_threshold다음 과 같습니다. register( id='CartPole-v0', entry_point='gym.envs.classic_control:CartPoleEnv', max_episode_steps=200, reward_t.. 2021. 7. 20.
라즈베리파이 피코, 마이크로파이썬 설치하기 이전에 피코보드를 C++로 컴파일 하고 업로드한적이 있다. 한번 경험하신분들은 아시겠지만, 설치할 것도 많고 어렵다. 그래서 피코보드를 마이크로파이썬의 한 종류인 Thonny를 설치 해서 넣는것이다. https://thonny.org/ Thonny, Python IDE for beginners Download version 3.3.11 for Windows • Mac • NB! On Windows you may receive a warning dialog from Defender. Just click "More info" and"Run anyway". Thonny Python IDE for beginners Features Easy to get started. Thonny comes with Python.. 2021. 7. 18.
라즈베리3에서 텐셔 플로우 설치하기 일단 기본적으로 잘 설치되는것 부터 설치 하자. sudo apt-get install python3-pip sudo apt-get install libatlas-base-dev sudo apt-get install python-dev libatlas-base-dev sudo pip3 install gym sudo pip3 install numpy 문제는 텐셔플로우다. 라즈베리3가 arm계열이라 그냥 설치하는 기본 명령으로 설치가 안된다. sudo pip3 install --upgrade tensorflow sudo pip3 install tensorflow 소스를 받아서 컴파일 하면 되겠지만, 이것도 쉬운게 아니고 할 수 있다고 할 수 있는 레벨이 아니다. 소스 컴파일은 상당히 난이도가 있는 작업이다. .. 2021. 7. 18.
cartpole 강화학습 https://sumniya.tistory.com/13 [Part 2] Policy-based Agents(Cart-Pole Problem) 포스팅에 앞서 Reference의 contents를 review하는 글임을 밝힙니다. Part 1과 Part 1.5에 이어 이번 포스팅에서는 제대로된(perfect) 강화학습에 대해 살펴보겠습니다. Part 1.5 포스팅에서는 Part 1과 1.5의 예.. sumniya.tistory.com https://codetorial.net/articles/cartpole/index.html 강화학습 시작하기 (CartPole 게임) - Codetorial Gym 라이브러리 Gym은 강화학습 알고리즘을 개발하고 비교하기 위한 툴킷입니다. agent의 구조에 대해서 어떠한 가.. 2021. 7. 13.
AI 공부하면서 #1(Variable, random.uniform) 본인도 공부하면 정리하는거라, 정답은 아니지만, 그냥 이해하는것을 적는 정도로 받아 주면 좋을듯 텐셔 플로우 1에서 Variable 할당만 하는것으로 값이 저장되지는 않고 세션 실행을 통해서 변수 값이 대입된다. import numpy as np #import tensorflow as tf import tensorflow.compat.v1 as tf tf.disable_v2_behavior() # Input and output size based on the Env input_size = 16 output_size = 4 R = tf.random_uniform([input_size, output_size], 0, 0.01) W = tf.Variable(R) sess = tf.Session() sess.r.. 2021. 7. 13.
강화학습 frozen lake 문제 Key 입력받기 2021년 7월 현재, 파이썬 버전 3.9.6에서 키을 입력받는 방법이다. 문자키와 방향키와 같은 특수키는 다를수 있고 여기서는 특수키, 방향키에 관한 내용이다. 원도우, 리눅스, 코렙등에서 범용적인 방법과 원도우 전용 입력 방법이 있다. 아래의 두개의 코드를 유심히 보면 알수 있을것 같다. 약간의 설명을 넣자면 키를 입력받으면 1바이트 문자와 특수키와 같은 2바이트 문자가 있을수 있으면 readchar와 같은 ANSI 이스케이프 코드를 사용하는 방법과 원도우의 msvcrt의 사용법은 다르다. import readchar LEFT = 0 DOWN = 1 RIGHT = 2 UP = 3 arrow_keys = { '\x1b[A' : UP, '\x1b[B' : DOWN, '\x1b[C' : RIGHT, '\x.. 2021. 7. 12.
AI 교제와 소스 딥러닝 입문 https://github.com/airplane2230/Roadbook_deeplearning GitHub - airplane2230/Roadbook_DeepLearning: The Deep Learning Book Example code for Beginner The Deep Learning Book Example code for Beginner. Contribute to airplane2230/Roadbook_DeepLearning development by creating an account on GitHub. github.com 답러닝 텐서플로우 https://github.com/gilbutITbook/080263 gilbutITbook/080263 Contribute to gilb.. 2021. 7. 9.
pip 인터넷 안될때 설치하기 pip install numpy 혹은 pip download numpy pip install --no-index --find-links numpy-2019.xx.xx.tar.gz numpy 패키지 만들고 설치하기 package.txt 파일에 설치할 목록작성 numpy matplotlib tensorflow pip install -r package.txt 먼저 다운 받고 pip install --no-index --find-links -r package.txt 인터넷 안되는곳에서 설치 pip 업그레이드 c:\python38\python.exe -m pip install --upgrade pip 파이썬 다운 받은 패키지 통채로 복사 C:\Python\Python38\Lib\site-packages 2021. 7. 8.
pip install 설치 안될때 pip --trusted-host pypi.org --trusted-host files.pythonhosted.org install numpy 2021. 7. 8.