Deep learning 17

[Reinforcement Learning / learn article] Policy Gradient (Two-armed Bandit)

Part 0 — Q-Learning Agents 에 이어 다음 포스팅은 Part 1 — Two-Armed Bandit 입니다.https://medium.com/@awjuliani/super-simple-reinforcement-learning-tutorial-part-1-fd544fab149#.16gx1aycu Two-Armed Bandit 은 두 개의 팔을 가진 노상강도 즉 슬롯 머신을 이야기합니다. 슬롯 머신을 노상강로라 표현한 점이 재미있네요.이 포스팅에서는 Policy Gradient 이라는 방법을 설명하기 위해 슬롯 머신이라는 간단한 게임을 이용했습니다.일반적으로 강화 학습에 사용되는 문제는 다음과 같은 특징을 가지고 있습니다.- 다른 행동(action)은 다른 보상(reward)을 가지고 온다..

Deep learning 2017.02.27

[Reinforcement Learning / learn article] Q-Learning

2015년 Deepmind 팀에서 네이처에 발표한 Human-level control through deep reinforcement learning 을 공부하기 위해 기초 지식인 Q-Learning 을 공부하기 위해 자료를 찾던 중 https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-0-q-learning-with-tables-and-neural-networks-d195264329d0#.3q19hd14u위 블로그를 찾게 되어 이 분의 코드를 이용하여 공부를 해봤습니다. 강화 학습(Reinforcement Learning)은 행동에 따른 보상을 지급하여 좋은 점수를 획득하기 위한 행동을 하게 만드는 학습..

Deep learning 2017.02.23

[Supervised Learning / TensorFlow tutorial] Deep MNIST for Experts (CNN)

Deep MNIST for Experts tutorial 에서는 학습 효과를 높이기 위해 Convolutional Neural Network (CNN) 이라는 모델을 사용합니다.https://www.tensorflow.org/tutorials/mnist/pros/ https://en.wikipedia.org/wiki/Convolutional_neural_networkhttps://en.wikipedia.org/wiki/Deep_learninghttps://ko.wikipedia.org/wiki/%EB%94%A5_%EB%9F%AC%EB%8B%9D CNN 은 입력 데이터를 그대로 사용하지 않고 데이터를 가공하고 sub sampling 하여 학습할 데이터를 줄이는 방법으로 2차원 입력 데이터에 적합하여 영상과..

Deep learning 2017.02.04

[Supervised Learning / TensorFlow tutorial] MNIST deep neural network with summaries

MNIST For ML Beginners 에서 작성한 모델의 경우 그 정확도가 92% 정도가 됩니다.다음 TensorFlow tutorial 에서 조금 더 높은 정확도가 나오는 딥러닝 기초 모델을 안내해줍니다.https://github.com/tensorflow/tensorflow/blob/56fc8834c736878af34f00caa95e7d4a57ab01d2/tensorflow/examples/tutorials/mnist/mnist_with_summaries.py 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717..

Deep learning 2017.01.30

[Supervised Learning / TensorFlow tutorial] MNIST For ML Beginners - Softmax regression

MNIST 는 softmax (multinomial logistic) regression 으로 풀 수 있는 가장 기초적인 문제 중에 하나입니다.MNIST 의 각 이미지는 손으로 쓴 0~9 사이의 숫자이며 정답은 10가지 경우 중 하나이고이미지의 각 픽셀 중 글자가 쓰여진 부분으로 학습을 하여 값을 구하기 위한 식(solution)의 변수가 일정한 값으로 수렴할 수 있기 때문에 regression analysis 로 풀 수 있으며 각 값이 0과 1 사이의 값으로 이루어지는 softmax regression 을 통해 어떤 특정 숫자일 가능성을 얻을 수 있습니다. softmax regression 이란 linear regression 와 같이 딥러닝에서 사용되는 기본 개념으로 linear regression ..

Deep learning 2017.01.24

TensorFlow 0.12.1 설치 (Installing from sources for Linux)

ubuntu 환경에 TensorFlow 을 설치해보겠습니다.https://www.tensorflow.org/ 몇 가지 설치 옵션 중 Installing from sources 방법을 사용하겠습니다. 1. mkdir ~/devcd dev $ git clone https://github.com/tensorflow/tensorflow 2. java가 설치되어 있지 않다면 설치$ sudo add-apt-repository ppa:webupd8team/java $ sudo apt-get update $ sudo apt-get install oracle-java8-installer 3. $ echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable ..

Deep learning 2017.01.07

TensorFlow 0.12.1 설치 (Installing from sources for Mac OS X)

TensorFlow 을 mac 환경에 설치해보겠습니다.https://www.tensorflow.org/ TensorFlow 을 설치하는 몇 가지 방법 중Installing from sources: Install TensorFlow by building a pip wheel that you then install using pip위 방법을 사용해보겠습니다. 1.$ git clone https://github.com/tensorflow/tensorflow 2. HomeBrew 설치 http://brew.sh/ 3. $ brew install bazel $ brew install bazel$ brew install bazel 4. $ sudo easy_install -U six $ sudo easy_insta..

Deep learning 2017.01.07