강화학습 개요에 앞서 머신러닝에 대해 살펴보도록 하겠습니다.

머신러닝은 지도학습, 비지도학습, 강화학습 3가지로 나뉩니다.


지도학습은, 컴퓨터가 풀어낸 결과와 정답을 비교해가며 학습하는 방식입니다.

비지도학습은, 정답이 존재하지않고, 비슷한 것끼리 묶어주는 식의 학습이 비지도학습입니다.


강화학습은, 정답이 주어진것은 아니짐,ㄴ 또한 주어진 데티어테 대해 학습하는 것도 아닙니다. 강화학습은 보상을 통해 학습합니다.




순차적으로 행동을 결정해야하는 문제가 있다고 합시다.

이때 사용하는 방법은 MDP입니다. (Markov Decision Process).

MDP 는 순차적 행동 결정문제를 수학적으로 정의해서 에이전트(행동의 주체, 문제를 풀어나가는 주체)가 순차적 행동 결정 문제에

접근할 수 있게 합니다.



순차적 행동 결정문제의 구성요소


1. 상태

현재 에이전트가 처한 정보라고 생각하면됩니다. 그리고 에이전트가 현재 움직이는 속도와 같은 동적인 요소 또한 상태라고 표현할 수 있습니다.


2. 행동

에이전트가 어떠한 상태에서 취할수있는 행동이로서 "상", "하", "좌", "우" 와 같은것을 말합니다.

처음에는 어떤 행동이 좋은 행동인지에 대한 정보가 전혀없습니다.


3. 보상

보상이라는 정보를 통해 에이전트는 자신이 했던 행동들을 평가할 수 있고 이로인해 어떤 행동이 좋은 행동인지 알 수 있습니다.


4. 정책

순차적 행동 결정문제에서 구해야할 답이 바로 정책입니다. 모든 상태에 대해 에이전트가 어떤 행동을 해야하는지 정해놓은 것이 정책입니다.

순차적 행동 결정문제를 풀었다고한다면 제일 좋은 정책을 에이전트가 얻었다는 것입니다.



안녕하세요. AI를 실습하기 앞서 파이썬을 설치하려고 합니다.저는 파이썬 3버전으로 할거기때문에 아나콘다 역시 3버전을 받을 것입니다.


참고로 파이썬은 제공되는 라이브러리들이 너무 강력해서 비전공자들도 애용하는 컴퓨터 언어입니다. GUI tool을 제공하여 그래프 분석이라든지, AI 라이브러리, 웹페이지 크롤링, 윈도우 시스템 프로그래밍등 지원하지않는 분야가 없을 정도로 막강한 언어라고 할 수 있습니다. 그런데도 안쓰는 이유가 있다면 그것은 아마 무겁기 때문일 것입니다. 원래 JAVA도 90년도에 나왔을때는 무겁고 느리다는 평을 받으면서 등한시 되었었는데요. 파이썬도 곧 하드웨어가 점점점 좋아진다면 더욱 대중화가 되지않을까요?



이제 본격적인 AI 실습에 앞서, 아래 싸이트 들어가셔서 윈도우 아이콘 클릭하세요. (윈도우 운영체제인 분들은 윈도우를 선택하시면 됩니다.)

http://www.continuum.io/downloads





아마도 똑똑한 웹사이트는 지금 여러분의 컴퓨터 사양에 맞는 파이썬 인스톨러를 자동으로 뛰워 줄겁니다.

저는 64비트 PC였기때문에 해당 인스톨러 화면이 나왔습니다. 선택하여 파일을 다운로드 받습니다.







이제 파이썬이 제대로 설치되었는지 파이썬 프로그래밍을 통한 확인이 필요합니다.

윈도 실행창: cmd 엔터를 칩니다. 윈도우 커맨드 창이 열리게 됩니다.



> python --version 엔터를 칩니다.


설치를 하면서 환경변수가 자동으로 설정되었기 때문에 python 명령이 먹히는것을 확인하실 수 있습니다. 제 PC에서는 파이썬 3.6.1 버전이 설치된것을 확인할 수 있습니다. 또한 아나콘다 4.4.0 버전이 설치된것을 확인할 수 있네요.

아까 위에서 파이썬 인스톨러를 설치받을때, 아나콘다 베이스의 파이썬 인스톨러를 받았기 때문에 같이 설치된것을 확인할 수 있습니다.



파이썬 인터프리터역시  설치확인해보겠습니다.

> python 엔터를 칩니다.


그 이후, 

> 1+ 2 엔터 쳐봅니다.


파이썬 인터프리터를 이용하면 대화식으로 프로그래밍 하실수 있습니다.

현재는 1+2를 쳐서 3으로 결과값이 출력된것을 확인하 실 수 있습니다.


원래 제대로 프로그래밍 하기위해서는 변수를 선언하고, 제어문(반복문, 조건문)이나 함수를 작성하여 할 수 있지만, 파이썬은 다음과 같이 인터프리터 방식으로 바로바로 결과가 출력되는 인터프리터 프로그래밍도 지원합니다.


간단하게 테스트를 해보고싶은경우 파이썬 인터프리터를 사용하기도 합니다.



해당 파이썬 인터프리터 창을 종료하시려면 ctrl+z 이후 엔터 치면 종료됩니다. 리눅스와도 같네요.

이상으로 윈도우에서 파이썬 설치 포스팅 마치도록하겠습니다. 감사합니다.

+ Recent posts