'Intelligence Convergence'에 해당되는 글 519건

2018.11.16 [React + Meteor] 개발환경 설정 - 2
2018.11.13 [React + Meteor] 개발환경 설정 - 1
2018.10.23 [BlockChain] Onther DevCon 1 - go-ethereum 동작방식
2018.10.23 [BlockChain] Onther DevCon 1 - Etherum 2.0 개요
2018.10.18 [뉴로모픽] 인공지능과 하드웨어의 결합 워크샵
2018.10.17 [Vega] Vega, Vega-lite 넌 뭐니
2018.09.14 [React] 다시 시작하기
2018.08.22 [Chanwoo Jacod Lee] Tensorflow 강좌 정리
2018.08.21 [Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2
2018.08.16 [Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 1
2018.08.11 [Cost Function] 로지스틱 회귀의 비용함수 이해
2018.07.31 [인공지능] 공부 여정
2018.07.19 [Machine Learning - NG] Linear Algebra - 선형 대수학1
2018.07.19 [Machine Learning - NG] Gradient Descent
2018.07.16 [Machine Learning - NG] Supervised Learning
2018.07.13 [Reinforcement Learning] Q Network
2018.07.12 [Reinforcement Learning] 강화학습
2018.07.11 [RNN] Basic & Training 하기
2018.07.11 [RNN] Recurrent Neural Network 개념
2018.07.11 [CNN] Class, tf.layers, Ensemble

2018. 11. 16. 16:07 Meteor/React + Meteor

[React + Meteor] 개발환경 설정 - 2

Meteor에서 Redux 환경을 설정하고, 애플리케이션에 적용해 본다.

- Meteor Collection의 Pub/Sub 설정

- Collection의 CRUD 서비스 클래스 개발

- Redux 환경 설정

- Redux의 action, reducer 개발 및 store 설정

- 애플리케이션에 Redux action 호출하기

- 소스코드

MongoDB Collection Pub/Sub 설정

기본설치를 하게 되면 autopublish 미티어 패키지가 설치되어 있다. 삭제한다.

$ meteor remove autopublish

삭제를 하면 links 컬렉션으로 부터 데이터를 받지 못한다. 이제 필요한 것을 받기 위해 publish, subscribe를 설정한다.

- server/main.tsx에서 insertLink 코드를 제거한다.

- server/main.tsx에서 links 코드 import 문을 수정한다.

// main.tsx 전체코드

import { Meteor } from 'meteor/meteor';

import '../imports/api/links'; // 서버에서 사용하기 위해 반드시 import해야 한다. 하지 않으면 collection 생성, 제어를 못 한다.

Meteor.startup(() => { }); // 텅빈 코드 블록

- imports/api/links.ts 에 publish 한다.

if (Meteor.isServer) {

Meteor.publish('links', () => Links.find());

}

- subscribe를 사용할 때 미티어의 Tracker.autorun을 사용하지 않고, React의 props에 subscribe정보를 바로 맵핑해 주는 withTracker를 사용하기 위해 react-meteor-data 패키지를 사용한다.

$ meteor npm install --save react-meteor-data

- imports/api/ui/Info.tsx에 withTracker를 설정한다.

import { Meteor } from 'meteor/meteor';

import Links from '../api/links';

interface InfoProps {

links: any;

loading: boolean;

}

// 맨 하단

export default withTracker(() => {

const handle = Meteor.subscribe('links');

return {

links: Links.find().fetch(),

loading: !handle.ready()

}

})(Info);

MongoDB Collection CRUD

간단한 Link CRUD 애플리케이션을 만든다.

- Collection의 CRUD 로직을 담은 service를 생성한다. imports/ui밑에 link폴더를 생성한다.

// imports/ui/link/link.service.ts

import Links from '../api/links';

class LinkService {

addLink({title, url}) {

Links.insert({title, url, createAt: new Date()});

}

removeLink(_id: string) {

Links.remove(_id);

}

updateLink(_id: string, {title, url}) {

Links.update(_id, {title, url, updateAt: new Date()});

}

export const linkService = new LinkService();

- imports/ui/link/AddLink.tsx 파일 추가

import * as React from 'react';

import { linkService } from './links.service';

export interface AddLinkProps {

}

export default class AddLink extends React.Component<AddLinkProps, any> {

handleSubmit = (e: any) => {

//ignore validation

e.preventDefault();

const param = {

title: e.target.title.value,

url: e.target.url.value

}

linkService.addLink(param);

};

public render() {

return (

</form>

)

}

- imports/ui/App.tsx에서 <Info/> 만 남기고 삭제하고, Info.tsx에 AddLink를 추가한다.

// App.tsx

class App ... {

render() {

return (

)

}

// Info.tsx

class Info ... {

render() {

return(

<div>

....

</div>

)

}

- link폴더 밑에 LinkList.tsx와 Link.tsx를 추가한다.

// Link.tsx

import * as React from 'react';

export interface LinkProps {

link: any

}

export default class Link extends React.Component<LinkProps, any> {

public render() {

const { link } = this.props;

return (

<a href={link.url} target="_blank">{link.title}</a>

</li>

);

}

// LinkList.tsx

import * as React from 'react';

import Link from './Link';

export interface LinkListProps {

links: any[]

}

export default class LinkList extends React.Component<LinkListProps, any> {

public render() {

const links = this.props.links.map(

link => <Link link={link}/>

);

return (

<div>

<h2>Links</h2>

<ul>{links}</ul>

</div>

);

}

- Info.tsx에서 LinkList를 사용토록 변경한다.

class Info extends React.Component<InfoProps, any> {

linkList() {

const { links, loading } = this.props;

if (loading) {

return <div>loading...</div>

} else {

return <LinkList links={links} />

}

render() {

const { links } = this.props;

return (

<div>

{this.linkList()}

</div>

);

}

- 마지막으로 link 삭제를 한다.

// imports/ui/link.Link.tsx

import * as React from 'react';

import { linkService } from './links.service';

export interface LinkProps {

link: any

}

export default class Link extends React.Component<LinkProps, any> {

removeLink = () => {

const { link } = this.props;

linkService.removeLink(link._id);

}

public render() {

const { link } = this.props;

return (

<a href={link.url} target="_blank">{link.title}</a>

</li>

);

}

Redux 관련 패키지 설치

redux 기본 패키지를 설치한다.

$ meteor npm install --save redux react-redux react-router-redux

$ meteor npm install --save-dev @types/react-redux @types/react-router-redux

redux action, reducer을 보다 편하게 사용할 수 있는 typesafe-actions 모듈을 설치한다.

$ meteor npm install --save typesafe-actions

redux에서 비동기를 처리할 수 있는 redux-observable 과 rxjs 모듈을 설치한다.

$ meteor npm install --save redux-observable rxjs

state 갱신으로 인한 반복 rendering을 제거해 성능향상을 위한 reselect 모듈도 설치한다.

$ meteor npm install --save reselect

Redux 코드 개발

link action 개발

- action type constants 정의

- action Model 정의

- action 에 대한 정의

// imports/ui/pages/link/link.action.ts

import { action } from 'typesafe-actions';

/**************************

* constants, model

**************************/

// constants

export const ADD_REQUEST = '[link] ADD_REQUEST';

export const ADD_SUCCESS = '[link] ADD_SUCCESS';

export const ADD_FAILED = '[link] ADD_FAILED';

export const DELETE_REQUEST = '[link] DELETE_REQUEST';

export const DELETE_SUCCESS = '[link] DELETE_SUCCESS';

export const DELETE_FAILED = '[link] DELETE_FAILED';

export const CHANGE = '[link] CHANGE';

// model

export type LinkModel = {

_id?: string;

title?: string;

url?: string;

visited?: boolean;

error?: boolean;

errorMsg?: any;

success?: boolean;

createdAt?: any;

updatedAt?: any;

};

/**************************

* actions, action-type

**************************/

export const addLink = (params: LinkModel) => action(ADD_REQUEST, params);

export const addLinkSuccess = (params: LinkModel) => action(ADD_SUCCESS, params);

export const addLinkFailed = (params: LinkModel) => action(ADD_FAILED, params);

export const removeLink = (id: string) => action(DELETE_REQUEST, id);

export const removeLinkSuccess = (id: string) => action(DELETE_SUCCESS, id);

export const removeLinkFailed = (id: string) => action(DELETE_FAILED, id);

export const changeLink = (id: string) => action(CHANGE, id);

link reducer 개발

- Link State 정의

- LinkAction 타입

- Link reducer 분기

- reselect를 이용한 selector는 별도로 만들지 않고, link.reduer.ts 파일이 함께 둔다. (파일이 너무 많아져서...)

// imports/ui/pages/link/link.reducer.ts

import { ActionType } from 'typesafe-actions';

import { combineReducers } from 'redux';

import { createSelector } from 'reselect';

import * as actions from './link.action';

/**************************

* state

**************************/

// state

export type LinkState = {

list: actions.LinkModel[],

linkFilter: string

};

/**************************

* reducers

**************************/

export type LinkAction = ActionType<typeof actions>;

export const linkReducer = combineReducers<LinkState, LinkAction>({

list: (state = [], action) => {

switch (action.type) {

case actions.ADD_FAILED:

return state;

case actions.ADD_SUCCESS:

return [...state, action.payload];

case actions.DELETE_FAILED:

return state;

case actions.DELETE_SUCCESS:

return state.filter(item => item._id === action.payload);

case actions.CHANGE:

return state.map(

item =>

item._id === action.payload

? { ...item, visited: !item.visited }

: item

);

default:

return state;

}

linkFilter: (state = '', action) => {

switch (action.type) {

case actions.CHANGE:

if (action.payload === 'visited'){

return '';

} else {

return 'visited';

}

default:

return state;

}

})

/**************************

* selectors

**************************/

export const getLinks = (state: LinkState) => state.list;

export const getLinkFilter = (state: LinkState) => state.linkFilter;

export const getFilteredLinks = createSelector(getLinks, getLinkFilter, (links, linkFilter) => {

switch (linkFilter) {

case 'visited':

return links.filter(t => t.visited);

default:

return links;

}

});

redux-observable을 이용한 epic을 만든다.

- async 처리

- rxjs 이용

- takeUntil은 cancel을 위한 장치이다.

// imports/ui/pages/link/link.epic.ts

import { Epic, combineEpics } from 'redux-observable';

import { filter, map, switchMap, takeUntil } from 'rxjs/operators';

import { isOfType } from 'typesafe-actions';

import Links from '../../../api/links';

import { insertCollection, removeCollection, RequestModel } from '../../sdk';

import * as actions from './link.action';

const addLink: Epic = (

action$,

store

) =>

action$.pipe(

filter(isOfType(actions.ADD_REQUEST)),

switchMap(action => {

const { title, url } = action.payload;

return insertCollection(Links, { title, url, createdAt: new Date() })

}),

map((response: RequestModel) => {

if (response.error) {

return actions.addLinkFailed({ ...response.result })

}

return actions.addLinkSuccess(response.result)

}),

// takeUntil(action$.pipe(

// filter(isOfType(actions.ADD_REQUEST))

// ))

);

const removeLink: Epic = (

action$,

store

) =>

action$.pipe(

filter(isOfType(actions.DELETE_REQUEST)),

switchMap(action => {

return removeCollection(Links, action.payload);

}),

map((response: RequestModel) => {

if (response.error) {

return actions.removeLinkFailed({ ...response.result, ...response.params })

}

return actions.removeLinkSuccess(response.params._id);

}),

// takeUntil(action$.pipe(

// filter(isOfType(actions.ADD_REQUEST))

// ))

);

export const linkEpic = combineEpics(addLink, removeLink);

Meteor Client Collection 을 Observable로 전환

- meteor client collection의 insert, remove시에 call 결과를 Observable로 변환하여 반환하는 유틸을 만든다.

- 이는 redux-observable의 epic에서 async 데이터를 switchMap 오퍼레이터로 다루기 위함이다.

// imports/sdk/util/ddp.util.ts

import { from, Observable } from 'rxjs';

export type RequestModel = {

error?: boolean;

success?: boolean;

result: any;

params?: any;

}

export function insertCollection(collection: any, params: any): Observable<RequestModel> {

return from(new Promise((resolve, reject) => {

collection.insert(params, (error, result) => {

if (error) {

reject({ error: true, result: { ...error }, params: { ...params } });

}

if (typeof result === 'string' || typeof result === 'number') {

resolve({ success: true, result, params: {...params} });

} else {

resolve({ success: true, result: { ...result }, params: { ...params } });

}

});

}));

}

export function removeCollection(collection: any, _id: string): Observable<RequestModel> {

return from(new Promise((resolve, reject) => {

collection.remove(_id, (error, result) => {

if (error) {

reject({ error: true, result: { ...error }, params: { _id } });

}

if (typeof result === 'string' || typeof result === 'number') {

resolve({ success: true, result, params: { _id } });

} else {

resolve({ success: true, result: { ...result }, params: { _id } });

}

});

}));

}

RootReducer와 Store 설정

link관련 action, reducer, epic 개발이 끝나면 이를 등록하는 설정을 한다.

- root Reducer 정의

- root State 타입 정의

- root Action 타입 정의

- root Epic 정의

- root Store 설정

// imports/ui/store.ts

import { combineEpics, createEpicMiddleware } from 'redux-observable';

import { createStore, applyMiddleware, combineReducers, compose } from 'redux';

import { RouterAction, LocationChangeAction } from 'react-router-redux';

import { routerReducer } from 'react-router-redux';

import { StateType } from 'typesafe-actions';

import { linkEpic } from './pages/link/link.epic';

import { linkReducer, LinkAction } from './pages/link/link.reducer';

/***********************

* root reducer

***********************/

const rootReducer = combineReducers({

router: routerReducer,

links: linkReducer

});

/***********************

* root state

***********************/

export type RootState = StateType<typeof rootReducer>;

type ReactRouterAction = RouterAction | LocationChangeAction;

export type RootAction = ReactRouterAction | LinkAction;

/***********************

* root epic

***********************/

const composeEnhancers =

(process.env.NODE_ENV === 'development' &&

(window as any) &&

(window as any).__REDUX_DEVTOOLS_EXTENSION_COMPOSE__) ||

compose;

const rootEpic = combineEpics(linkEpic);

const epicMiddleware = createEpicMiddleware();

/***********************

* root store

***********************/

function configureStore(initialState?: object) {

// configure middlewares

const middlewares = [epicMiddleware];

// compose enhancers

const enhancer = composeEnhancers(applyMiddleware(...middlewares));

// create store

const store = createStore(rootReducer, enhancer);

// run epic: https://redux-observable.js.org/docs/basics/SettingUpTheMiddleware.html

epicMiddleware.run(rootEpic);

return store;

}

const store = configureStore();

export default store;

애플리케이션에 store를 최종 설정한다.

// client/main.tsx

import * as React from 'react';

import { Meteor } from 'meteor/meteor';

import { render } from 'react-dom';

import { Provider } from 'react-redux';

import App from '../imports/ui/App'

import store from '../imports/ui/store';

const Root = (

<Provider store={store}>

<App />

</Provider>

);

Meteor.startup(() => {

render(Root, document.getElementById('react-target'));

});

window 객체 인식을 위해 type definition을 정의한다.

- 루트에 typings 폴더 생성

- typings/index.d.ts 파일 생성

declare var window: any;

Application에서 Redux Action 호출하기

add/remove link 리덕스 액션을 애플리케이션에 적용한다. link.service.ts 는 사용하지 않는다.

- AddLink.tsx에 addLink 액션 적용

// imports/ui/link/AddLink.tsx

import * as React from 'react';

import { connect } from 'react-redux';

import { addLink } from './link.action';

export interface AddLinkProps {

addLink: Function;

}

class AddLink extends React.Component<AddLinkProps, any> {

handleSubmit = (e: any) => {

//ignore validation

e.preventDefault();

const param = {

title: e.target.title.value,

url: e.target.url.value

}

const { addLink } = this.props;

addLink(param);

};

public render() {

return (

</form>

)

}

export default connect(undefined, { addLink })(AddLink);

- Link.tsx에 removeLink 액션 적용

// imports/ui/pages/link/Link.tsx

import * as React from 'react';

import { removeLink } from './link.action';

import { connect } from 'react-redux';

export interface LinkProps {

link: any,

removeLink: Function

}

class Link extends React.Component<LinkProps, any> {

removeLink = () => {

const { link, removeLink } = this.props;

removeLink(link._id);

}

public render() {

const { link } = this.props;

return (

<a href={link.url} target="_blank">{link.title}</a>

</li>

);

}

export default connect(undefined, { removeLink })(Link);

<참조>

- 블로그 소스 코드

- react-redux-typescript-guide 소스

- redux-actions 사용하기

- redux-observable 사용하기

- typesafe-actions 사용하기

- reselect 사용하여 성능 최적화 하기

저작자표시

'Meteor > React + Meteor' 카테고리의 다른 글

[React + Meteor] 개발환경 설정 - 6 (0)	2018.12.03
[React + Meteor] 개발환경 설정 - 5 (0)	2018.11.30
[React + Meteor] 개발환경 설정 - 4 (0)	2018.11.28
[React + Meteor] 개발환경 설정 - 3 (0)	2018.11.22
[React + Meteor] 개발환경 설정 - 1 (0)	2018.11.13

posted by 윤영식

2018. 11. 13. 16:42 Meteor/React + Meteor

[React + Meteor] 개발환경 설정 - 1

Meteor v1.8이 되면서 CLI에 react기반 애플리케이션 자동 생성 기능이 추가되었다. 여기에 Typescript와 Redux을 접목해서 개발환경을 꾸며 본다.

- React기반 Meteor 애플리케이션 생성

- SCSS 환경설정

- Typescript 환경설정

- 미티어의 Reactivity Computation인 withTracker 확인

- AntDesign CSS Framework 설정

- 소스코드

React 기반환경 만들기

meteor를 설치한다.

// Node Version Manager를 통해 Node LTS 버전을 설치한다. 최신 Meteor 1.8 은 Node v8.*을 사용한다.

$ nvm install 8.12.0

// meteor를 설치한다.

$ curl https://install.meteor.com | sh

// 향후 meteor v1.8.1 버전이 릴리즈 되면 성능향상을 위해 업그레이드를 반드시 수행한다.

$ meteor update --release 1.8.1

애플리케이션 생성

// 명령어: meteor create --react <AppName>

$ meteor create --react react-first

$ cd react-first

$ meteor run

SCSS 환경 전환

.css파일을 .scss파일로 전환한다. 이를 지원하기 위해 scss 패키지를 설치한다.

$ meteor add fourseven:scss

Typescript 관련 모듈 설치

meteor의 typescript 지원 패키지를 설치한다.

$ meteor add barbatus:typescript

@types와 필요 모듈을 설치한다.

$ meteor npm install --save-dev @types/meteor

$ meteor npm install --save-dev @types/node

$ meteor npm install --save-dev @types/react

$ meteor npm install --save-dev @types/react-dom

$ meteor npm install --save-dev typescript

$ meteor npm install --save-dev tslint

$ meteor npm install --save-dev tslint-react

Typescript 환경 전환

root에 tsconfig.json 파일 추가

{

"compilerOptions": {

"target": "es6",

"allowJs": true,

"jsx": "preserve",

"moduleResolution": "node",

"types": [

"node"

]

}

root에 tslint.json 파일 추가

// 과도한 lint가 귀찮아 extends는 주석처리함

{

// "extends": [

// "tslint:latest",

// "tslint-react"

// ],

"rules": {

"quotemark": [

true,

"single",

"jsx-double"

"ordered-imports": false,

"no-var-requires": false

}

root의 client와 imports, server 폴더안의 파일 명칭 .jsx / .js 를 .tsx / .ts 로 변경한다. tests 폴더는 .js 그대로 둔다.

마직막으로 package.json에서 mainModule의 client를 main.tsx로 수정한다.

.tsx 파일 내용을 typescript에 맞게 수정하기

1) import 문 수정

// client, imports 폴더안의 모든 .tsx 파일

// react import

import React from 'react'; ==> import * as React from 'react';

// 절대경로를 상대경로로 수정

import App from '/imports/ui/App'; ==> import App from '../imports/ui/App';

// .jsx 파일을 확장자 제거 App.tsx

import Hello from './Hello.jsx' ==> import Hello from './Hello';

import Info from './Info.jsx' ==> import Info from './Info';

2) class 문 수정

class Hello extends Components { ==> class Hello extends React.Component {

3) class에 Props 타입 설정

// info.tsx

interface InfoProps {

links: any;

}

class Info extends React.Component<InfoProps, any> {

...

}

4) export default 문 수정

withTracker는 Meteor의 Reactivity Computation 공간이다. Computation에는 Meteor의 Reactivity Resource가 위치한다. 즉, source가 변경되면 Computation영역이 재실행된다.

// imports/ui/info.tsx

export default InfoContainer = withTracker(...)

==>

export default withTracker(...);

// imports/api/links.ts

export default Links = new Mongo.Collection('links');

==>

const Links = new Mongo.Collection('links');

export default Links;

이제 다시 meteor run 을 실행한다.

Ant Design 설치하기

CSS Component를 제공하는 antd를 설치한다.

$ meteor npm install --save antd

$ meteor npm install --save-dev @types/antd

client/main.tsx 안에 antd css 를 import 한다.

import '../node_modules/antd/dist/antd.css';

또는, antd.less 파일을 직접 import할 수 있다.

$ meteor add less

$ meteor npm install --save indexof

// client/theme.less 파일 생성하고 antd.less 파일 import하기

@import '{}/node_modules/antd/dist/antd.less';

antd의 Menu를 App.tsx에 적용해 본다.

import * as React from 'react';

import Hello from './Hello';

import Info from './Info';

import { Menu, Icon } from 'antd';

const SubMenu = Menu.SubMenu;

const MenuItemGroup = Menu.ItemGroup;

class App extends React.Component {

state = {

current: 'mail',

};

handleClick = (e) => {

console.log('click ', e);

this.setState({

current: e.key,

});

}

render() {

return (

<div>

<Menu

onClick={this.handleClick}

selectedKeys={[this.state.current]}

mode="horizontal"

<Menu.Item key="mail">

<Icon type="mail" />Navigation One

</Menu.Item>

<Menu.Item key="app" disabled>

<Icon type="appstore" />Navigation Two

</Menu.Item>

<SubMenu title={<span className="submenu-title-wrapper"><Icon type="setting" />Navigation Three - Submenu</span>}>

<MenuItemGroup title="Item 1">

<Menu.Item key="setting:1">Option 1</Menu.Item>

<Menu.Item key="setting:2">Option 2</Menu.Item>

</MenuItemGroup>

<MenuItemGroup title="Item 2">

<Menu.Item key="setting:3">Option 3</Menu.Item>

<Menu.Item key="setting:4">Option 4</Menu.Item>

</MenuItemGroup>

</SubMenu>

<Menu.Item key="alipay">

<a href="https://ant.design" target="_blank" rel="noopener noreferrer">Navigation Four - Link</a>

</Menu.Item>

</Menu>

<Hello />

<Info />

</div>

);

}

export default App;

지금까지의 적용 소스코드, Redux 환경 설정하기는 다음 글에서..

<참조>

- meteor-react-typescript 코드 샘플

- meteor changelog

- meteor에 antd .less 파일 import하기 (데모소스)

- meteor-react-typescript-boilerplate 소스

저작자표시

'Meteor > React + Meteor' 카테고리의 다른 글

[React + Meteor] 개발환경 설정 - 6 (0)	2018.12.03
[React + Meteor] 개발환경 설정 - 5 (0)	2018.11.30
[React + Meteor] 개발환경 설정 - 4 (0)	2018.11.28
[React + Meteor] 개발환경 설정 - 3 (0)	2018.11.22
[React + Meteor] 개발환경 설정 - 2 (0)	2018.11.16

posted by 윤영식

2018. 10. 23. 16:52 BlockChain

[BlockChain] Onther DevCon 1 - go-ethereum 동작방식

Ethereum 의 Mining 부분의 동작원리 발표를 정리한다.

Ethereum

- P2P Network + Mining의 결합

- Mining

소스 설명

- miner/miner.go

- worker가 대부분의 mining 로직을 처리한다.

- new worker가 실행되면 4가지 루프가 go routine 기반으로 계속 돈다.

- 발표 자료:

3. How does go-ethereum work__Aiden.pptx

참조

https://steemit.com/@sigmoid sigmoid 님의 go-ethereum 분석기 : geth의 거의 모든 부분을 잘 정리해주셨습니다. 개인적으로 정말 많은 도움이 되었습니다.

https://github.com/NAKsir-melody/go-ethereum sigmoid 님의 go-ethereum 주석 한글화 프로젝트

http://www.notforme.kr/block-chain/geth-code-reading 자바 개발자의 go-ethereum 소스 분석기 : geth의 entry point부터 차근차근 잘 설명해주셨습니다. 처음 공부를 시작하시는 분들은 이 분의 글을 먼저 보시면 큰 도움이 되실겁니다.

https://blog.seulgi.kim/ 코드박스 김슬기님의 블로그 : 이더리움에 대한 수준 높은 포스트가 정말 많습니다. 직접적으로 소스코드를 다루는 글은 없지만 이더리움의 기술적인 부분을 이해하시는데 정말 큰 도움이 됩니다.

https://tech.etherstudy.net/ethereum/geth/delve/debug/consensus/lifecycle/2018/08/02/geth-consensus-lifecycle-debug.html 임완섭님의 이더리움 컨센서스 라이프사이클 디버깅 : 디버깅을 통해 소스코드를 보다 더 이해하기 쉽게 해주셨습니다. 역시 큰 도움이 되실겁니다.

'BlockChain' 카테고리의 다른 글

[W3C] 2018 참관기 (0)	2018.11.26
[BlockChain] Onther DevCon 1 - Etherum 2.0 개요 (0)	2018.10.23

posted by 윤영식

2018. 10. 23. 16:14 BlockChain

[BlockChain] Onther DevCon 1 - Etherum 2.0 개요

Onther Devcon 1 세미나에 참여하여 이더리움 2.0 의 현재와 진행방향에 대해 알아보러 왔다. 특별히 인원제한으로 인해 당첨(?)이 되어야 올 수 있었는데 다행이 행운을 얻어 참여할 수 있었다.

Ethereum 2.0 개괄

발표: 정우현

내용: 2.0

- Sharding + Casper FFG 메인

- Multi Layer 확장성 개선

- p2p 개선작업

- signature 알고리즘 개선

- EVM의 병렬처리 개선 -> web assembly기반

Casper FFG

- PoW를 대체

- Staking ether 방식

- Finality(피넬리티): 만들어진 블록이 최종적인지 판단 가능

P2P 프로토콜

- devp2p에서 libp2p로 변경

- IPFS 프로토콜

PoW Main Chain -> Beacon Chain -> Shard Chain -> VM

- Beacon chain이 Shard chain을 validating한다.

- 현재는 Beacon이 개발 메인이다. 내년 release?

- Stake of Proof는 Beacon Chain에 존재하고, Shard chain은 TX와 DATA를 핸들링한다.

- 처리용량은 Shard chain까지 가면 제곱으로 증가한다.

- Beacon Chain Spec: 어려 팀에서 빠르게 개발되어 가고 있다.

Beacon chain 이외 Ethereum 2.0에서 다루고 있는 내용

- 각 기능을 각각의 다른 팀들이 알아서 만드는 중

2.0 의 개발 범위

Plasma vs Sharding

- Sharding: Validator, Proposer, Committee

Plasma: Operator, User, Challenger

- Shard Chain은 1024개의 새로운 체인을 추가

eWASM

- EVM의 대체물로 개발

- Google WASM (Web Assembly)를 사용

'BlockChain' 카테고리의 다른 글

[W3C] 2018 참관기 (0)	2018.11.26
[BlockChain] Onther DevCon 1 - go-ethereum 동작방식 (0)	2018.10.23

posted by 윤영식

2018. 10. 18. 14:52 AI Deep Learning

[뉴로모픽] 인공지능과 하드웨어의 결합 워크샵

네패스의 뉴로모픽 인공신경망 장비를 통한 실습 워크샵 내용을 정리한다. RBF 알고리즘을 사용하는 칩이다.

Radial Bassis Function (RBF)

중심점으로부터 일정한 거리에 있는 데이터만 골라낸다. 거리에 대한 정보를 끄집에 내는게 중점이다.

- 거리를 표한하는 법은 가우시안 분포(정규분포)를 사용한다

- 가우시안 함수를 여러개 중첩시켜 다양한 함수(=인공지능)를 만들 수 있다.

- 입력: 특징정보를 준다.

- 네패스 칩은 하나의 가우시안 칩으로 중첩해서 사용할 수 있다.

뉴로모픽 NM500

- 576개의 뉴론이 있다.

- 각 뉴론은 독립적으로 작동한다.

- 실시간으로 학습하고 모델을 만들어 낼 수 있다.

- 전처리된 feature를 넣어주어야 RBF를 통해 처리를 할 수 있다. 모든 것을 다 해주는 것은 아니다.

- 디지털화 가능한 모든 데이터 입력은 가능하다.

- 학습된 뉴런들만 작동한다.

사용예

- 라켓에 칩을 붙여서 스윙의 괘적이 잘 되고 있는지 알려준다.

- 어선에서 잡은 물고기중에서 원하는 것만을 골라냄

- 칩하나로 할 수 있는것

+ Fish sorting: 200 뉴런 사용

+ Glass Inspection: 유리의 이물질 발견 - 800 뉴런 사용

+ Motion classification: 움직임 괘적 추적 - 128 뉴런 사용

NM500 뉴런

뉴론안에 context끼리 서로 맞아야 연결된다. 네트워크를 구분하는 용도로 사용한다. 예로 얼굴인식이면 얼굴인식 뉴런끼리 연결되도록 한다.

Active Influence field 값이 학습을 진행하면서 정교하게 정해진다.

DEG (DeGenerate Flag)은 Minimum Influence Filed이하로 내려가면 작동한다.

Difference(차이) 절대값은 L1, Lsup을 사용한다.

Knowledge Studio를 통한 실습

이미지에 대해 학습을 하고 딕텍션을 할 수 있다.

- context를 만든다.

- 이미지를 선택한다.

- 이미지에 ROI라는 사이즈를 만들어 Full scan 학습을 한다.

- 디텍션으로 가서 학습시킨 이미지를 찾거나, novelty를 선택하여 이전 이미지와 차이가 나는 부분을 찾는다.

예) 100원 동전이 없는 이미지를 context 100사이즈, ROI w/h = 80, stride = 80으로 학습을 하고, 100원 동전이 있는 이미지로 교체후 디덱션을 해서 이전 이미지와 틀린 부분이 무엇인지 찾는다.

참조

- 제너럴비젼사와 MOU하여 뉴로모픽 NM500을 만든 것임

- 확률 가우시안이란

'AI Deep Learning' 카테고리의 다른 글

[자연어 처리] Word2Vec 강의 정리 (0)	2018.11.25
[Cost Function] 로지스틱 회귀의 비용함수 이해 (0)	2018.08.11
[인공지능] 공부 여정 (0)	2018.07.31
[ML] 11주차 - 독립 특성 발견 (0)	2015.03.07
[ML] 10주차 - 고급 분류 기법 (0)	2015.02.28

posted by 윤영식

2018. 10. 17. 15:11 Data Visualization/Vega

[Vega] Vega, Vega-lite 넌 뭐니

Vega는 선언적인 차트 생성 라이브러리이다. 좀 더 추상화하고 쉽게 사용할 수 있도록 Vega-lite를 제공한다. C3.js 또는 네이버의 C3.js 확장판인 Billboard.js를 생각하면 된다.

특징

- SVG, Canvas를 지원한다.

- Javascript코드없이 JSON환경으로 차트를 생성한다.

- Editor, Recommendation Charting해주는 Voyager등을 제공한다.

테스트: https://vega.github.io/editor/#/ 접속해서 다음 환경값을 넣는다.

{
  "$schema": "https://vega.github.io/schema/vega-lite/v2.json",
  "data": {"url": "data/seattle-weather.csv", "format": {"type": "csv"}},
  "mark": "bar",
  "encoding": {
    "x": {"timeUnit": "month", "field": "date", "type": "ordinal"},
    "y": {"aggregate": "mean", "field": "precipitation", "type": "quantitative"}
  },
  "config": {"axisY": {"minExtent": 30}}
}

개념

Vega-lite 소개 동영상을 보고 전반적으로 이해하자.

좀 더 자세한 개념설명

사용예

Elastic Search에서는 Customizing Chart를 만들기 위해 Vega를 기능으로 추가하여 사용할 수도 있다.

Elastic Search에서 Vega 구현 예제 소스

Vega, Vega-lite, 또는 Vega Editor, Vega Voyager등은 Standalone library 형태로 애플리케이션에 포함하여 사용할 수 있다.

posted by 윤영식

2018. 9. 14. 17:31 React

[React] 다시 시작하기

실제 프로젝트에서 사용을 안하다보니 자꾸 처음 내용이 익숙해 지지 않은 상태에서 잊어버리고 만다. React + Typescript기반을 다시 시작해 본다.

Install React with Typescript

React와 Typescript 환경을 만든다

// 2018.9 현재 LTS NodeJS 버전

$ nvm use 8.12.0

// typescript v3.0.3 으로 업데이트

$ npm i -g typescript

$ npm i -g create-react-app (or yarn global add create-react-app)

// TYPESCRIPT-CSS

$ create-react-app my-app --scrips-version=react-scripts-ts

package.json에 eject기능이 있어서 webpack config를 밖으로 추출하여 직접 핸들링할 수 있게 한다.

$ cd my-app

$ npm run eject

SCSS 환경구축

css 환경을 scss 환경으로 바꿔준다.

// scss loader 설치

$ yarn add node-sass sass-loader --dev

App.css와 index.css의 확장자를 .scss로 바꾸고, App.tsx, index.tsx의 import 문 확장자를 .scss로 바꾼다.

import './App.scss';

config/webpack.config.dev.js 와 webpack.config.prod.js 파일안에 scss설정을 추가한다. 빨간 부분을

{

test: /\.(css|scss)$/,

use: [

require.resolve('style-loader'),

{

loader: require.resolve('css-loader'),

options: {

importLoaders: 1,

{

loader: require.resolve('postcss-loader'),

options: {

// Necessary for external CSS imports to work

// https://github.com/facebookincubator/create-react-app/issues/2677

ident: 'postcss',

plugins: () => [

require('postcss-flexbugs-fixes'),

autoprefixer({

browsers: [

'>1%',

'last 4 versions',

'Firefox ESR',

'not ie < 9', // React doesn't support IE8 anyway

flexbox: 'no-2009',

}),

{

loader: require.resolve("sass-loader"),

options: { }

}

기존 App.scss내용을 다음과 같이 바꾸어 확인해 본다.

.App {

text-align: center;

&-logo {

animation: App-logo-spin infinite 20s linear;

height: 80px;

}

&-header {

background-color: rgb(197, 40, 40);

height: 150px;

padding: 20px;

color: white;

}

&-title {

font-size: 1.5em;

}

&-intro {

font-size: large;

}

yarn start하여 점검!

Component LifeCycle

일반 컴포넌트

constructor -> componentWillMount -> render -> componentDidMount -> componentWillUnmount

props, state 사용 컴포넌트

componentWillReceiveProps -> shouldComponentUpdate -> componentWillUpdate -> render -> componentDidUpdate

- shouldComponentUpdate: true, false로 다음으로 이벤트를 넘길수도 안할수도 있음

Component Type

PureComponent

shouldComponentUpdate에서 Shallow compare하므로 reference를 바꾸어 주어야 render가 호출됨.

Functional Component (Stateless Function Component)

const myComp: Reat.SFC<Props> = (props) => {...}

import * as React from“ react”

interface WelcomeProps {

name: string,

}

const Welcome: React.SFC < WelcomeProps > = (props) => {

return <h1 > Hello, {

props.name

} < /h1>;

}

Router for SPA

react-router v4

BrowserRouter, Route, Link, NavLink, Redirect 사용

BrowserRouter는 window.history.pushState() 로 동자하는 라우터

RouteComponentProps: route되면서 url의 파라미터를 props로 받음. history, match 속성을 가짐.

</Route>

</BrowserRouter>

Switch로 감쌈

</Switch>

Redux

react-redux

여러 action을 reducer를 통해 하나의 store를 만든다.

- action 타입을 만들고 action 객체를 만드는 펑션을 (action creator) 정의한다.

- action을 처리하는 reducer 펑션을 정의한다. (Pure function, immutable)

reducer 펑션을 action별로 나눈 다음 사용시에는 combineReducers 로 합쳐서 사용한다.

- reducer를 createStore에 넣어주면 single Store가 만들어진다.

store에는 getState(), dispatch(액션), subscribe(리스너), replaceReducer(다른리듀서) 4개 메소드가 있음

redux를 react에 연결하기

- componentDidMount: subscribe

- componentWillUnMount: unsubscribe

- Provider는 context에 store를 담아 모든 component에서 store를 사용할 수 있도록 한다.

Provider를 제공하는 react-redux를 사용한다.

connect를 통해 컴포넌트에 연결한다.

- App에 대한 High order component이다.

- 전체 state의 모양과 action creator를 파라미터로 넣어준다.

$ yarn add redux react-redux @types/redux @types/react-redux

const mapStateToProps = (state: { age: number}) => {

return {

age: state.age

}

const mapDispatchToProps = (dispatch: Function) => {

return {

onAddAge: () => { dispatch(addAge()); }

};

}

interface AppProps {

age: number;

onAddAge: void;

}

connect(mapStateToProps, mapDispatchToProps)(App);

class App<{props: AppProps}> extends Component {

return <div>{this.props.age}</div>

}

dispatch안에서 async처리를 할 수 있다.

applyMiddleware는 dispatch 전후에 처리할 수 있다.

action이 async일 때 미들웨어인 redux-thunk를 이용한다.

<참조>

- 2017 Typescript Korea 강의 (유튜브)

- scss 적용하기

- scss loader 설정하기, Class 사용 in Velopert

- Typescript + React 환경 만들기 in Velopert

- React LifeCycle 설명

- Component Type - SFC 설명

- React Router in Velopert 소개

'React' 카테고리의 다른 글

[React] Semantic-UI를 React 컴포넌트로 만들기 - 1 (0)	2015.08.23
[React] CSS Framework 선정하기 (0)	2015.08.15
[Flux] Flux 배우는 방법 (0)	2015.07.04
[React] AngularJS와 ReactJS 비교 (0)	2015.07.01
[React] 배우는 방법 (0)	2015.05.15

posted by 윤영식

2018. 8. 22. 14:40 AI Deep Learning/Tensorflow

[Chanwoo Jacod Lee] Tensorflow 강좌 정리

이찬우님의 텐서플로우 유튜브강좌를 정리한다.

강좌 3

로지스틱 비용함수를 만들기

- 좌측과 우측에 대한 convex 를 만들기 위한 식

cost = tf.reduce_sum(-y*tf.log(output)-(1-y)*tf.log(1-output), reduction_indices=1)

prediction과 label끼리의 정확도를 판단하기

- 각자의 벡터 매칭이 맞으면 1, 틀리면 0으로 하는 값을 다시 n*1 벡터로 만든다.

- 해당 백터의 값에 대한 평균을 구한다.

- 이때 1, 0값은 bool이어서 float32로 변환하여 계산한다.

- 잘 맞으면 평균 1 이 나온다.

comp_pred = tf.equal(tf.argmax(output, 1), tf.argmax(y, 1))

accuracy = tf.reduce_mean(tf.cast(comp_pred, tf.float32))

모델 저장하기

- Training시킨 모델을 저장하는 것을 Checkpoint라 한다.

- 저장내용에는 Weight과 Model이 저장될 수 있다.

- Weight관련 Variable을 저장한후 Save한다.

- 저장시 유의점은 Variable, placeholder 함수의 파라미터중 하나인 Name이 자동으로 지정된다.

W_o = tf.Variable(tf.truncated_normal(shape=[HIDDEN2_SIZE, CLASSES], dtype=tf.float32))

b_o = tf.Variable( tf.zeros([CLASSES]), dtype=tf.float32)

param_list = [W_h1, b_h1, W_h2, b_h2, W_o, b_o]

saver = tf.train.Saver(param_list)

hidden1 = tf.sigmoid(tf.matmul(x, W_h1) + b_h1)

hidden2 = tf.sigmoid(tf.matmul(hidden1, W_h2) + b_h2)

....

for i in range(1000):

_, loss = sess.run([train, cost, accuracy], feed_dict = feed_dict)

if i % 100 == 0:

saver.save(sess, './tensorflow_3_lec.ckpt')

...

강좌 4

저장된 Weight Restoring하기

- save 할 때 Widget의 Variable에 name을 지정한다.

x = tf.placeholder(tf.float32, shape=[None, INPUT_SIZE], name='x')

y = tf.placeholder(tf.float32, shape=[None, CLASSES], name='y')

W_h1 = tf.Variable(tf.truncated_normal(shape=[INPUT_SIZE, HIDDEN1_SIZE], dtype=tf.float32), name='W_h1')

b_h1 = tf.Variable(tf.zeros([HIDDEN1_SIZE]), dtype=tf.float32, name='b_h1')

hidden1 = tf.sigmoid(tf.matmul(x, W_h1) + b_h1, name='hidden1')

hidden2 = tf.sigmoid(tf.matmul(hidden1, W_h2) + b_h2, name='hidden2')

output = tf.sigmoid(tf.matmul(hidden2, W_o) + b_o, name='output')

...

saver.restore(sess, './tensorflow_3.ckpt')

강좌 5

Tensorboard는 디버깅 용도이다. 공식 튜토리얼을 참조한다.

- name_scope는 묶음 단위이다.

- scalar: 로그 데이터 남기기

- tf.summary.merge_all()

- tf.summary.FileWriter(<dir>, session.graph)

# 가설함수

with tf.name_scope('hidden_layer_1') as h1scope:

hidden1 = tf.sigmoid(tf.matmul(x, W_h1) + b_h1, name='hidden1')

with tf.name_scope('hidden_layer_2') as h2scope:

hidden2 = tf.sigmoid(tf.matmul(hidden1, W_h2) + b_h2, name='hidden2')

with tf.name_scope('output_layer') as oscope:

output = tf.sigmoid(tf.matmul(hidden2, W_o) + b_o, name='output')

....

# 수행

sess= tf.Session()

sess.run(tf.global_variables_initializer())

merge = tf.summary.merge_all()

for i in range(1000):

_, loss, acc = sess.run([train, cost, accuracy], feed_dict = feed_dict)

if i % 100 == 0:

train_writer = tf.summary.FileWriter('./summaries/', sess.graph)

$ tensorboard --logdir=./summaries 수행한다.

강좌 6

Loading Data in Tensorflow 참조. CSV파일 읽기

- decode_csv로 콤마기반의 csv파일을 읽어들인다.

- record_defaults = [[1], [1], [1], [1], [1], [1], [1], [1], [1]] Fixed 자리수에서 비어있는 값에 대한 default value이다.

- start_queue_runners는 Session.run이 수행되기전에 호출해서 queue를 실행해서 file이 queue에서 대기토록 한다.

- Coordinator 는 Thread 관리를 수행한다.

Image 읽기

- FixedLengthRecordReader로 읽음

- decode_raw를 사용함

to be continue...

<참조>

- 텐서플로우의 체크포인트 설명

- 텐서플로우 Save & Restore

- 파이썬의 With 구문 이해

posted by 윤영식

2018. 8. 21. 16:52 AI Deep Learning/Read Paper

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2

Data2Vis 논문에 대한 개념을 알아본 후 다른 곳에 응용을 하려면 어떻게 어떤 단계를 거쳐서 진행해야 할지 실험을 해본다.

준비

컴파일 환경

Python v3.7

Tensorflow v1.9

Anaconda기반에서 구동한다.

Step-1) 모델 환경설정

train_options.json 에 정의된 Model의 파라미터 내용

- Data2Vis는 Attention 메카니즘을 가지는 Encoder-Decoder 아키텍쳐이다.

- 2-layer bidirectional RNN encoder/decoder를 사용한다.

- GRU보다 LSTM이 보다 좋은 성능을 나타내서 LSTM을 사용한다.

Loss(Cost)와 Training 함수를 포함한 모델(Model)은 AttentionSeq2Seq를 사용하고, 해당 모델에 대한 환경설정 파일은 example_configs/nmt_large.yml에 정의되어 있다.

- 데이터: source와 target 정보의 위치를 지정한다.

- 가설/비용 함수: Encoder/Decoder 를 구성하고 inference 파라미터등도 설정한다. Encoder/Decoder의 Cell은 LSTMCell을 사용한다.

- Training 함수: Adam optimizer 사용

Step-2) Data 전처리

모델을 Training시키기 위해서 Dataset의 Field를 numeric, string, temporal, ordinal, categorical등으로 분류를 해놓는다. 이에 대한 Output(Labeled)으로 Vega-lite문법에 맞추어 환경파일을 각각 만든다.

- sourcedata/*.sources 또는 *.targets 파일중에 dev.sources와 dev.targets를 보면 dataset의 index당 vega-lite spec을 매칭했다.

- vega-lite문법에서 data 필드만 제외한다.

- 총 3가 성격의 sources, targets를 준비한다.

+ dev

+ train

+ vocab

- dataset의 필드를 특별히 str<index>, num<index> 로 변환한다.

- 데이터 전처리를 위한 스크립트는 utils/*.py에 있다.

- 데이터 전처리 전의 실데이터는 testdata/*.json에 vega-lite의 다양한 spec은 examples/*.json 에 있다.

//dev.sources

[{"num0": 0, "num1": null, "str0": "Small", "str1": "AMERICAN AIRLINES", "str2": "AUSTIN-BERGSTROM INTL", "str3": "Approach", "str4": "Day", "str5": "None", "str6": "Unknown bird - small", "num2": 0, "str7": "MD-80", "str8": "8/1/95 0:00", "str9": "Texas", "num3": 0}]

[{"num0": 0, "num1": 140, "str0": "Small", "str1": "US AIRWAYS*", "str2": "CHARLOTTE/DOUGLAS INTL ARPT", "str3": "Approach", "str4": "Day", "str5": "None", "str6": "European starling", "num2": 0, "str7": "B-737-300", "str8": "7/19/99 0:00", "str9": "North Carolina", "num3": 0}]

//dev.targets

{"encoding": {"y": {"field": "str0", "type": "nominal", "selected": true, "primitiveType": "string"}, "x": {"type": "quantitative", "field": "num2"}}, "mark": "point"}

{"encoding": {"y": {"field": "str3", "type": "nominal", "selected": true, "primitiveType": "string"}, "x": {"type": "quantitative", "field": "num0"}}, "mark": "tick"}

Step-3) 모델 생성하기

모델 환경설정과 Training을 위한 source, target 데이터가 준비되었다면 모델을 생성한다.

- procject-directory 위치를 변경한다.

- bin/train.py를 수행을 위한 파라미터이다.

- vizmodel로 ckpt파일을 생성되므로 별도 지정을 해보자. (data2vis에 이미 생성된 ckpt가 존재한다.)

Step-4) 추론 검증

Data2Vis는 Model을 미리 ckpt로 저장해 놓았고, WebDemo가 존재한다. webserver.py 는 Flask로 구성하여 간단하게 다음의 작업을 수행한다.

- 웹화면에서 Generate Example 버튼을 클릭하면 examplesdata/*.json에서 실제 dataset 을 random하게 읽어온다.

- 실데이터의 field를 str, num으로 바꾸어 inference에 넣은후 Vega-lite spec를 output로 받는다.

- 출력으로 나온 Vega-lite spec에 data 필드에 실데이터를 맵핑하여 최종 Vega-lite spec를 만들어 HTTP response를 한다.

또는 command console에서 직접 수행해 볼 수 있다.

<참조>

- 구글
tf-seq2seq 튜토리얼
seq2seq NMT 튜토리얼

- Data2Vis 논문

'AI Deep Learning > Read Paper' 카테고리의 다른 글

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 1 (0)	2018.08.16

posted by 윤영식

2018. 8. 16. 15:06 AI Deep Learning/Read Paper

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 1

Data2Vis는 seq2seq를 통해 입력되는 데이터를 기반으로 출력으로 차트를 자동생성한다.

개념

해당 논문을 이해하기 위해 다음과 같은 단어의 개념을 이해해야 한다. 소스에서도 같은 용어를 쓰기 때문에 소스이해를 위해서도 중요하다.

- Data2Vis의 데모 사이트에 가면 간략한 설명이 나와 있다.

- A ttention mechanism을 이용한 encoder-decoder 아키텍쳐 모델이다.

- key/value 쌍의 데이터를 입력으로 하고 Vega-Lite기반의 출력을 생성한다. Vega-Lite는 JSON기반으로 차트를 생성해주는 스펙이다.

- 특징

+ encoder는 최종 context vector 하나로 만든다. 이것을 C 라고 표현한다. 위이 그림에서 가운데 위치한 C이다.

+ decoder는 학습할 때 encoder의 "C"와 "<go>답안"을 입력받아 "답안<eos>"를 출력하는 학습을 한다. (참조)

+ encoder, decoder의 길이를 정해야 한다. 무한정일 수 없다.

+ 여기서 encoder, decoder는 동시에 학습할 수 있다. (참조)

+ 정답이 있는 데이터만 S2S 학습이 가능하다.

+ 단어들에 대한 벡터화한 수치 사전이 필요하다. (참조)

- beam search

+ RNN의 학습 과정에서 트리 탐색 기법으로 쓰임

+ 최고우선탐색(Best-First-Search)기번을 기본으로 회되 기억해야 하는 노드 수를 제한해 효율성을 높이는 방식

+ beam : 사용자가 기억해야 하는 노드 수

- LSTM

+ Backward Propagation(역전파)할 때에 Gradient Vanishing이나 Exploding되는 현상을 막기 위해 LSTM을 사용한다.

+ 역전파할 때 미분한다. Gradient는 결국 기울기 이고, 미분또한 기울기를 구하는 것으로 역전파를 할 때 미분의 값이 작을 때 Gradient Vanshing이 발생하고, 클때 exploding이 발생한다.

+ Gradient Vanishing에 대한 자세한 설명은 영덕의 연구소를 참조한다.

소스 설치 및 실행

소스를 깃헙에서 클론한다.

$ git clone https://github.com/victordibia/data2vis.git

환경 설정

- Anacoda를 설치

- Python v3.6.5 사용

- Tensorflow v1.9.0 사용 (Anaconda Navigator UI에서 설치하지 않고 conda CLI로 버전을 지정해서 설치한다.)

$ conda install -c conda-forge tensorflow=1.9.0

모듈 설치

- requirements.txt는 node.js의 package.json역할

$ cd data2vis

$ pip install -r requirements.txt

실행하기

$ python webserver.py

브라우져에서 http://localhost:5016/ 호출

디버깅하기

MS Code에서 다음 항목을 추가한다.

- port: listen 포트

- model_dir: 모델이 있는곳, 이곳에 seq2seq의 환경파일인 train_options.json 파일이 존재해야 한다.

해당 파일은 training 시킨 결과를 통해 자동으로 생성된다. 훈련시키는 방법에 대해서는 두번째 글 참조.

- beam_width: 사용자가 기억해야 하는 노드수 5개

{

"version": "0.2.0",

"configurations": [

{

"name": "Python: Data2Vis - Flask (0.11.x or later)",

"type": "python",

"request": "launch",

"program": "${workspaceFolder}/webserver.py",

"env": {

"FLASK_APP": "${workspaceFolder}/webserver.py",

"FLASK_ENV": "development"

"args": [

"--port=5016",

"--model_dir=vizmodel",

"--beam_width=15"

]

{

"name": "Python: Current File",

"type": "python",

"request": "launch",

"program": "${file}"

.....

}

샘플 실행

- 좌측 examples 메뉴를 클릭하고 입력창에 1이상의 값을 넣고, "Generate Examples" 버튼을 클릭하면 차트가 생성된다.

seq2seq 모듈

구글이 개발한 tf-seq2seq 모듈 소스을 data2vis 폴더에 그대로 copy해 놓은 상태이다. 모델을 학습하고 검증하는 것은 실제 seq2seq가 하므로 tf-seq2seq 사용방법을 알아야 한다.

- tf-seq2seq 소개 블로그: Goolge NMT 논문 필수

- seq2seq에 대한 기본 설명은 Arxiv의 Neural Machine Translation 논문을 참조한다.

- Tensorflow의 seq2seq 사용법

Configuration Training

- 환경파일에는 Input data, model, training parameter를 정의한다.

- vismodel의 train_options.json 파일을 사용한다.

- optimizer 종류와 learning_rate등을 지정. Adam 옵티마이저를 사용.

- vocab_target, vocab_source 임베딩을 위한 벡터 카운트를 만들기 위해 파일 지정

- decoder, encoder class와 params을 설정. 둘 다 LSTMCell 사용

- attention class와 params 설정

- inference, bridge, embedding 설정

- source/target.max_seq_len 으로 string의 크기 지정

- 모델 옵션 설명

- 인코더 옵션 설명

- 디코더 옵션 설명

{

"model_class": "AttentionSeq2Seq",

"model_params": {

"optimizer.name": "Adam",

"decoder.class": "seq2seq.decoders.AttentionDecoder",

"inference.beam_search.beam_width": 5,

"decoder.params": {

"rnn_cell": {

"dropout_input_keep_prob": 0.5,

"num_layers": 2,

"cell_params": {

"num_units": 512

"dropout_output_keep_prob": 1.0,

"cell_class": "LSTMCell"

"max_decode_length": 2000

"optimizer.learning_rate": 0.0001,

"source.reverse": false,

"source.max_seq_len": 500,

"attention.params": {

"num_units": 512

"attention.class": "seq2seq.decoders.attention.AttentionLayerDot",

"vocab_target": "sourcedata/vocab.target",

"target.max_seq_len": 500,

"optimizer.params": {

"epsilon": 8e-07

"bridge.class": "seq2seq.models.bridges.ZeroBridge",

"vocab_source": "sourcedata/vocab.source",

"encoder.params": {

"rnn_cell": {

"dropout_input_keep_prob": 0.5,

"num_layers": 2,

"cell_params": {

"num_units": 512

"dropout_output_keep_prob": 1.0,

"cell_class": "LSTMCell"

}

"encoder.class": "seq2seq.encoders.BidirectionalRNNEncoder",

"embedding.dim": 512

}

Training

- 모델과 교육데이터가 갖추어져 있으면 훈련을 수행한다.

- /sourcedata안에 source, target의 trainig data가 존재한다.

- utils/data_gen.py에서 /examples 폴더의 vega spec을 읽어와 training data를 만들고 있다.

Prediction

- 모델 Training을 받은 후 예측을 시작할 수 있다.

- DecodeText 클래스를 사용하고, Input pipeline은 ParallelTextInputPipeline을 사용함.

+ DecodeText는 모델 예측을 가져와 표준 출력으로 추력하는 작업을 수행함

+ DumpAttention과 DumpBeams을 이용해 모델 수행시 디버깅을 할 수 있다. 파일로 쓰는 것임.

+ input pipline은 데이터를 읽는 방법을 정의한다.

Decoding with Beam Search

- 빔 검색은 번역 성능을 향상시키는 일반적으로 사용되는 디코딩 기술이다.

- 빔 검색은 메모리에 가설 또는 빔(beam)을 놓고 가장 높은 점수인 것을 선택한다.

Evaluating specific checkpoint

- Training을 통해 다양한 모델의 체크포인트를 저장한다.

- BLEU (bilingual evaluation understudy)를 통해 번역 성능 평가.

Checkpoint에 대한 설명

- Saving

+ model 을 만드는 코드 의존적인 포멧을 갖는다.

+ 체크포인트는 training하며 생성된 모델의 버전이다.

+ Estimator가 checkpoint를 model_dir 위치에 저장한다.

+ events 파일은 tensorboard가 시각시에 사용한다.

+ Saver를 통해 체크포인트를 Saving/Restoring 한다.

checkpoint

events.out.tfevents.timestamp.hostname

graph.pbtxt

model.ckpt-1.data-00000-of-00001

model.ckpt-1.index

model.ckpt-1.meta

model.ckpt-200.data-00000-of-00001

model.ckpt-200.index

model.ckpt-200.meta

- Restoring

+ Estimator는 train()을 호출하면 model의 그래프를 model_fn()을 호출해서 생성한다.

+ Estimator는 최근의 checkpoint를 통해 새로운 모델의 weight을 초기화 한다.

webserver.py 이해

파이썬 웹서비스는 Flask를 이용한다. data2vis/static 과 templates가 Flask운영을 위해 사용된다.

webserver.py 실행 순서

- port, vizmodel, beam_width를 아규먼트를 받는다.

- vizmodel/train_options.json을 기반으로 TrainOption 오브젝트를 생성

train_options = training_utils.TrainOptions.load(model_dir_input)

- model params을 사용해 model class를 생성함. AttensionSeq2Seq.py (attension_seq2seq.py)

model_params = _deep_merge_dict(model_params, _maybe_load_yaml(model_params))

model = model_cls(params=model_params, mode=tf.contrib.learn.ModeKeys.INFER)

- inference task 생성. DecodeText 생성

if (str(tdict["class"]) == "DecodeText"):

task = task_cls(tdict["params"], callback_func=_save_prediction_to_dict)

- ParallelTextInputPipeline pipeline 생성

input_pipeline_infer = input_pipeline.make_input_pipeline_from_def(

fl_input_pipeline,

mode=tf.contrib.learn.ModeKeys.INFER,

shuffle=False,

num_epochs=1)

- inference를 사용하는 (Tensorflow) graph 생성.

+ seq2seq/inference/inference.py에서 pipeline과 batch_size를 통해 input function을 만들고

+ input function의 feature와 label을 model의 파라미터로 사용해서 model의 build를 호출한다.

predictions, _, _ = create_inference_graph( model=model, input_pipeline=input_pipeline_infer, batch_size=batch_size)

- Listen을 하고, Flask의 routing을 설정한다. "Generate Examples" 버튼 클릭시 호출

+ test data를 사용한다.

+ normalize를 해준다. (foward_norm, backward_norm)

+ decode result를 가지고 vega spec을 만들어 return한다.

@app.route("/examplesdata")

def examplesdata():

source_data = data_utils.load_test_dataset()

f_names = data_utils.generate_field_types(source_data)

data_utils.forward_norm(source_data, destination_file, f_names)

run_inference()

decoded_string_post = data_utils.backward_norm(decoded_string[0], f_names)

try:

vega_spec = json.loads(decoded_string_post)

vega_spec["data"] = {"values": source_data}

response_payload = {"vegaspec": vega_spec, "status": True}

except JSONDecodeError as e:

response_payload = {

"status": False,

"reason": "Model did not produce a valid vegalite JSON",

"vegaspec": decoded_string

}

return jsonify(response_payload)

<참조>

- Data2Vis 소개글, 깃헙 소스, Arxiv 링크

- deeep 블로그
seq2seq 에 대한 쉬운 설명글

Attention 메카니즘설명 (소개한 Arxiv 링크)

- ratsgo 블로그
RNN과 LSTM 이해

seq2seq를 이용한 뉴스 제목 추출하기
설명에 대한 소스 (2018년 tensorflow 버전에 맞지않다)

beam search 이해 in Recursive Neural Network

- 구글 제공
seq2seq 문서

- Tensorflow의 seq2seq 한글 설명, 2014년 Arxiv에 소개된 seq2seq pdf

- 라온피플 블로그
RNN, LSTM, GRU 소개

- 영덕의 연구소 블로그
Gradient Vanishing 문제 개념

- Naivsphere 블로그

SGD (Stochastic Gradient Descent)에 대한 글

- 카카오 IT 브런치
BLEU: NMT 평가 방식 설명

- skymind.ai

- epoch, batch_size 용어 이해 (MNIST epoch, batch 설명)

'AI Deep Learning > Read Paper' 카테고리의 다른 글

[Data2Vis] tf-seq2seq를 사용하여 자동으로 차트 만들기 - 2 (0)	2018.08.21

posted by 윤영식

2018. 8. 11. 16:12 AI Deep Learning

[Cost Function] 로지스틱 회귀의 비용함수 이해

텐서플로우 강좌를 들으면서 다음의 모델을 실습으로 쥬피터에 코딩을 했다. 여기서 Cost function을 짤때 log함수를 왜 사용하고 앞에 - (마이너스)값은 왜 붙이는지 정리해 본다.

준비

- 아나콘다 설치

- jupyter notebook 실행

- python v3

import tensorflow as tf

input_data = [[1, 5, 3, 7, 8, 10, 12]]

label_data = [0, 0, 0, 1, 0]

INPUT_SIZE = 7

HIDDEN1_SIZE=10

HIDDEN2_SIZE=8

CLASSES = 5

Learing_Rate = .05

x = tf.placeholder(tf.float32, shape=[None, INPUT_SIZE])

y = tf.placeholder(tf.float32, shape=[CLASSES])

feed_dict = {x: input_data, y: label_data}

W_h1 = tf.Variable(tf.truncated_normal(shape=[INPUT_SIZE, HIDDEN1_SIZE], dtype=tf.float32))

b_h1 = tf.Variable( tf.zeros([HIDDEN1_SIZE]), dtype=tf.float32)

hidden1 = tf.sigmoid(tf.matmul(x, W_h1) + b_h1)

W_h2 = tf.Variable(tf.truncated_normal(shape=[HIDDEN1_SIZE, HIDDEN2_SIZE], dtype=tf.float32))

b_h2 = tf.Variable( tf.zeros([HIDDEN2_SIZE]), dtype=tf.float32)

hidden2 = tf.sigmoid(tf.matmul(hidden1, W_h2) + b_h2)

W_o = tf.Variable(tf.truncated_normal(shape=[HIDDEN2_SIZE, CLASSES], dtype=tf.float32))

b_o = tf.Variable( tf.zeros([CLASSES]), dtype=tf.float32)

output = tf.sigmoid(tf.matmul(hidden2, W_o) + b_o)

cost = tf.reduce_mean(-y*tf.log(output)-(1-y)*tf.log(1-output))

train = tf.train.GradientDescentOptimizer(Learing_Rate).minimize(cost)

sess= tf.Session()

init = tf.initialize_all_variables()

sess.run(init)

for i in range(10):

_, loss = sess.run([train, cost], feed_dict = feed_dict)

print('step:', i)

print('lost:', loss)

//결과

step: 0
lost: 0.794413
step: 1
lost: 0.780786
step: 2
lost: 0.767388
step: 3
lost: 0.754181
step: 4
lost: 0.741128
step: 5
lost: 0.728179
step: 6
lost: 0.715276
step: 7
lost: 0.702345
step: 8
lost: 0.689285
step: 9
lost: 0.675957

cost(비용) 함수의 목적은 비용 판단을 통해 올바른 W(가중치, 기울기)와 b(바이어스, 시작점)을 찾는 것이다. 다시 말하면 목표하는 W과 b를 찾을 수 있다면, 어떤 형태가 되었건 비용함수라고 부를 수 있다는 뜻이다.

Inference => Loss => Training => Evaluation 순서로 진행을 한다. 좋은 예제로 MNIST.py 구글 강좌 예제 소스를 먼저 참조해 보자.

- Inference: 가설함수 수립

- Loss: 비용함수 수립

- Training: 최적화 작업 수행하여 Loss (Cost)가 작아지는 W, b 값을 구함

- Evaluation: 검증은 Training을 통해 구해진 W, b가 가설함수에 적용되어 test data를 넣었을 때, Labeled data와 일치하는지 검증함

Step-1) 가설함수

- matmul 은 Matrix Mutiply의 약어이다.

- sigmoid는 binary classification의 한계를 넘기 위해 적용. sigmoid 그래프는 중심축 0을 중심으로 좌측은 0으로, 우측을 1로 수렴한다.

- 가설함수 (Hyphothesis): H(x) = sigmoid(Wx + b) 로 결과값은 0 또는 1의 값을 갖는다. 수학 공식으로 하면,

H(x) = 1 / (1 + math.exp(-(Wx + b))

소스에서는 output = tf.sigmoid(tf.matmul(hidden2, W_o) + b_o) 이 가설함수이다.

Step-2) 비용함수

- 가설함수를 정의했다면 해당 가설 함수의 적정한 W, b를 찾기 위해 비용(Cost) 함수를 정의한다.

비용함수는 예측값과 실제값의 차이에 대한 평균값을 구한다. 로지스틱 회귀에 사용되는 실제 비용함수를 수학 공식으로 하면,

cost = (1/n) * sum( -y_origin * log(sigmoid(Wx + b)) - (1 - y_origin) * log(1 - (sigmoide(Wx + b)))

n: 트레이닝 데이이터 수

y_origin: 트레이닝에 에 사용될 x에 대한 입력값

소스에서는 cost = tf.reduce_mean(-y*tf.log(output)-(1-y)*tf.log(1-output)) 이 비용함수이다.

- 비용함수에서 가설함수의 e를 사용하는게 아니라 log를 사용하는 이유는 e를 통해 비용함수를 그리면 다음과 같이 나오기 때문에 매끈한 경사를 만들기 위해 e의 역치함수인 log를 사용한다.

비용함수는 y=1 일때와 y=0 일때는 나누어 계산한다.

- 측정(실제 입력)값 y=1 일때는 -log(H(x)), -log(가설함수) 즉 -log(sigmoide(Wx + b)) 를 사용하고 그래프로 보면 sigmoid(Wx+b)가 0~1사이에 있고 -log(0~1)을 그린다.

H가 1이면 cost(1) = 0 이 되고, H가 0이면 cost = 무한대가 된다.

좌측의 밥그릇이 된다.

측정(실제 입력)값 y=0 일때는 가설값이 0이 되어야 한다. 이는 0에 가까울 수록 cost는 0에 가까워야 한다. -log(1 - sigmoid(Wx + b)) 되고 log(1 - (0~1)) 이 된다.

우측의 밥그릇이 된다.

요약하면 -log(h)는 좌측, -log(1-h)는 우측이다.

* 주의할 것은 Linear Regression (binary classification)을 하기 위해 평균에 제곱을 하지 않는다.

- y=0 일때와 y=1일때의 각 수식을 하나의 수직으로 만들기 위해 다음 공식을 사용해 합쳐서 표현한다. 소스에서는 -y*tf.log(output)-(1-y)*tf.log(1-output) 이 된다.

y * A + (1-y) * B => y * -log(H(x)) + (1-y) * -log(1 - H(x)) => -y*log(H(x)) - (1-y)*log(1 - H(x)) => -( y*log(H(x)) + (1-y)*log(1 - H(x)) )

- 이것을 다시 재구성하면 다음과 같다. 소스에서는 cost = tf.reduce_mean(-y*tf.log(output)-(1-y)*tf.log(1-output)) 이다.

Step-3) 옵티마이저

- 코스트함수가 정해지면 옵티마이저를 설정한다.

경사하강법 (GradientDescent)는 cost(W)을 미분을 적용해서 W의 다음 위치를 계산하는 공식이다. 다음 위치로 이동하는 것은 Learning Rate (이동하는 Step 크기)로 정해진다.

- W 와 b의 적정값을 계산하기 위해 비용함수를 만들었다면 학습을 통해 GradientDescent가 W와 b값을 구한다. 여기서 나온 W,b를 통해 예측을 수행한다.

- 소스는 tf.train.GradientDescentOptimizer(Learing_Rate).minimize(cost) 이다.

- GradientDescent Optimizer는 gradient를 계산해서 변수에 적용하는 일을 동시에 하는 함수이다. W와 b를 적절하게 계산해서 변경하는 역할을 하며, 그 진행 방향이 cost가 작아지는 쪽으로 수행한다. train을 수행하게 되면 텐서 그래프의 모든 변수의 값이 자동 변경되며 계산된다. 소스는 _, loss = sess.run([train, cost], feed_dict = feed_dict) 이다.

- 또한 텐서를 run하기 전에 그래프에 연결된 모든 variable을 초기화해야 한다.

- 옵티마이저 설명 참조

Step-4) 가절 검증

- Accuracy or Evaluation

- output 은 hypothesis 가설함수로 이것을 실제 테스트를 해본다.

- Linear에서 x, y 데이터를 placeholder를 통해 train 시키고, 최종 W,b가 구해진 가설함수에 대해서 test 데이터를 넣어 보고 예측이 맞는지 검증한다.

- Linear Regression 예 (Linear Regression에 대한 이해 참조)

import tensorflow as tf

x_data = [1.,2.,3.]

y_data = [1.,2.,3.]

W = tf.Variable(tf.random_uniform([1], -100., 100.))

b = tf.Variable(tf.random_uniform([1], -100., 100.))

X = tf.placeholder(tf.float32)

Y = tf.placeholder(tf.float32)

h = W * X + b

cost = tf.reduce_mean(tf.square(h - Y))

rate = tf.Variable(0.1)

op = tf.train.GradientDescentOptimizer(rate)

train = op.minimize(cost)

init = tf.initialize_all_variables()

sess = tf.Session()

sess.run(init)

for step in range(2001):

sess.run(train, feed_dict = {X: x_data, Y: y_data})

if step % 100 == 0:

print(step, sess.run(cost, feed_dict={X: x_data, Y: y_data}), sess.run(W), sess.run(b))

print('Test:', sess.run(h, feed_dict={X: 5}))

<참조>

- 김성훈 교수님 강좌 요약 블로그

- 조대협의 로지스틱 회귀 분석 블로그

- Tensorflow 유튜브 강의

- 로지스틱 회귀 이해

- 선형, 비선형 회귀 모델의 이해

- Tensorflow의 자료형 이해, 상수/변수/플레이스홀더 이해

- 선형 회귀를 Tensorflow로 구현하기

'AI Deep Learning' 카테고리의 다른 글

[자연어 처리] Word2Vec 강의 정리 (0)	2018.11.25
[뉴로모픽] 인공지능과 하드웨어의 결합 워크샵 (0)	2018.10.18
[인공지능] 공부 여정 (0)	2018.07.31
[ML] 11주차 - 독립 특성 발견 (0)	2015.03.07
[ML] 10주차 - 고급 분류 기법 (0)	2015.02.28

posted by 윤영식

2018. 7. 31. 15:25 AI Deep Learning

[인공지능] 공부 여정

인공지능 공부하기 위한 여정을 정리하고 계속 업데이트 한다. 하루에 2시간 이상 꼭 공부를 해야 강좌를 완료할 수 있다.

Machine Learning & Deep Learning

김성훈 교수님의 인프런 강좌

- 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌

- 모두를 위한 딥러닝 - Deep Reinforcement Learning

앤드류응 교수님의 코세라 강좌

- 머신러닝

머신러닝 Engineer 학습경로

- Machine Learning Engineer 커리큘럼

Edwith의 인공지능, 딥러닝 강좌

- 조경현 교수님의 딥러닝을 이용한 자연어 처리

+ Supervised Learning: Hypothesis set <-> DAG (비순환 그래프)를 만드는 과정

+ Disttribution: Binary classification (이진분류), Multicase classification (다중 분류), Linear regression (선형 회귀), Multimodal linear regression (다항 회귀)

테리의 딥러닝

- 딥러닝 토크 시리즈

- 테리님 왈 다음과 같은 과정으로 공부하길 추천함

<초급>

- 테리의 머신러닝 1시간

- Ng교수의 코세라 머신러닝, 구글 유다시티의 딥러닝강좌

- 조대협님의 머신러닝 블로그글 (내가 추가한 것임)

<중급>

- Mathatices Monk

- Bay area machine learning school

- Stanford CS231

T 아카데미의 인공지능 강좌

- 인공지능을 위한 머신러닝 알고리즘

+ 김성훈 & 앤드류응 교수님의 강좌수강 후 개념 정리용 (단, 수학공식이 많이 나옴, 수학방을 이용하자)

+ 설명중 회귀 모델에 대한 보다 자세한 설명

+ 설명중 우도(가능도-Likelihood) 자세한 설명

Microsoft의 데이터 과학 전문 프로그램

- 필수 과목 11개

- 과정당 12시간: 하루 2시간 계산하면 과정당 1주가 걸림 -> 총 11주 프로그램

- 필요한 것을 선별해서 보면 좋을 듯함.

Interactive Data

Python 배우기

- T 아카데미의 Python 프로그래밍: 파이썬 3 기반 기초

- T 아카데미의 Python을 활용한 데이터분석 기초: Jupyter Notebook기반으로 Pandas, Seaborn 실습

- T 아카데미의 Python을 이용한 데이터분석 실습

- Edwith의 머신러닝을 위한 Python

Tensorflow 배우기

- Tensorflow 공식 홈페이지

- 골빈해커의 텐서플로우 강좌

- 이찬우님의 텐서플로우 유튜브 강좌

- Tensorflow로 MNIST 실습 SlideShare

CNN 이해

- 초보자가 이해하기 좋은 CNN 이해 SlideShare

- CNN 스탠포드 강좌 - CS231n

RNN 이해

- 초보자가 이해하기 좋은 CNN, RNN 이해 SlideShare

- RNN LSTM 이해 - Colah

용어 이해

- Softmax 이해

- Activation Function 이해

- Back Propagation 이해. 수식으로 설명, 코드로 설명

- ReLu 이해: 역전파의 오류 방지

- 알고리즘 복잡도 이해 - Big O == "최악의 경우(시간복잡도가 클 경우)에도 이 시간 정도면 된다" 라는 의미

- Log 함수 이해

- tanh 이해

- LSTM 이해

To be continued...

사실 계속 공부해도 감 잡기는 정말 힘들다. 프로젝트를 해봐야 뭐라도 하나 잡고 갈듯하다.

<참조>

- 인공지능과 머신러닝 학습 경로

- 테리님 블로그

- 조대협님 블로그

- 조경현 교수님의 뉴욕댁 머신러닝 강좌 소개 및 소스

- 조경현 교수님이 참조하였다는 머신러닝의 강의 자료

- 시그모이드 함수 설명

- Activation Function 설명

- 역전파(Backpropagation) 설명, 잘 이해해야 함 (Adnrej Karpathy), Andrej의 RNN 이야기

- 로그함수 설명

- 수학방의 로그함수 좀더 기초적 설명

- 수학 기호 명칭 - 수식을 볼려면 기호의 의미를 알아야 한다.

- 미분에 대한 쉬운 이해

- MNIST - yann.lecun.com

'AI Deep Learning' 카테고리의 다른 글

[뉴로모픽] 인공지능과 하드웨어의 결합 워크샵 (0)	2018.10.18
[Cost Function] 로지스틱 회귀의 비용함수 이해 (0)	2018.08.11
[ML] 11주차 - 독립 특성 발견 (0)	2015.03.07
[ML] 10주차 - 고급 분류 기법 (0)	2015.02.28
[ML] 9주차 - 가격 모델링 (0)	2015.02.21

posted by 윤영식

2018. 7. 19. 15:27 AI Deep Learning/ML by Andrew Ng

[Machine Learning - NG] Linear Algebra - 선형 대수학

선형 대수학 강좌를 정리한다.

Matrix vs Vector vs Scalar

Matrix = m * n = 행*렬 = row * column

Vector = m * 1 형태의 Matrix = 크기와 방향을 가짐

Scalar = Matrix * 상수 = 크기만 가짐

Matrix Vector Multiplication (곱)

[ m * n ] [ n * 1 ] = [ m * 1 ]

가설 방정식을 이와 같이 표현할 수 있음. 예로 집값 예측 방정식을 수식으로 표현하면 4차원 벡터가 (4 dimensional vector) 나온다.

Matrix Matrix Multiplication

matrix vector 곱의 결과를 모아 놓은 형태로 보면됨.

결과는 다음의 형태가 된다.

각 가설을 다시 matrix matrix multiplication으로 만들면 각 가설의 결과값이 column으로 나온다.

Matrix properties (속성)

A, B가 일반 행렬이고, I 가 항등 행렬이라고 하면

- 교환 법칙: A * B != B * A 성립하지 않는다.

- 행렬곱 주의: A * (B * C) = (A * B) * C

- 항등행렬: n*n 으로 행과 열이 같으면서 대각선은 1이고 나머지는 0인 행렬 (identity matrix), A * I = I * A = A

Inverse matrix (역행렬)

Matrix을 inverse해서 역행렬하고 matrix과 곱하면 항등행렬을 얻는다. 이때 역행렬을 얻을 수 있는 것은 정방행렬(행과 열의 수가 같은 행렬)뿐이다.

역행렬을 가질 수 없는 예로 0으로 채워진 행렬은 역행렬을 가질 수 없다. 이를 singular matrix 또는 degenerate matrix라 칭한다.

Matrix transpose (전치행렬, transposition)

m * n 을 n * m으로 만들기

참조

- 앤드류응 교수의 선형대수학 강좌.

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

[Machine Learning - NG] Gradient Descent (0)	2018.07.19
[Machine Learning - NG] Supervised Learning (0)	2018.07.16

posted by 윤영식

2018. 7. 19. 14:09 AI Deep Learning/ML by Andrew Ng

[Machine Learning - NG] Gradient Descent

앤드류 응교수님의 ML 강좌를 정리한다.

Gradient Descent

hypothesis 함수를 적절한 parameter를 가지고 검증할 필요가 있다. 아래 그림과 같이 특정 파라미터 값에 따라 하강한 위치가 틀려 질 수 있다. cost 함수를 최소값을 찾는 것인데, 잘 못된 곳으로 내려가면 해당 값이 최소인것으로 오인할 수 있다.

- 하강의 스텝(learning rate, 얼마의 보폭으로 하강하는지 정도)은 알파이다.

- 하강의 방향(direction)-기울기-는 미분(derivative)으로 계산한다.

- starting point가 틀리면 도착한 지점이 틀리게 나왔다.

- 수학적으로 Gradient descent algorithm을 사용한다.

알파: Learning rate * 미분계수

:= 대입기호, = truth assertion

temp0, temp1을 구한다음 세타0, 세타1에 대입한다.

미분계수를 이용한 Gradient Descent 알고리즘 이해

함수의 tanzent값을 구함. 즉, 기울기를 구함.

- 세타1이 최소값보다 클때 미분계수에 의한 탄젠트 기울기값은 양수이다.

- 세타1이 최소값보다 작을때 미분계수에 의한 탄젠트 기울기값은 음수이다.

- 알파(learning rate)에 따라 하강 step이 정해진다.

+ 알파값이 작으면 최소값을 찾는데 느리고

+ 알파값이 크면 최소값을 못 찾고 멀어진다.

- 하강 기울기가 줄어들 때마다 세타1의 값이 점점 작아진다. 이것은 공식에서 세타1 - 알파*미분계수(기울기 slop값) 을 빼주기 때문에 가능하다. 알파값은 상수 유지 가능.

- J(세타1) 이라는 cost function 그래프에서 미분계수값이 최소가 되는 곳의 세타1의 값을 알 수 있다.

즉, 미분계수 0을 찾는게 목적이다.

세타1 := 세타1 - 알파 * 0

비용함수와 기울기 하강 함수를 같이 사용하기

Gradient Descent 알고리즘과 비용 함수 J(세타1, 세타2)

- 좌측 좌표가 가운데로 하강을 할 수록 기울기가 점점 변경된다. 선형 회귀는 항시 하나의 최적값을 갖는 밥그릇의 Convex(볼록) 모양을 갖는다.

결론 Cost function j의 해답을 얻기 위해 하강 기울기 알고리즘을 사용한다.

Gradient Descent for Linear Regression

선형 회귀의 경우 새로운 형태의 Gradient Descent방정식이 도출된다.

- m: training set 사이즈

- 세타0: 초기시작값 - 상수

- 세타1: 기울기값 - 변경값

- xi, yi: training data set

Gradient Descent 식에 J(세타)즉 cost founction을 넣어서 식을 간략히 하면 다음과 같이된다.

참조

- 앤드류 응교수님의 ML 강좌

- 하용호님의 NN 정리 SlideShare

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

[Machine Learning - NG] Linear Algebra - 선형 대수학 (1)	2018.07.19
[Machine Learning - NG] Supervised Learning (0)	2018.07.16

posted by 윤영식

2018. 7. 16. 18:06 AI Deep Learning/ML by Andrew Ng

[Machine Learning - NG] Supervised Learning

앤드류응 교수님의 코세라 강좌를 정리한다.

Supervised Learning

지도학습과 자율학습에 대한 개념이해

지도학습

- 정답을 주고 학습

- regression과 classification이 있음

- regression: 여러 개 중 하나

- classification: 0 또는 1

In supervised learning, we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input and the output.

Supervised learning problems are categorized into "regression" and "classification" problems. In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some continuous function. In a classification problem, we are instead trying to predict results in a discrete output. In other words, we are trying to map input variables into discrete categories.

Example 1:

Given data about the size of houses on the real estate market, try to predict their price. Price as a function of size is a continuous output, so this is a regression problem.

We could turn this example into a classification problem by instead making our output about whether the house "sells for more or less than the asking price." Here we are classifying the houses based on price into two discrete categories.

Example 2:

(a) Regression - Given a picture of a person, we have to predict their age on the basis of the given picture

(b) Classification - Given a patient with a tumor, we have to predict whether the tumor is malignant or benign.

예) Housing Prices 예측 - regression 문제

linear regression

training set을 통해 학습 알고리즘을(learning algorith) 적용해서 가설식(hypothesis)을 만든다.

cost function

- 가설의 정확도를 측정하기 위해 사용한다

- 공식: 가설의 결과값 - 실제값의 제곱의 합

- 점진적 감소 (gradient descent)를 위해 1/2를 사용한다.

- 정확도 측정 J 함수를 얻음.

세타0을 값 zero로 놓고 간략히 표현한 수식

- x 값을 줄 때 시작점 세타0과 기울기 세타1의 상수 값을 찾아야 한다.

- 비용함수인 J(세타0, 세타1)에서 세타0 을 zero로 놓으면 시작점이 zero부터 시작해서 비용함수 J(세타1)을 구하는 것이다.

- J 공식 결과가 0 이면 가장 작은 비용을 들인 경우이다. 이때 J(세타1)에서 세타1의 값이 1일 때 비용이 전부 0으로 나온다.

- 만일 세타1값이 0.5라면 cost function 처리 값은 다음과 같이 0.58이 나온다.

- 음수의 영역을 이동하면 cost function 은 가설값 - 실제값의 제곱의 합이므로 다음과 같이 등고선 그래프가 나온다.

등고선 그래프로 세타0, 세타1 눈으로 확인하기

등고선을 입체적으로 보면 다음과 같다.

- 수평선은 세타1, 세타0 이다.

- 수직선은 cost function의 결과값 J(세타0, 세타1) 이다.

- 세타1=기울기, 세타0은 시작점

이것을 다시 평면으로 H(x) 와 비교하기위해 평면 등고선을 가지고 눈으로 세타0, 세타1의 값을 가지고 가설의 선을 검증할 수 있다.

예1) 같은 등고선에 있는 3개의 x는 값은 높이 값, 즉 비용함수 결과값을 갖는다. 이것을 h(x)상에 세타0, 세타1을 이용해 그리면 다음과 같이 나온다.

데이터셋과 h(x) 선의 거리가 전혀 맞아 들어가지 않아 가설 선이 맞지 않음을 알 수 있다.

예2) 좀 더 중심으로 이동한 빨간색 x는 등고선에서 세타0=360, 세타1=0 값을 가즌다. 이를 세타1=기울기, 세타0은 시작점으로 보면 h(x)는 수평선이 나온다. 이동 실 데이터의 거리값이 작지 않음을 보여준다.

중심으로 이동할 때 다음과 같이 최적의 가설 세타0과 세타1을 얻을 수 있다.

세타0 = 250

세타1 = 0.12

Unsupervised

자율학습

- 확인된 답을 제공하지 않음

예) 고객이 어디 고객군에 속하는지 알 수 없다. 천문학등

- clustringr과 non-clustering

Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don't necessarily know the effect of the variables.

We can derive this structure by clustering the data based on relationships among the variables in the data.

With unsupervised learning there is no feedback based on the prediction results.

Example:

Clustering: Take a collection of 1,000,000 different genes, and find a way to automatically group these genes into groups that are somehow similar or related by different variables, such as lifespan, location, roles, and so on.

Non-clustering: The "Cocktail Party Algorithm", allows you to find structure in a chaotic environment. (i.e. identifying individual voices and music from a mesh of sounds at a cocktail party).

참고

- 앤드류 응교수님의 머신러닝 강좌

- 회귀 분석 예제

- 선형 회귀 분석 데이터 이해

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

[Machine Learning - NG] Linear Algebra - 선형 대수학 (1)	2018.07.19
[Machine Learning - NG] Gradient Descent (0)	2018.07.19

posted by 윤영식

2018. 7. 13. 16:10 AI Deep Learning/NN by Sung Kim

[Reinforcement Learning] Q Network

Q N etwork 강좌를 정리한다.

Q Network 개념

실제 문제를 풀어가기에는 Q Table 구성 사이즈가 너무나 크다. 따라서 Network을 구성해서 푼다. 주어진 입력, 출력을 사용자가 조절하면서 State, Action주어 원하는 Output을 얻어낸다. 적은 table을 사용해서 원하는 결과를 얻어내는 것

Gym Game에서 출력을 Action 4개로 보면 다음과 같다.

상태만 주고 모든 가능한 액션을 얻어내자. 앞으로 아래 모델을 사용한다.

비용에 대한 최소화를 공식화 하면

- W: Weight,

- y: 실제값

- cost: 비용

목표는 Optimal Q인 Q* 즉, y값을 구한다. Ws는 네트워크가 만들어낸 Q prediction이라 할 수 있다.

Q hat을 붙이면 hat이 prediction을 의미한다. "시타 = 세타"를 weight 이다.

이 알고리즘을 문장으로 풀어쓰면

- 초기 weight을 random하게 준다.

- 첫번째 상태를 준다. @(s) == 파이(에스) - one hot을 해준다.

- E-greedy를 사용해 가장 좋은 action을 취한다.

- 결과로 상태랑 reward를 준다.

- 학습을 한다.

해당 알고리즘은 deep mind의 핵심 알고리즘이다. 코드화 하면

다음으로 학습을 시킨다.

Yj값으 두개인데, Done이면 Rj이고, 중간 진행은 Rj + rmaxxQ(@=1,a:세타)이다.

Q Network의 결과는 Q Table 보다 성능이 안좋다. 이를 좀 더 빠르게 할려면?

diverge(다이버즈): 분산되어 결과가 안 좋다의 뜻

DQN 개념

강화학습의 가장 중요한 알고리즘이다. (강좌) 두가지 큰 문제는 2가지 이다.

- 샘플데이터간의 correlation: 샘플이 다양하지 않고 연관성(correlation)이 있다.

- target이 흔들린다. target은 Y Label 이다. 예) 화살을 쏘자 과녁이 움직이는 경우

DQN의 3가지 솔루션

1) Go deep

네트워크가 깊게 갈 수록 좋다.

2) Experience replay

action의 state를 buffer에 저장한후 사용한다. D = buffer

buffer에서 random하게 가져오면 sample의 correlation을 해결할 수 있다.

3) non-stationary targets

타겟이 움직인다. 세타 Weight을 update하면 target도 움직인다. Target의 세타를 그대로 둔다. 두개의 Network에서 첫번째 Network에서 target을 가져와서 두번째 Network에서 사용한다.

2015년 Deep Mind가 Nature에 연재한 논문 알고리즘

참조

- 김성훈 교수님의 Q Network 강좌

- 김성훈 교수님의 DQN 강좌

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] 강화학습 (0)	2018.07.12
[RNN] Basic & Training 하기 (0)	2018.07.11
[RNN] Recurrent Neural Network 개념 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11

posted by 윤영식

2018. 7. 12. 16:36 AI Deep Learning/NN by Sung Kim

[Reinforcement Learning] 강화학습

강화학습 강좌를 정리한다.

RL 개념

환경(세상, Environment)에서 행동하는 액터(Actor)는 환경속에서의 상태가 변경됨. 매순간마다 잘했다 못했다는 보상(Reward)을 줌.

- 1997년 Tom Mitchell 나온 이야기이다.

- 2013, 2015년에 부활함: 벽돌깨기 게임에서 사용

옛날 게임에 적용해서 학습해 보니 reinforcement learning이 사람보다 더 잘하더라~~~. 알파고가 deep-reinforcement-learning 사용한다.

- 빌딩 에너지 관리

- 로보틱스

- 투자

- E-commerce 추천

- 광고 ads

Q = r + Q 수학 기본을 사용한다. Tensorflow/Python으로 실습가능

OpenAI GYM Games

Agent가 움직이고, 상태와 보상을 받는다. gym 환경을 별도 제공한다.

gym 코드

Q Learning

RL의 핵심이다.

입력

- 내가 있는 상태

- 이런 행동을 할려고 합니다.

Q(s, a) => s-state, a-action

출력

- Q가 결과를 내줌

Optimal Policy = 파이*별표

Q가 있다고 가정했지만 Q를 어떻게 학습할 것인가가 중요 사항임.

==> r + maxQ(s1, a1)

r: reward

max: argmax

s: state

a: action

Q값이 학습을 통해서 다음과 같이 생긴다.

전체 Q 알고리즘 정리하면

- 그림처럼 Q(s,a) 테이블을 만들고 0으로 초기화 한다.

- state s 상태를 가져온다.

- 끝날때까지 무한 반복하면서 action을 취하고 reward를 받으면서 S -> S1(prime)으로 이동한다.

- Q 학습이 진행된다.

r: 현재의 reward 값

maxQ(s1,a1): 다음에 얻을 수 있는 최고의 reward 값

Tensorflow 구현 코드

- Q table초기화: np.zeros

- env.reset() 현재의 상태값

- while not done 돌며 끝날때 까지 Q Learning(학습) 수행

Exploit vs Exploration

Exploit: 현재 있는 값을 이용한다.

Exploration: 모헙을 해본다.

예) 평일에는 가던곳을 하고 주말에는 안가보던 곳을 모험해 본다.

E-greedy: exploration의 정도

Discounted future reward: 감마(0.9) 를 곱하여 미래의 reward를 줄여서 계산한다.

Tensorflow code

참조

- 김성훈교수님의 강화학습 강좌

- 김성훈교수님의 Q Learning 강좌

- OpenAI GYM 설명

- 강화학습 이해하기

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] Q Network (0)	2018.07.13
[RNN] Basic & Training 하기 (0)	2018.07.11
[RNN] Recurrent Neural Network 개념 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11

posted by 윤영식

2018. 7. 11. 17:13 AI Deep Learning/NN by Sung Kim

[RNN] Basic & Training 하기

RNN Basic 강좌를 정리한다.

RNN Basic

cell단위로 다루어 Tensorfllow 코딩으로 OUTPUT이 다시 INPUT으로 들어오게 한다.

- xxxRNNCell 의 output 사이즈를 정해주고 cell을 만든다.

- cell을 dynamic_rnn에서 cell을 실제 구동시켜본다.

cell 학습: BasicRNNCell, BasicLSTMCell등을 바꾸어 사용할 수 있다.

Cell 만들기

문자를 one hot encoding 을 이용해 vector로 표현한다.

- input dimenstion

- hidden size를 우리가 정하기 나름에 따라 정해질 수 있다.

위 두가지는 cell을 만들 때 정의하는 것이다.

Tensorflow로 표현한다.

- BasicLSTMCell 사용

- outputs, states를 얻음

hidden_size 2여서 값은 2개의 shape 가 나온다.

Unfold 풀어놓기

이것을 풀어서 (unfold) 보자.

- sequence_length 5는 unfold 5개 한다는 것이다. 입력데이터의 모양에 따라 결정된다.

Tensorflow에서 h, e, l, o에 대한 변수를 만들어 np.array([h, e, l, l, o]..)를 생성한다. dimenstion 2개인 5개 output이 나옴. 이것은 입력을 줄 때 어떤 Shape이 나오는지 출력해 본 것이다.

Batch Size 만들기

문자를 다양하게 주어 (Batch Size)를 여러개 넣어서 만들어 본다.

Tensorflow 코드

Hi Hello Training 시키기

h를 입력하면 다음은 i 나옴을 학습시킨다.

훈련시킬 단어: "hihello" 에서 Unqiue한 Vocabulary를 만든다. 문자열에 대해 index를 표현한다. 해당 index를 one hot encoding으로 변환한다.

여기서 다음을 정한다.

- 입력 차원

- Sequence 갯수

- 출력(hidden) 차원

- Batch size 정하기

Creating NN Cell

cell의 size는 출력값 5로 정한다.

- rnn_cell.BasicRNNCell(rnn_size)

- rnn_cell.BasicLSTMCell(rnn_size)

- rnn_cell.GRUCell(rnn_size)

RNN Parameters

output from the LSTM : hidden_size = 5

one-hot size : input_dim = 5

one sentence : batch_size = 1

/ihello/ == 6 : sequence_length = 6

Data Creation

Feed to RNN

None은 batch가 많아도됨을 의미. cell을 만들고, batch_size주고, dynmaic_rnn을 호출한다.

Cost: sequence_loss

얼마나 Output이 정확한가를 sequence_loss를 사용하여 예측을 해본다. 예측값이 얼마나 좋은지를 loss값으로 알 수 있다.

모델을 만든다.

지금은 output을 간단히 logits에 넣어서 사용한다. 실제는 이렇게 사용하진 않는다.

Training을 시킨다.

결과

prediction한 charactor에 대해 시간이 지날 수록 그 다음 문자에 대한 예측(prediction) 이 높아진다.

참조

- 김성훈 교수님의 RNN Basic 강좌

- 김성훈 교수님의 RNN Training 강좌

- RNN Basic, LSTM 이해

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] Q Network (0)	2018.07.13
[Reinforcement Learning] 강화학습 (0)	2018.07.12
[RNN] Recurrent Neural Network 개념 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11

posted by 윤영식

2018. 7. 11. 15:43 AI Deep Learning/NN by Sung Kim

[RNN] Recurrent Neural Network 개념

RNN 기본 강좌를 정리한다.

RNN 개념

음성인식, 자연어 같은 Sequence data일 경우 처리 네트워크

- 이전의 결과가 다음 series에 영향을 미쳐야 한다.

해당 그림을 풀어 놓으면 결과 state가 다음 연산에 영향을 미침. Series data에 적합한 모델

계산식화 하면

- old state (ht-1) 과 x를 input로 사용하여 new state (ht)를 구한다.

가장 기초적인 (Vanilla) RNN을 만들때 Wx를 사용한다. tanh는 sigmoid다른 형태이다.

- ht는 다음 rnn로 넘기는 값

- y는 w x ht하여 값을 구함

Weight값으 전체 cell에 나 똑같은 값을 사용한다.

RNN 예측 사용

예) 예제에서 helo를 넣었을 때 예측으로 hello 라고 예측하는 시스템을 RNN으로 만듦

- h,e,l,o를 1또는 0값의 벡터로 만들고 이전과 현재를 계산한다. 처음에는 0을 사용한다.

여기서 y값을 구한다.

softmax의 label(결과)를 취한다. 두번째 자리는 error가 발생. output layer의 값을 가지고 learning 하고 예측을 한다.

- language model - 연관 검색어 찾기

- Speech Recognition

- Machine Translation

- Conversation Modeling/Question Answering

- Image/Video Captioning

- Image/Music/Dance Generation

RNN을 어떻게 사용하느냐가 관건이다.

Multi Layer RNN을 사용할 수도 있다.

RNN에서 Vanilla Model가 복잡하면

- Long Short Term Memory (LSTM)을 쓰거나

- GRU by Cho et al. 2014를 쓸수도 있다.

참조

- 김성훈교수님의 RNN 기본 강좌

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[Reinforcement Learning] 강화학습 (0)	2018.07.12
[RNN] Basic & Training 하기 (0)	2018.07.11
[CNN] Class, tf.layers, Ensemble (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11
[CNN] Tensorflow CNN 기본 (0)	2018.07.11

posted by 윤영식

2018. 7. 11. 15:08 AI Deep Learning/NN by Sung Kim

[CNN] Class, tf.layers, Ensemble

Class, tf.layers, Ensemble 강좌를 정리한다.

Python Class로 관리하기

파이썬의 클래스로 만들어 사용하자. 복잡한 layer를 만들 때 사용하자.

예제

class Model:

def __init__(self, sess, name):

self.sess = sess

self.name = name

self._build_net()

def _build_net(self):

with tf.variable_scope(self.name):

# dropout (keep_prob) rate 0.7~0.5 on training, but should be 1

# for testing

self.keep_prob = tf.placeholder(tf.float32)

# input place holders

self.X = tf.placeholder(tf.float32, [None, 784])

# img 28x28x1 (black/white)

X_img = tf.reshape(self.X, [-1, 28, 28, 1])

self.Y = tf.placeholder(tf.float32, [None, 10])

# L1 ImgIn shape=(?, 28, 28, 1)

W1 = tf.Variable(tf.random_normal([3, 3, 1, 32], stddev=0.01))

# Conv -> (?, 28, 28, 32)

# Pool -> (?, 14, 14, 32)

L1 = tf.nn.conv2d(X_img, W1, strides=[1, 1, 1, 1], padding='SAME')

L1 = tf.nn.relu(L1)

L1 = tf.nn.max_pool(L1, ksize=[1, 2, 2, 1],

strides=[1, 2, 2, 1], padding='SAME')

L1 = tf.nn.dropout(L1, keep_prob=self.keep_prob)

'''

Tensor("Conv2D:0", shape=(?, 28, 28, 32), dtype=float32)

Tensor("Relu:0", shape=(?, 28, 28, 32), dtype=float32)

Tensor("MaxPool:0", shape=(?, 14, 14, 32), dtype=float32)

Tensor("dropout/mul:0", shape=(?, 14, 14, 32), dtype=float32)

'''

# L2 ImgIn shape=(?, 14, 14, 32)

W2 = tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.01))

# Conv ->(?, 14, 14, 64)

# Pool ->(?, 7, 7, 64)

L2 = tf.nn.conv2d(L1, W2, strides=[1, 1, 1, 1], padding='SAME')

L2 = tf.nn.relu(L2)

L2 = tf.nn.max_pool(L2, ksize=[1, 2, 2, 1],

strides=[1, 2, 2, 1], padding='SAME')

L2 = tf.nn.dropout(L2, keep_prob=self.keep_prob)

'''

Tensor("Conv2D_1:0", shape=(?, 14, 14, 64), dtype=float32)

Tensor("Relu_1:0", shape=(?, 14, 14, 64), dtype=float32)

Tensor("MaxPool_1:0", shape=(?, 7, 7, 64), dtype=float32)

Tensor("dropout_1/mul:0", shape=(?, 7, 7, 64), dtype=float32)

'''

# L3 ImgIn shape=(?, 7, 7, 64)

W3 = tf.Variable(tf.random_normal([3, 3, 64, 128], stddev=0.01))

# Conv ->(?, 7, 7, 128)

# Pool ->(?, 4, 4, 128)

# Reshape ->(?, 4 * 4 * 128) # Flatten them for FC

L3 = tf.nn.conv2d(L2, W3, strides=[1, 1, 1, 1], padding='SAME')

L3 = tf.nn.relu(L3)

L3 = tf.nn.max_pool(L3, ksize=[1, 2, 2, 1], strides=[

1, 2, 2, 1], padding='SAME')

L3 = tf.nn.dropout(L3, keep_prob=self.keep_prob)

L3_flat = tf.reshape(L3, [-1, 128 * 4 * 4])

'''

Tensor("Conv2D_2:0", shape=(?, 7, 7, 128), dtype=float32)

Tensor("Relu_2:0", shape=(?, 7, 7, 128), dtype=float32)

Tensor("MaxPool_2:0", shape=(?, 4, 4, 128), dtype=float32)

Tensor("dropout_2/mul:0", shape=(?, 4, 4, 128), dtype=float32)

Tensor("Reshape_1:0", shape=(?, 2048), dtype=float32)

'''

# L4 FC 4x4x128 inputs -> 625 outputs

W4 = tf.get_variable("W4", shape=[128 * 4 * 4, 625],

initializer=tf.contrib.layers.xavier_initializer())

b4 = tf.Variable(tf.random_normal([625]))

L4 = tf.nn.relu(tf.matmul(L3_flat, W4) + b4)

L4 = tf.nn.dropout(L4, keep_prob=self.keep_prob)

'''

Tensor("Relu_3:0", shape=(?, 625), dtype=float32)

Tensor("dropout_3/mul:0", shape=(?, 625), dtype=float32)

'''

# L5 Final FC 625 inputs -> 10 outputs

W5 = tf.get_variable("W5", shape=[625, 10],

initializer=tf.contrib.layers.xavier_initializer())

b5 = tf.Variable(tf.random_normal([10]))

self.logits = tf.matmul(L4, W5) + b5

'''

Tensor("add_1:0", shape=(?, 10), dtype=float32)

'''

# define cost/loss & optimizer

self.cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(

logits=self.logits, labels=self.Y))

self.optimizer = tf.train.AdamOptimizer(

learning_rate=learning_rate).minimize(self.cost)

correct_prediction = tf.equal(

tf.argmax(self.logits, 1), tf.argmax(self.Y, 1))

self.accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

def predict(self, x_test, keep_prop=1.0):

return self.sess.run(self.logits, feed_dict={self.X: x_test, self.keep_prob: keep_prop})

def get_accuracy(self, x_test, y_test, keep_prop=1.0):

return self.sess.run(self.accuracy, feed_dict={self.X: x_test, self.Y: y_test, self.keep_prob: keep_prop})

def train(self, x_data, y_data, keep_prop=0.7):

return self.sess.run([self.cost, self.optimizer], feed_dict={

self.X: x_data, self.Y: y_data, self.keep_prob: keep_prop})

Layer API

conv2d: convolution layer

dense: fully conntected

예제

Ensemble 사용하기

여러개를 조합해서 조화롭게 만든다. 여러개의 독립된 Model을 training시키고, 각 예측을 조합하여 최종 결과를 만든다.

Ensemble Training 하기

- Model을 만든다

- 각각의 독립된 Model 을 꺼내와서 학습을 시킨다.

각각의 합치는 것으로 조화롭게 만들어 본다. 결과 중 가장 높은 값을 선택한다.

Tensorflow 코드에서 prediction은 최종 결과의 값들이다. 정확도가 0.9952 까지 올라간다.

참조

- 김성훈 교수님의 Class, tf.layers, Ensemble 강좌

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

[RNN] Basic & Training 하기 (0)	2018.07.11
[RNN] Recurrent Neural Network 개념 (0)	2018.07.11
[CNN] MNIST 99% 도전 (0)	2018.07.11
[CNN] Tensorflow CNN 기본 (0)	2018.07.11
[CNN] Convolution Neural Network (0)	2018.07.10

posted by 윤영식

1 2 3 4 5 6 ··· 26

Publication

Tag

Search

Category

Recent Post

'Intelligence Convergence'에 해당되는 글 519건

'Meteor > React + Meteor' 카테고리의 다른 글

'Meteor > React + Meteor' 카테고리의 다른 글

'BlockChain' 카테고리의 다른 글

'BlockChain' 카테고리의 다른 글

'AI Deep Learning' 카테고리의 다른 글

Install React with Typescript

SCSS 환경구축

Component LifeCycle

Component Type

Router for SPA

Redux

<참조>

'React' 카테고리의 다른 글

'AI Deep Learning > Read Paper' 카테고리의 다른 글

'AI Deep Learning > Read Paper' 카테고리의 다른 글

'AI Deep Learning' 카테고리의 다른 글

'AI Deep Learning' 카테고리의 다른 글

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

'AI Deep Learning > ML by Andrew Ng' 카테고리의 다른 글

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

'AI Deep Learning > NN by Sung Kim' 카테고리의 다른 글

티스토리툴바