Deep Learning with Python - Ch.01

케라스 창시자에게 배우는 딥러닝을 실습하면서 정리한 포스트입니다. 코드 예제와 코드 설명은 역자 깃허브에서 받아볼 수 있습니다. 출판물이고 개인적으로만 참고하기 위한 요약노트이다 보니 설명이 불친절한 점은 양해 바랍니다. 보다 자세한 내용을 원하시는 분은 위 링크의 책을 참고하시기 바랍니다.

1장 딥러닝이란 무엇인가?

인공지능과 머신 러닝, 딥러닝

인공지능

보통의 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구 활동
인공지능 ⊃ 머신러닝 ⊃ 딥러닝
심볼릭 AI : “명시적인 규칙을 충분히 많이 만들어 지식을 다루면 인간 수준의 인공지능을 만들 수 있다” ☞ 하지만 명확한 규칙을 찾는게 쉽지 않음

머신러닝

전통적 프로그래밍 : 규칙, 데이터를 넣어서 해답을 찾는다
머신러닝 : 데이터, 해답을 넣어서 규칙을 찾는다

데이터에서 표현을 학습하기

머신 러닝과 딥러닝의 핵심 문제는 의미 있는 데이터로의 변환
입력 데이터를 기반으로 기대 출력에 가깝게 만드는 유용한 표현을 학습하는 것

딥러닝에서 ‘딥’이란?

딥러닝은 머신러닝의 특정한 한 분야로 연속된 층에서 점진적으로 의미 있는 표현을 배우는 데 강점이 있음
‘딥’이란 연속된 층으로 표현을 학습한다는 개념을 나타냄
딥러닝에선 기본 층을 겹겹이 쌓아 올려 구성한 신경망이라는 모델을 사용

그림 3개로 딥러닝의 작동 원리 이해하기

신경망은 가중치를 파라미터로 가진다
손실 함수가 신경망의 출력 품질을 측정한다
손실 점수를 피드백 신호로 사용하여 가중치를 조정한다

지금까지 딥러닝 성과

이미지 분류, 음성, 필기 인식 등
여전히 할 수 있는 일을 알아가는 중. 형식 추론과 같은 다양한 문제에 적용하기 시작

단기간의 과대 선전을 믿지 말자

딥러닝이 할 수 있는 것과 할 수 없는 것에 대해 명확히 이해하자

AI에 대한 전망

단기 기대는 비현실적일수도 있지만 장기 전망은 매우 밝다

딥러닝 이전: 머신 러닝의 간략한 역사

확률적 모델링

통계학 이론을 데이터 분석에 응용한 것
나이브 베이즈 알고리즘 : 입력 데이터의 특성이 모두 독립적이라 가정하고 베이즈 정리를 적용하는 머신 러닝 분류 알고리즘
로지스틱 회귀 : 현대 머신 러닝의 “hello world”

초창기 신경망

경사 하강법 최적화를 사용해 연쇄적으로 변수가 연결된 연산을 훈련하는 방법
최초의 성공적인 신경망 애플리케이션은 합성곱 신경망과 역전파를 연결해 손글씨 숫자 이미지를 분류하는 문제에 적용됨

커널 방법

분류 알고리즘의 한 종류로 SVM(서포트 벡터 머신)이 가장 유명
SVM은 2개의 다른 범주에 속한 데이터 그룹 사이에 결정 경계(decision boundary)를 찾는다
decision boundary를 찾는 두 단계 과정
- decision boundary가 하나의 초평면(hyperplane)으로 표현될 수 있는 새로운 고차원 표현으로 데이터를 매핑
- 초평면과 각 클래스의 가장 가까운 데이터 포인트 사이의 거리가 최대가 되는 최선의 결정 경계(하나의 분할 초평면)를 찾는다 == 마진 최대화 단계

결정트리, 랜덤 포레스트, 그래디언트 부스팅

결정트리 : 플로차트 같은 구조를 가지며 입력 데이터 포인트를 분류하거나 주어진 입력에 대해 출력 값을 예측
랜덤 포레스트 : 서로 다른 결정 트리를 많이 만들고 그 출력을 앙상블하는 방법을 사용
그래디언트 부스팅 : 이전 모델에서 놓친 데이터 포인트를 보완하는 새로운 모델을 반복적으로 훈련해 모델을 향상시킴

다시 신경망으로

2011년 IDSIA의 댄 크리슨이 심층 신경망으로 이미지 분류 대회에서 우승했는데 이것이 현대적 딥러닝의 첫 번째 성공
2012년부터 심층 합성곱이 모든 컴퓨터 비전 작업의 주력 알고리즘이 됨

딥러닝의 특징

딥러닝의 변환 능력은 모델이 모든 표현 층을 순차적이 아니라 동시에 공동으로 학습하게 만든다
딥러닝이 데이터로부터 학습하는 방법의 특징
- 층을 거치면서 점진적으로 더 복잡한 표현이 만들어진다
- 이런 점진적인 중간 표현이 공동으로 학습된다

머신러닝의 최근 동향

캐글의 머신 러닝 경연을 살펴보면 동향을 알 수 있다
2016 2017년 캐글 주류는 그래디언트 부스팅 머신(구조적인 데이터의 경우)과 딥러닝(이미지 분류 등 지각에 관한 문제)

왜 딥러닝일까? 왜 지금?

컴퓨터 비전 딥러닝 핵심 아이디어인 합성곱 신경망과 역전파는 1989년에, 시계열을 위한 딥러닝 기본인 LSTM(Long Short-Term Memory) 알고리즘은 1997년에 개발됐는데 2012년 이후에 딥러닝이 부상한 배경에는 다음 세 가지가 있다
- 하드웨어
- 데이터셋과 벤치마크
- 알고리즘 향상

새로운 투자의 바람

딥러닝은 테크 공룡들의 핵심 상품 전략

딥러닝의 대중화

초창기에는 C++과 CUDA 전문가가 되어야 했지만 요즘에는 기본 파이썬 스크립트 기술만 있으면 딥러닝 연구에 충분(씨아노와 텐서플로 덕분)

지속될까?

20년 뒤에는 신경망을 쓰지 않을지도 모르지만 딥러닝과 그 핵심개념에서 파생된 무엇인가를 사용할 것
단순함, 확장성, 다용도와 재사용성

[FC] Tensorflow 패키지 소개(2)

Posted on January 23, 2019

패스트캠퍼스 데이터사이언스스쿨의 김도형 박사님 수업을 듣고 강의자료를 요약한 글입니다. 개인적으로 참고하기 위한 요약노트이니 보다 자세한 내용을 원하시는 분은 https://datascienceschool.net 에 올라와 있는 강의자료를 참고하시기 바랍니다.

변수 공간과 변수의 재사용

Tensor 연산

자동 형변환

미분

TensorFlow를 이용한 선형회귀

퍼셉트론

최적화

TensorBoard

텐서보드용 로그 생성

텐서보드 가동

연습문제 20.1.2

[FC] Tensorflow 패키지 소개

Posted on January 22, 2019

TensorFlow 기본 사용법

텐서 정의
텐서 연산 정의
세션 정의
세션 사용

그래프와 세션

텐서플로는 모든 연산을 자체적인 CPU가 아닌 외부에 분산된 GPU에서 처리한다고 가정 ➜ 컴퓨터 자체적으로 이뤄지는 연산은 없음
텐서(Tensor) 계산 과정은 모두 그래프(Graph)라는 객체 내에 저장됨
그래프를 계산하려면 외부 컴퓨터에 이 그래프 정보를 전달하고 그 결과값을 받아야 하는데, 이 통신과정은 세션(Session)이라는 객체가 담당
모든 텐서 계산은 해당하는 텐서를 포함하는 그래프를 세션 객체에 전달해 원격 실행한 후에 값을 볼 수 있음

그래프

그래프의 구성
- 노드(node): 상수형 텐서, 변수형 텐서, 연산(operation)
- 간선(edge): 노드로부터 출력되는 텐서 자료형
따라서 텐서 자료형을 만들거나 연산자를 연결하면 모두 그래프에 들어가야 함
그래프를 명시적으로 지정하지 않으면 기본 그래프(default graph)에 할당
현재 기본 그래프에 대한 정보 얻기

print(tf.get_default_graph())

tf.Graph 클래스로 명시적으로 그래프 생성하기

my_graph = tf.Graph()

with my_graph.as_default():
    my_x = tf.constant(3)
    my_y = my_x ** 2

세션

Theano의 함수(function)와 비슷한 역할
실제로 계산 그래프를 생성하고 값을 계산하기 위한 환경을 제공
Theano의 함수와 달리 세션 생성과 실행 시작, 종료를 다음과 같은 방법으로 명시해야 함
- 세션 생성: Session 객체 생성. 분산 환경에서는 계산 노드와의 연결을 만듦
- 세션 사용: run 메서드에 그래프를 입력하면 출력 값을 계산하여 반함. 분산 환경에서는 계산 노드로 그래프를 보내 계산을 수행
- 세션 종료: close 메서드. with 문을 사용하면 명시적으로 호출하지 않아도 됨
두 개의 상수형 텐서를 생성하고 세션을 통해 실행하기

x = tf.constant(3)
y = x**2

sess = tf.Session()
print(sess.run(x))
print(sess.run(y))
sess.close()

3
9

with 구문을 사용한 세션 구현 ➜ with 블럭을 나갈 때 자동으로 close 메서드가 호출됨

with tf.Session() as sess:
    out = sess.run([x, y])
    print(out)

[3, 9]

직접 그래프를 만들 경우 ➜ 세션 생성시 해당 그래프를 인수로 주어야 함. (하나의 세션은 하나의 그래프만 받을 수 있음)

with tf.Session(graph=my_graph) as sess:
    out = sess.run([my_x, my_y])
    print(out)

[3, 9]

인터랙티브 세션과 `eval()` 메서드

텐서플로는 간단한 작업이라도 세션을 통해야지만 가능함
이런 불편을 해소하기 위해 파이썬 콘솔이나 주피터노트북을 사용하는 경우 인터랙티브 세션(Interactive Session)을 제공
인터랙티브 세션을 생성한 후에는 텐서의 eval() 메서드를 호출하기만 하면 명시적으로 세션을 지정하지 않더라도 자동으로 세션이 호출되어 텐서의 값이 출력됨

interactive_sess = tf.InteractiveSession()

x.eval(), y.eval()

(3, 9)

as_default() 메서드로 with문 안에서 인터랙티브 세션처럼 사용하기

with tf.Session().as_default():
    print([x.eval(), y.eval()])

[3, 9]

텐서 자료형

Tensor 클래스로 구현된 텐서는 NumPy의 다차원배열 ndarray 클래스처럼 다차원 배열 정보를 다루기 위한 자료형
ndarray와 다른 점은 ndarray는 직접 데이터를 저장하기 위한 자료형이지만 Tensor 클래스는 텐서플로의 계산 그래프 안에서 다차원 데이터를 표현하는 객체라는 차이

텐서 자료형의 종류

상수형(Constant): 미리 주어진 값으로 고정된 텐서
변수형(Variable): 세션 내에서 값이 바뀔 수 있는 텐서
플레이스홀더(Placeholder): 고정된 값을 갖지만 값이 미리 주어지지 않고 나중에 넣을 수 있음

상수형 텐서

숫자나 배열을 tf.constant()를 이용해 상수형 텐서 객체 생성하기

c = [1, 2, 3, 4, 5, 6, 7]
c_tensor = tf.constant(c)
print(c_tensor, type(c_tensor))

Tensor("Const_1:0", shape=(7,), dtype=int32) <class 'tensorflow.python.framework.ops.tensor'>

다양한 메서드를 활용해 상수형 텐서 생성하기
- 대부분의 메서드에서는 배열의 크기를 지정하는 shape 또는 데이터 자료형을 지정하는 dtype 인수를 받음
- shape 인수는 (행 넘버, 열 넘버) 형태의 튜플이나 리스트로 전달함
- dtype 인수는 지정하지 않을 경우 tf.float32 자료형 즉, 32비트 부동소수점 자료형을 사용함

c_tensor = tf.constant(c)
print(c_tensor)

Tensor("Const_9:0", shape=(7,), dtype=int32)

tf.zeros(shape)

zero_tensor = tf.zeros((2, 3))
zero_tensor.eval()

array([[0., 0., 0.],
       [0., 0., 0.]], dtype=float32)

tf.ones(shape)

ones_tensor = tf.ones((2, 3))
ones_tensor.eval()

array([[1., 1., 1.],
       [1., 1., 1.]], dtype=float32)

tf.fill(shape, value)

filled_tensor = tf.fill((2, 3), 2)
filled_tensor.eval()

array([[2, 2, 2],
       [2, 2, 2]], dtype=int32)

tf.zeros_like(tensor)

tf.zeros_like(filled_tensor).eval()

array([[0, 0, 0],
       [0, 0, 0]], dtype=int32)

tf.ones_like(tensor)

tf.ones_like(filled_tensor).eval()

array([[0, 0, 0],
       [0, 0, 0]], dtype=int32)

range 메서드를 사용해 열(sequence)로 구성된 상수형 텐서 만들기

tf.range(start, limit=None, delta=1)

tf.range(5).eval()

array([0, 1, 2, 3, 4], dtype=int32)

linspace 메서드를 사용해 열(sequence)로 구성된 상수형 텐서 만들기
- start 값이 부동소수점이 되도록 함

tf.linspace(start, stop, num)

tf.linspace(0.0, 5, 11).eval()

array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. ],
      dtype=float32)

랜덤한 값을 가지는 상수형 텐서 자료형 만들기

tf.random_uniform(shape, minval=0, maxval=None, seed=None)

tf.random_normal

tf.truncated_normal

tf.random_shuffle

tf.random_crop

tf.random_uniform((2, 3), seed=0).eval()

array([[0.10086262, 0.9701668 , 0.8487642 ],
       [0.04828131, 0.04852307, 0.77747464]], dtype=float32)

convert_to_tensor 함수로 NumPy ndarray 자료형 변환하기

np_array = np.arange(10)
tf.convert_to_tensor(np_array).eval()

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

플레이스홀더

tf.placeholder 명령으로 구현
플레이스홀더(Placeholder) 텐서 자료형은 상수형 텐서와 같은 역할을 하지만 크기만 설정하고 값은 미리 주지 않음
플레이스홀더의 값은 session을 사용한 그래프의 연산 중에 설정할 수 있음
신경망 모형의 경우 대부분 배치(batch) 단위의 학습이 이루어지기 때문에 학습용 데이터는 플레이스 홀더에 넣음
플레이스홀더는 데이터의 타입과 크기를 인수로 설정해 생성하고, session을 실행할 때 feed_dict 인수로 플레이스홀더에 데이터를 지정함
플레이스홀더에 들어가는 데이터 크기의 달라질 때는 shape 인수를 설정할 때 달라지는 차원의 값을 정수가 아닌 None으로 설정
다음은 플레이스홀더 x의 열의 갯수는 10개이지만 행의 갯수는 미정인 경우

x = tf.placeholder(dtype=tf.int32, shape=(None, 10))  # 행의 갯수는 미정, 열의 갯수는 10개
value = np.arange(30).reshape(3, 10)

with tf.Session() as sess:
    x_assigned = sess.run(x, feed_dict={x: value})
    print(x_assigned)

[[ 0  1  2  3  4  5  6  7  8  9]
 [10 11 12 13 14 15 16 17 18 19]
 [20 21 22 23 24 25 26 27 28 29]]

변수형 텐서

tf.Variable 클래스로 구현
session 내에서 값이 변할 수 있음
변수형 텐서를 선언하려면 초기값으로 설정할 값을 입력

var = tf.Variable(tf.zeros((2, 3)))
var

<tf.variable 'variable:0' shape="(2," 3) dtype="float32_ref">

초기화 연산자

변수형 텐서를 생성할 때 입력한 초기값은 initial_value 라는 속성에 저장되고 아직 해당 변수형 텐서의 값으로 할당되어 있지 않음 ➜ 이 상태에서 바로 eval을 실행하면 에러 발생
초기화 연산자는 세션에 변수형 텐서가 들어간 다음에 변수형 텐서의 초기값을 변수형 텐서의 값으로 할당하는 추가 작업을 수행

var.initial_value

<tf.tensor 'zeros_1:0' shape="(2," 3) dtype="float32">

각 변수에는 initializer라는 이름의 초기화 메서드가 있어 이를 세션에서 실행시키면 초기값이 변수로 할당됨

interactive_sess.run(var.initializer)
var.eval()

array([[0., 0., 0.],
       [0., 0., 0.]], dtype=float32)

그래프 내의 모든 변수의 초기화 연산을 한꺼번에 수행하려면 tf.global_variables_initializer() 함수를 사용
모든 변수를 생성하기 전에 tf.global_variable_initializer() 함수를 실행하면면 나중에 생성된 변수에 대해서는 초기화 연산이 이루지지 않아 에러가 발생

global_init = tf.global_variables_initializer()
interactive_sess.run(global_init)
print(var.eval())
var1 = var + 2
print(var1.eval())

[[0. 0. 0.]
 [0. 0. 0.]]
[[2. 2. 2.]
 [2. 2. 2.]]

name 속성과 이름 공간

모든 텐서는 op.name 속성에 이름(name) 문자열을 가지고 있음
텐서를 생성할 때 name 인수를 사용하면 각 텐서에 이름을 수동으로 할당할 수 있음

v1 = tf.Variable(2, name="v1")
v2 = tf.add(v1, 3, name="v2")
print(v1.op.name)
print(v2.op.name)

v1
v2

name 속성을 주지 않으면 자동 생성

v3 = tf.constant(1)
v4 = tf.Variable(1)
print(v3.op.name)
print(v4.op.name)

Const_3
Variable_1

노드 이름은 중복되지 않아야 함
이름 공간(name scope)를 사용해 중복 방지
tf.name_scope() 문맥 안에서 변수를 생성하면 이름 앞에 이름공간 문자열이 추가됨

with tf.name_scope("scope1"):
    v5 = tf.Variable(2, name="v5")
    v6 = tf.add(v5, 3, name="v6")
print(v5.op.name)
print(v6.op.name)

scope1/v5
scope1/v6

강의자료 분량이 많아 ‘[FC] Tensorflow 패키지 소개(2)’에서 이어가겠습니다.

[비숍] 5.0 뉴럴 네트워크

Posted on January 22, 2019

크리스토퍼 비숍의 ‘패턴 인식과 머신 러닝’을 학습하며 정리한 글입니다. 개인적으로 참고하기 위한 요약노트 성격이다보니 설명이 부실하더라도 양해 바랍니다.

5장. 뉴럴 네트워크

1. 피드 포워드 네트워크 함수

다층 퍼셉트론이라고도 알려져 있다. 사실은 연속적인 비선형성을 가진 로지스틱 회귀 모델 여러 층이 모인 것
SVM과 같은 일반화 성능을 가지고 있으면서도 결과 모델이 훨씬 더 작아서 계산이 빠르다
단점은 네트워크 훈련의 기반을 이루는 가능도 함수가 모델 매개변수에 대해 볼록 함수가 아니라는 것
그럼에도 실무에선 훈련 단계에서 더 많은 계산 자원을 동원해서라도 작은 모델을 구현하는게 유의미한 경우가 많다. 모델이 작으면 새로운 데이터에 대한 처리가 더 빨라지기 때문

2. 네트워크 훈련
3. 오차 역전파
4. 헤시안 행렬
5. 뉴럴 네트워크에서의 정규화
6. 혼합 밀도 네트워크
7. 베이지안 뉴럴 네트워크

[MySQL] 5.테이블 합치기

Posted on January 12, 2019

http://www.mysqltutorial.org 내용을 따라 익히며 정리한 글입니다.

5.1 MySQL alias

컬럼 alias와 테이블 alias를 두 가지가 있습니다. 먼저 컬럼 alias부터 살펴보겠습니다.

5.1.1 MySQL alias for columns

가끔 컬럼 이름들이 너무 테크니컬해서 이해하기 힘들 때가 있는데 이해하기 쉬운 별칭(alias)을 지정해줄 수 있습니다.
** AS 는 써도 되고 안 써도 됩니다.

예시1) 가명을 안 쓴 경우
예시2) 가명을 쓴 경우

부여한 alias를 이용해 오더바이나 그룹바이, 해빙 절을 쓸 수도 있습니다.

예시3) alias로 오더바이를 쓴 경우

5.1.2 MySQL alias for tables

위에서 컬럼에 했던 것처럼 테이블에도 다른 이름을 부여할 수 있습니다. 역시 AS는 optional입니다.
테이블 alias는 이너조인 레프트조인, 셀프조인을 쓴 구문에서 자주 쓰입니다. 서브쿼리에서도요.

customers과 orders 테이블에는 customerNumber 라는 컬럼이 공통적으로 들어가 있습니다.

1장 딥러닝이란 무엇인가?

인공지능과 머신 러닝, 딥러닝

인공지능

머신러닝

데이터에서 표현을 학습하기

딥러닝에서 ‘딥’이란?

그림 3개로 딥러닝의 작동 원리 이해하기

지금까지 딥러닝 성과

단기간의 과대 선전을 믿지 말자

AI에 대한 전망

딥러닝 이전: 머신 러닝의 간략한 역사

확률적 모델링

초창기 신경망

커널 방법

결정트리, 랜덤 포레스트, 그래디언트 부스팅

다시 신경망으로

딥러닝의 특징

머신러닝의 최근 동향

왜 딥러닝일까? 왜 지금?

새로운 투자의 바람

딥러닝의 대중화

지속될까?

변수 공간과 변수의 재사용

Tensor 연산

자동 형변환

미분

TensorFlow를 이용한 선형회귀

퍼셉트론

최적화

TensorBoard

텐서보드용 로그 생성

텐서보드 가동

TensorFlow 기본 사용법

그래프와 세션

그래프

세션

인터랙티브 세션과 eval() 메서드

텐서 자료형

텐서 자료형의 종류

상수형 텐서

플레이스홀더

변수형 텐서

초기화 연산자

name 속성과 이름 공간

5장. 뉴럴 네트워크

5.1 MySQL alias

5.1.1 MySQL alias for columns

5.1.2 MySQL alias for tables

5.2 MySQL join

Introduction to MySQL join statements

MySQL CROSS JOIN

MySQL INNER JOIN

MySQL LEFT JOIN

MySQL RIGHT JOIN

5.3 INNER JOIN

Introducing MySQL INNER JOIN clause

Avoid ambiguous column error in MySQL INNER JOIN

MySQL INNER JOIN examples

MySQL INNER JOIN with GROUP BY clause

MySQL INNER JOIN using operator other than equal

5.4 LEFT JOIN

Introduction to MySQL LEFT JOIN

MySQL LEFT JOIN examples

Using MySQL LEFT JOIN clause to find unmatched rows

Condition in WHERE clause vs. ON clause

5.5 RIGHT JOIN

Introduction to MySQL RIGHT JOIN clause

MySQL RIGHT JOIN example

5.6 CROSS JOIN

Introduction to MySQL CROSS JOIN clause

MySQL CROSS JOIN clause example

5.7 Self-join

MySQL self join examples

인터랙티브 세션과 `eval()` 메서드