독서 리마인더/핸즈온 머신러닝 35

18장 강화 학습

https://github.com/kimhwijin/HandsOnMachineLearing/blob/main/Reinforcement_Learning_18.ipynb GitHub - kimhwijin/HandsOnMachineLearing Contribute to kimhwijin/HandsOnMachineLearing development by creating an account on GitHub. github.com 강화학습 강화학습 reinforcement learning(RL) 이 무엇인지와 어떤일을 잘하는지 알아보고, 심층 강화학습에서 가장 중요한 정책 그레디언트 policy gradient 와 심층 Q-네트워크 deep Q-network (DQN) 을 마르코프 결정 과정Markov decisi..

17장 연습문제

1. 오토인코더를 활용할 수 있는 주요 작업은 무엇인가요? 주요 특성 추출 비지도 사전 훈련 차원 축소 생성 모델 2. 레이블되지 않은 훈련 데이터는 많지만, 레이블된 데이터는 수천 개 정도만 가지고 있을 때 분류기를 훈련하려합니다. 오토인코더가 어떻게 도움이 될 수 있을까요? 어떻게 작업하면 될까요? 데이터셋 ( 레이블된것 + 안된것 ) 전부 사용해서 오토인코더를 훈련시키고, 인코더부분을 분류기에 재사용한다. 레이블된 적은 데이터를 통해 분류기를 훈련시킨다. 이때 레이블 데이터가 너무적다면 재사용층을 동결시킨다. 3. 오토인코더가 완벽하게 입력을 재구성했다면, 이것이 반드시 좋은 오토인코더인가요? 오토인코더의 성능을 어떻게 평가할 수 있나요? 입력을 완벽히 재구성하면, 입력을 외워서 복사하지는 않는지 ..

17장

오토 인코더와 GAN을 사용한 표현 학습과 생성적 학습 오토인코더 autoencoder 는 레이블없는 데이터를 이용해서 잠재표현latent representation 또는 코딩coding( 일반적인 부호화 ) 로 입력데이터의 밀집 표현을 훈련하는 인공 신경망이다. 일반적으로 밀집표현은 입력 차원보다 낮아 차원 축소 및 시각화에 유용하고, 입력을 표현하는 강력한 특성을 추출기로 사용되어 심층신경망의 사전 훈련에 사용되기도 한다. 이렇게 추출한 낮은 차원의 특성들로 다시 훈련데이터와 비슷한 새로운 데이터를 만드는 생성 모델generative model 에 사용되기도 한다. 이와 비슷하게 GAN generative adversarial networks 는 생성모델과 판별모델을 사용해서 더 정교한 새로운 데이터..

16장 연습문제

1. 상태가 없는 RNN 대비 상태가 있는 RNN의 장단점은 무엇인가요? 상태가 없는 RNN은 훈련한 윈도우 크기보다 같거나 작은 길이의 패턴만 감지할 수 있다. 반면 상태가 있는 RNN은 장기 패턴을 파악할 수 있지만, 구현하는것이 훨씬 어렵고, 연속적인 데이터셋을 준비해야해서 독립 동일 분포가 아니기 때문에 잘맞지 않은 경우도 있다. 2. 왜 자동 번역에 시퀀스-투-시퀀스 RNN 대신 인코더-디코더 RNN을 사용하나요? 문장을 번역할때 한단어씩 번역하면, 문장의 문맥이나 문장에서의 의미를 전혀파악하지 못하기 때문에 결과가 매우 좋지 않다. 그래서 시퀀스-투-시퀀스보다, 문장 전체를 읽는 인코더, 번역을 하는 디코더의 형식을 취한다. 3. 가변 길이 입력 시퀀스를 어떻게 다룰 수 있나요? 가변 길이 출..

16장

RNN과 어텐션을 사용한 자연어 처리 자연어 문제에서는 순환 신경망을 가장 많이 사용한다. 문장의 다음 글자를 예측하는 문자 단위 RNN character RNN 부터 시작한다. 상태가 없는 RNN stateless RNN, 상태가 있는 RNN stateful RNN 을 구축하고, 감정 분석등을 수행하는 RNN 을 구축한다. 다음엔 문자의 시퀀스가 아니라, 단어의 시퀀스로 문장을 다뤄 신경망 기계 번역 neural machine translation NMT 을 수행하기 위해 인코더-디코더 구조의 RNN 을 살펴본다. 각 타임스텝에서 집중해아 할 입력 부분을 선택하는 신경망 구성 요소 어텐션 메커니즘 attention mechanism 을 알아보고, 이를 통해 RNN 기반의 인코더-디코더 구조의 성능을 높..

15장 연습문제

1. 시퀀스 투 시퀀스 RNN, 시퀀스 투 벡터 RNN, 벡터 투 시퀀스 RNN을 사용한 의 어플리케이션 종류 시퀀스 투 시퀀스 : 시계열 관련 문제 , 기계 번역 ( 인코더-디코더 구조 사용 ), 비디오 캡션 생성, 시피치 투 텍스트, 음악 생성, 노래의 화음 식별 시퀀스 투 벡터 : 음악 샘플을 장르로 구분, 책 후기에 대한 감정 분석, 사용자의 영화기록을 바탕으로 새로운 영화 추천 ( 협업 필터링 애플리 케이션 ) 벡터 투 시퀀스 : 이미지 캡션 생성, 아티스트 기반 플레이리스트 생성, 파라미터 기반으로 멜로디 생성, 사진 속에서 보행자 위치 찾기 2. RNN 층의 입력은 얼마나 많은 차원을 가지나요? 각 차원이 표현하는 것은 무엇인가요? 출력은 무엇인가요? RNN층의 입력차원은 3차원으로 배치 차..

15장

RNN과 CNN을 사용해 시퀀스 처리하기 과거를 학습해 미래를 예측하는 네트워크인 순환 신경망recurrent neural network 를 알아본다. 시계열time seies 데이터를 분석해 주식가격을 분석하거나, 자율주행 시스템에서 차의 이동경로를 예측하는등, 고정 길이 입력이 아닌 임의 길이를 가지는 시퀀스sequence 데이터를 다룰 수 있다. 문장, 문서, 오디오 샘플을 입력받아, 자동번역, 스피치 투 텍스트speech to text 같은 자연어 처리netural language processing(NLP)에 유용하게 사용된다. RNN 네트워크의 난제 - 불안정한 그레디언트 ( 11장에서 활성화 함수나 초기화로 해결했었던 )는 순환 드롭아웃과 순환 층 정규화를 포함한 여러가지 기법으로 안정적이게..

14장 연습문제

1. 이미지 분류에서 완전연결 DNN보다 CNN이 나은점? DNN보다 훨씬 적은 파라미터수를 가져 훈련속도가 빠르고 과대적합의 위험을 줄여주고, 적은 훈련 데이터를 필요로함 CNN이 특성을 감지하도록 학습되면, 그 필터는 어느 위치에 있는 특성도 감지할 수 있다. 이미지는 보통 반복적이고 비슷한 특성을 가지기 때문에, 더 나은 일반화 성능을 낼 수 있다. DNN은 픽셀을 1차원으로 늘이기 때문에 이미지의 구조 정보를 알지 못한다. CNN은 저수준 특성을 찾고 저수준 특성으로 고수준 특성으로 연결할 수 있다. 2. 3x3 커널, 스트라이드 2, "same" 패딩 합성곱 3층의 CNN에 filters = 100, 200, 400 이고, 입력 이미지는 200x300x3 일때 CNN의 전체 파라미터수와 32비트..

14장

합성곱 신경망을 사용한 컴퓨터 비전 합성곱 신경망convolutional neural network (CNN) 은 대뇌의 시각피질 연구에서부터 시작되었고, 이미지 인식분야에 사용되고, 현재 이미지 검색 서비스, 자율주행 자동차, 영상 자동 분류 시스템 과같은 시각 분야말고, 음성 인식voice recognition, 자연어 처리natural language processing 에도 많이 사용된다. 여기에서 CNN의 기원, 구성요소, 구현, 뛰어난 성능의 CNN 구조, 객체 탐지object detection, 시맨틱 분할semactic segmentation 등등에 대해 설명한다. 14.1 시각 피질 구조 1950년대 즈음에 원숭이를 대상으로 시각피질안의 많은 뉴런이 작은 국부 수용장local recept..

13장 연습문제

1. 데이터 API 를 사용해야 하는 이유? 대용량 복잡한 데이터 처리 엔지니어링을 간단하게 적용할 수 있다. 2. 대용량 데이터셋을 여러 파일로 나누면 어떤 장점이 있나요? 대용량 데이터셋을 섞을때, 모든 데이터를 메모리에 넣고 섞을수 없기때문에 먼저 크게크게 섞을 수 있는 장점이 있다. 또한 네트워크를 이용한 훈련에서 파일을 여러개로 나누면 데이터를 받으면서 훈련할 수 있다. 3. 훈련과정에서 입력 파이프라인의 병목을 어떻게 찾나요? 이를 어떻게 해결하나요? 텐서보드를 사용해 프로파일링 데이터를 시각화해서 병목을 확인한다. GPU가 완전히 활용되지 않으면 프리패치를 적용해서 해결하고, 전처리 코드를 최적화하거나, 많은 CPU, RAM와 넓은 GPU 밴드위스를 확인한다. 4. 어떤 이진 데이터도 TFR..