본문 바로가기

딥러닝4

[딥러닝] RNN 알아보기 ## 참고 사이트- https://ratsgo.github.io/natural%20language%20processing/2017/03/09/rnnlstm/- https://warm-uk.tistory.com/54## 시퀀스(sequence)?- 말 그대로 순서가 있는 data  Text는 '문맥'이라는 순서가 있고, 시계열 데이터에는 '시간'이라는 순서가 있듯이, 영상이나 음성 등도 전부 순서와 함께 흘러가는 시퀀스 데이터이다.- 이러한 시퀀스 데이터를 다루는 모델을 시퀀스 모델(Sequence model)이라고 한다.  순서가 있는 Sequence data에서 특징들을 추출하여 여러가지 문제를 해결하고 예측하며, 대표적으로 RNN, GRU, LSTM등이 있다.​- 그럼 일반적인 데이터와는 뭐가 다를까.. 2024. 5. 6.
[딥러닝] 광학 문자 인식(OCR) / API / OCR Pre-trained 모델 적용 01. OCR이란? OCR(광학 문자 인식)은 Optical Character Recognition의 약자로, 스캔한 종이 문서나 PDF 파일, 텍스트 이미지 등 다양한 종류의 문서를 편집/검색 가능한 데이터로 변환하는 데에 사용되는 기술이다. 딥러닝을 적용한 OCR은 글자의 영역을 탐지하는 모델(Text Detection Model)과 해당 영역에서 글자를 인식하는 모델(Text Recognition Model) 두 가지 단계로 구성되어 이다. OCR의 과정을 두 단계로 나누는 이유는 데이터를 다양하게 활용하여 원활한 학습이 가능하고, 자원의 효율성과 언어별 정확도 등을 향상시킬 수 있기 때문이다. 그럼 이제 본격적으로 OCR 사용방법에 대해 공부해보자. 02. API의 개념과 활용 OCR을 제대로 활.. 2024. 3. 15.
[딥러닝] 퍼셉트론(perceptron) / MLP(Multi Layer Perceptron) / 경사하강법 01. 퍼셉트론 퍼셉트론(Perceptron)은 뉴런이 정보를 받아서 문제를 처리하는 원리를 따라한 인공 신경망의 한 종류로, 이진 분류 문제를 해결하는 데에 사용되며 프랑크 로젠블라트(Frank Rosenblatt)에 의해 1957년에 개발되었다. 이는 생물학적 신경계의 기본단위인 뉴런의 구조에서 본따온 구조를 지니고 있으며 인접해있는 다른 뉴련과 다양한 신호를 주고 받으며 정보를 주고받는다. ▶ 양쪽의 구조가 비슷함을 확인할 수 있다. 퍼셉트론은 입력값을 받아서 가중치와의 곱을 계산하고, 이를 활성화 함수를 통해 처리하여 출력값을 생성한다. 이러한 퍼셉트론은 간단한 선형 분류 모형의 형태를 띄고 있기에 단일로는 잘 사용하지 않지만, 딥러닝의 강력한 모델들이 퍼셉트론의 변형된 형태를 사용하기에 그 개념.. 2024. 2. 29.
[딥러닝] CNN(Convolutional Neural Network) 기본 구조 CNN이란? CNN은 Convolutional Neural Network의 약자로, 주로 이미지 처리와 관련된 작업에서 사용되는 딥러닝 신경망 구조이다. CNN은 주로 이미지 분류, 객체 감지, segmentation과 같은 컴퓨터 비전(Computer Vision, CV) 작업에 특화되어 있다. 그렇다면 왜 CNN이 이미지 처리 및 패턴인식에 적합한 딥러닝 모델로 사용될까? 이에 대한 답을 찾기 위해서는 DNN(Deep Neural Network)에 대한 이해가 필요하다. DNN은 주로 1차원 형태의 데이터를 사용하는데, 그림이나 이미지와 같은 2차원 형태의 데이터를 사용하려면 1차원의 형태로 flatten 해야한다. 여기서 발생하는 이미지의 공간적/지역적 정보의 손실 문제를 보완하기 위해 등장한 것이.. 2024. 1. 29.