본문 바로가기

CV1

[딥러닝] 광학 문자 인식(OCR) / API / OCR Pre-trained 모델 적용 01. OCR이란? OCR(광학 문자 인식)은 Optical Character Recognition의 약자로, 스캔한 종이 문서나 PDF 파일, 텍스트 이미지 등 다양한 종류의 문서를 편집/검색 가능한 데이터로 변환하는 데에 사용되는 기술이다. 딥러닝을 적용한 OCR은 글자의 영역을 탐지하는 모델(Text Detection Model)과 해당 영역에서 글자를 인식하는 모델(Text Recognition Model) 두 가지 단계로 구성되어 이다. OCR의 과정을 두 단계로 나누는 이유는 데이터를 다양하게 활용하여 원활한 학습이 가능하고, 자원의 효율성과 언어별 정확도 등을 향상시킬 수 있기 때문이다. 그럼 이제 본격적으로 OCR 사용방법에 대해 공부해보자. 02. API의 개념과 활용 OCR을 제대로 활.. 2024. 3. 15.

이전 1 다음

티스토리툴바