필기체 OCR을 위한 일반적인 프로세스는 다음과 같다.

 

1. 배경 제거 :

  1) 종이 : (민원)신청서, 서식에서 나타날 수 있는 다양한 배경
  2) 스마트기기 : 태블릿, 스마트폰의 배경
  3) 강의 칠판 배경
  4) 유리 판서 배경
  5) 화이트보드 배경
  6) 반복적으로 나타나는 동일형태의 데이터나 이미지
  7) 기타 노이즈나 불필요한 배경  

2. 단어 검출
  1) 띄어쓰기 고려
  2) bounding box 자동 감지 
  3) 이모티콘 인식
  4) 신조어 인식
  5) 한국어, 외국어, 한문 손글씨 인식

3. 정규화
  1) bounding box 높이 고정
  2) grayscale로 변경

  3) 경사도 수정

4. 단어 인식

  1) 다양한 AI 알고리즘 적용

 

인공지능 음성, 언어, 영상 분석/처리 전문기업  bory.io

제휴 협력은 언제나 bory@bory.io로 연락주세요.

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기