Paper

DEER: Detection-agnostic End-to-End Recognizer for Scene Text Spotting

Seminar

검출과 인식 모델을 하나로? : challenge 우승 OCR 서비스 모델 새 출시!

Why DEER

Introduction

Motivation

  1. 기존 방식의 한계:

    1. 전통적인 텍스트 인식 시스템은 텍스트 탐지(detector)와 인식(recognizer)이 밀접하게 연결되어 있으며, 탐지 결과의 정확성이 인식 성능에 크게 영향을 미침.
    2. 탐지 오류가 발생하면 인식 과정에서도 오류가 발생할 확률이 높아집니다. 특히, 잘못 탐지된 텍스트 영역은 인식기가 정확한 문자 시퀀스를 복원하는 데 어려움을 겪게 합니다.

    Untitled

  2. 정교한 탐지 알고리즘의 필요성: 대부분의 텍스트 스팟팅 시스템은 정교한 탐지 알고리즘에 의존하며, 이는 고비용의 계산을 필요로 함. 또한, 텍스트의 형태가 다양하고 동적인 실세계 환경에서는 이러한 방식이 여전히 제한적일 수 있음.

    Untitled

  3. Detection과 Recognition의 강한 의존성: 탐지 결과에 기반한 기존 인식 방식은 텍스트의 위치나 형태가 명확하지 않은 경우 인식 성능이 크게 저하될 수 있음.

Contribution