우체국과 사람들

과학/경제/시사

4차 산업 고도화의
‘촉매’가 되는 OCR

광학적 문자 판독(장치)

4차 산업혁명을 주도하는 기술로 ‘광학적 문자 판독(장치)’을 의미하는 OCR(Optical Character Reader)이 부상하고 있다. 과거에는 종이 서류들을 전자화하기 위해 해당 문서나 서류의 데이터를 일일이 수작업으로 컴퓨터에 입력해야 하는 번거로움이 있었다. 그러나 광학문자인식 기술을 바탕으로 문서나 서류를 스캔하여 데이터만 추출해내는 OCR을 통해 이제 종이 형태의 문서들을 전자화하는 데 수작업은 필요 없게 되었다. 오늘날 금융, 물류, 조선, 유통 등 다양한 분야의 기존 사업과 OCR이 결합되어 4차 산업혁명의 촉매로 떠오른 이유는 무엇일까?

글. 길재식(전자신문 금융산업전문기자)

4차 산업 고도화의 ‘촉매’가 되는 OCR
2018.08

프린트버튼

OCR의 역사

서류 보관에 대한 중요성이 커짐에 따라 기존에 종이 형태로 관리하던 것들을 편리하게 하기 위해 문서 전자화 시스템을 도입하고 있는 기업과 기관이 증가하고 있다. 이러한 가운데 수작업 위주의 입력 저장 방식을 혁신하기 위한 기술로 OCR이 부상하였다. 근간은 광학문자 인식 기술이다. 스캐너를 통해 입력된 문서 영상에서 문자에 해당하는 부분의 내용을 인식하는 기술을 말한다. OCR 기술의 실용화 연구는 1920년대 후반부터 시작되었고, 1928년 오스트리아의 구스타프 타우셰크(Gustav Tauschek) 박사가 문자 인식 방법을 특허로 등록하면서 역사적인 진일보를 내디뎠다. 이후 많은 연구를 통해 다양한 OCR 제품이 개발되었고 물류와 금융 산업을 필두로 여러 분야에서 상용화되었다.

숫자와 영자 등의 글자 인식률을 높이기 위한 연구가 수십 년간 전 세계적으로 수행되었다. 그 결과 우편번호 추출을 통한 우편물 관리, 자동차 번호판 인식, 모바일 기기를 사용한 명함 인식 등 다양한 산업분야에서 OCR 적용범위가 확대되었고, 특히 금융 분야에서는 전표나 수표를 자동입력할 때 실용화된 OCR 기술이 적용되어 정확도가 높아졌다. 미국, 러시아, 중국이 기술의 핵심 특허를 다수 보유하고 있는 전통적인 ‘OCR 강국’인데 냉전시대 첩보전을 펼칠 때부터 이 기술을 활용했기 때문이다.

일반적인 OCR 제품은 문서 전체를 읽어서 문자를 인식하는 방식으로 기술이 구현되는데, 이 중 불필요한 부분까지 인식되는 경우가 있어 이럴 땐 수작업으로 분류해야 하는 불편함이 여전히 존재하였다. 그러나 최근 IT 기술이 발달하면서 OCR도 진화하고 있다. 특히 스마트폰 보급의 확산으로 카메라 촬영 기법이 고도화되면서 OCR의 정확성과 범용성이 더욱 확대되었다. 그 결과, OCR의 산업적 효용가치는 가히 폭발적인 상황. 손으로 쓴 문자, 마크 등에 빛을 비춰 그 반사 광선을 전기신호로 바꾸어 컴퓨터에 입력하는 장치로까지 활용된다. 수많은 산업 분야에서 효율적인 데이터 관리를 하기에 적합한 것이다.

OCR 기술의 범용성

OCR의 방식과 진화

OCR의 근간기술인 문자 인식 방법은 문자패턴의 표현 방법과 분류 방법에 의해 원형정합(template matching) 방법, 통계적(statistical) 방법, 구조 분석적(structural analysis) 방법 등으로 나누어진다.

원형정합 방법은 문자 패턴을 배열 형태로 분류해 원형 패턴과 비교해 가장 유사한 형태를 찾아내는 방법이다. 이 방법은 초기에는 많이 사용됐지만 주로 하나의 고정된 형식의 문자에 대해서만 사용 가능하다는 문제점으로 인해 현재는 사용을 거의 하지 않는다. 통계적 문자 인식 방법은 인식대상에서 특징벡터를 추출해 문자 인식을 하는 방법을 뜻한다. 학습단계를 통해 특징벡터의 통계적인 확률분포 특징을 구하고 이를 활용해 특징벡터 공간을 각 분류별로 분리시킨다. 다음으로 구조 분석적 문자 인식 방법은 문자의 구성 원리에 입각해 자획 등과 같은 문자를 구성하는 기본요소와 그들의 연관성을 추출, 문자를 인식하는 것이다. 이 방법은 이론적인 정립이 잘 되어 있고 방법이 단순한 장점을 가지고 있으나 특징 문자에 대한 규칙이 활자체에 따라 매우 다양해지므로 인식 시간이 오래 걸린다는 단점이 있다.최근에는 문자 패턴을 인식하기 위해 인공지능시스템 중 하나인 인공신경망 모델(Neural Networks Model)을 이용한 연구가 각광 받고 있다. 인공 신경망 모델은 인간의 뇌구조를 모형화해 뇌를 구성하는 기본 단위인 뉴런으로 단순한 계산소자의 연결을 통해 좋은 성능을 나타낸다는 것을 기본 가정으로 하고 있다. 따라서 인공 신경망 모델은 음성, 문자, 이미지 분석 등 계산량이 많고 병렬성을 요구하는 문제에 적합한 모델이다. 최근 가장 많이 활용되는 OCR 기술이기도 하다.

우정사업본부,

OCR 기술 접목 시너지 기대

4차 산업혁명 바람이 불면서 OCR을 금융서비스에 융합하는 프로젝트가 시작됐다. 우정사업본부는 지난 4월 해커톤 대회를 열어 OCR 기술에 대한 가능성을 세상에 알렸다. ‘페이콕’팀이 ‘카드리더 OCR 기술을 활용한 셀프 간편 결제 시스템’을 우체국 간편송금 서비스인 포스트 페이에 접목하는 아이디어를 냈다. 향후 우정사업본부는 우정 정보시스템 테스트환경 제공, 액셀러레이팅 등을 통해 사업화를 지원하고 우체국금융에 접목할 예정이다. OCR과 포스트페이를 연결해 송금과 물류 등 다양한 분야에 시너지가 예상된다.

페이콕이 내세운 OCR 연계 결제 서비스는 독특하다. 크게 범용성과 확장성, 정확성 모두를 갖췄다는 평가다. 우선 범용성이다. 스마트폰은 어떠한 모델, 제조사, OS를 사용하더라도 공통적으로 카메라를 장착한다. OCR의 본 기능인 판독기술을 극대화하고 누구나 활용할 수 있다. 다음은 확장성이다. 세계적으로 어느 나라에서든 실물카드를 사용하는데, 문자정보는 반드시 포함된다. 정보 패턴도 표준에 충실한 경우가 많아서 별도 하드웨어단말기 지원 없이도 결제인프라를 확산시킬 수 있다. 마지막으로 정확성까지 놓치지 않고 있다. 페이콕이 포스트페이에 적용한 기술은 동적인식 기술이다. 보편화한 OCR정보 처리방식이 아니다. 왜곡된 정보를 걸러내고 정확한 정보만을 사용할 수 있는 ‘통합 인식 기술’이다. 국내에서 이 기술을 상용화한 곳은 페이콕과 삼성페이뿐이다.

페이콕은 현재까지 확보한 카드정보인식 기술에 만족하지 않고, 신분증 인식 기술이나 결제서비스 확장에 필요한 다양한 OCR 기술개발에도 관심과 노력을 기울이고 있다. 우정사업본부의 금융뿐만 아니라 물류, 우편사업 등 여러 분야에서 OCR을 확대 적용할 수 있다.

OCR 기술 융합 시 결제 산업 시너지 효과

OCR, 물류-항만 인프라 접목,

API로 공동진영 꾸려야

전 세계 항만은 급변하는 항만환경 속에서 메가 허브 항만 위치를 확보하기 위해 경쟁한다. 효율성과 생산성 향상이 선결과제다. 한국 항만 역시 이런 경쟁에 뒤쳐지지 않기 위해 추가적인 항만 건설을 하고 있으며, 첨단 기술을 적용한 컨테이너터미널 운영시스템, 하역 장비, 게이트 시스템 등을 개발하고 있다. 이 과정에도 OCR 기술은 탁월한 빛을 발한다. 컨테이너에 기재된 일련번호를 OCR로 읽어내는 이른바 ‘스마트선박’시대가 열린 것이다.

현재 컨테이너터미널 게이트에서 주로 사용 중인 바코드 기반 자동화 게이트시스템은 차량 및 컨테이너의 정보를 자동으로 인식하거나 보안 기능에 대해서 완벽히 구현하기는 어렵다. 이러한 문제점을 개선하기 위해 RFID 기반 자동화 게이트시스템 또는 OCR 기반 자동화 게이트시스템을 통해 게이트 업무 생산성을 향상시키는 사업을 펼치고 있다. 다만 OCR 인식률 개선이 숙제로 남아있다. 일각에서는 RFID와 OCR 기술을 통합해 항만 등 여러 인프라에 접목해야 한다는 목소리가 높다. 우정사업본부의 OCR 접목 사업을 활용하자는 의견도 있다. 우정사업본부가 보유한 다양한 금융서비스와 전국 인프라에 OCR 기술을 접목하고, 개선 효과를 타 산업으로 전이하자는 것이다. 아울러 국내 IT기업들이 보유한 OCR 기술을 API형태로 공개하고, 이를 전 산업군으로 확장하는 규제 완화가 필요하다는 목소리도 나온다.