'확장 프로그램'에 해당되는 글 1건

  1. 이미지 위의 글자를 읽어낼 수 있다면? 나프타 프로젝트

주위에서도 그렇지만 종이로 된 문서를 파일로 만들기 위해 부단히 노력하던 사람들이 있었습니다. 그나마 OCR(Optical Character Recognition) 기술로 문서들을 스캔하고 어느정도까지는 텍스트로 변환하는 작업을 진행하기도 했지만, 스캔하고 문자화하는 과정이 손쉽지 않고 정확도에서도 아쉬움이 많이 남았습니다. 그리고 제대로 활용하기 위해서는 전용 프로그램의 가격도 적지 않은 편이었고 말이지요. 하지만, 구글 크롬을 사용한다면 앞으로 어느정도까지는 이 작업을 수월하게 진행할 수 있을 것으로 보입니다.




구글이 만든 웹브라우저인 크롬의 확장 프로그램으로 프로젝트 나프타가 이러한 OCR 기능을 무료로 제공하고 있기 때문입니다. 크롬을 사용하신다면 <프로젝트 나프타 다운로드>에서 손쉽게 다운로드 받아 설치하시면 됩니다. 크롬용 확장프로그램이기 때문에 크롬을 사용하지 않는 분들은 크롬을 설치후 프로젝트 나프타를 설치해주시면 됩니다. 나프타를 설치하고 나서도 별다른 작동 아이콘이나 활성화된 표시가 없어서 조금은 당황하실 수도 있을 듯한데, 나프타는 설치되는 순간부터 크롬상에서 보여지는 이미지들의 텍스트를 별도로 읽어들이기 시작합니다.



위의 스크린샷을 보면 알겠지만, 뉴스 피드를 보다가 이미지 위의 글들을 영역으로 선택한 것을 확인할 수 있습니다. 처음에는 그림 위의 영역을 선택하기가 쉽지는 않겠지만, 이미지 전체를 선택해서 푸르게 만들고 디테일하게 찾아가는 방식을 사용한다면 조금은 쉽게 사용이 가능할 듯 하군요.




위의 이미지는 웹사이트가 아니라 일반 이미지 파일(스크린샷)을 크롬에 끌어다놓고 펼쳐놓은 상태에서 나프타 프로젝트로 텍스트를 구분해서 선택하는 모습입니다. 스캔된 이미지들이나 다운을 받아둔 이미지들에서도 사용이 가능한 것을 확인할 수 있습니다. 다만, 한글에 대해서는 아직까지 인식률이 많이 낮은 모습을 보여주고 있습니다. 영어나 다른 몇몇 언어들에 대해서는 꽤나 인식률이 좋았습니다.





다만, 이렇게 이미지를 크롬에 불러들여 나프타를 사용하기 위해서는 크롬의 설정에서 도구 확장프로그램을 선택하고 프로젝트 나프타의 '파일 URL에 대한 억세스 허용 옵션을 체크해둬야 합니다. 잠시 테스트를 하면 나프타를 써보니 텍스트로만 된 영어에서는 꽤나 유용한 활용을 보여주었습니다. 다만, 특수문자나 한국어와 같은 언어에서는 아직까지 개선이 필요한 듯 보였습니다. 그래도 앞으로의 발전이 기대되는 OCR 확장 프로그램이고 지금의 상태로도 논문등을 위해 유용한 사람들이 있으리라 생각되는군요.