[리눅스] OCR 문자 인식 소프트웨어

2023. 12. 5. 21:34리눅스 실제 사용 팁

네이버 지식iN 에 올라온 문제를 풀려다가 코드 사진을 발견했다. 스마트폰에는 이미지 뷰어 차원에서 문자인식 기능이 지원되는데 솔직히 이렇게 뽑아낸 텍스트를 폰에서 termux 터미널을 실행해서 vi 열고 컴파일 후 그 결과를 다시 지식iN 앱으로 휴.. 귀찮다. 그래서 혹시나 하는 생각에 리눅스에는 사진에서 텍스트를 뽑아내는 기능이 있지 않을까 하는 생각에 검색해보았다. 있었다.
 
tesseract-ocr 패키지를 설치하면 된다. 어쩌면 안드로이드에 오픈소스 라이브러리를 활용하는 앱들이 흔히 발견되는데, 이 라이브러리가 사용되었을지도 ... ㅎㅎㅎ

데비안에서는 tesseract-ocr 메인 패키지 외에 각국의 언어별로 패키지가 나누어져 있다.
tesseract-ocr 을 선택하면 기본적으로 tesseract-ocr-osd 와 tesseract-ocr-eng 가 함께 선택된다. 나머지 언어는 직접 선택해야 한다. 한국어 자모를 인식하기 위해서 hunspell-ko 도 함께 설치해야 한다.

 

핵심 패키지는 텍스트를 인식하는 tesseract-ocr 이지만, GUI 로 접근하는 방법도 있다. gimagereader 패키지를 설치하면 아래와 같은 애플리케이션을 실행할 수 있다. 얼떨결에 qimagereader-qt5 (QT 버전)을 설치했지만 기본 패키지가 GTK+ 기반으로 먼저 만들어졌나 보다.

hunspell-ko [한국어 자모 검사 라이브러리] 를 설치하지 않으면 이런 오류 메시지를 띄운다. 우분투와 달리 데비안에서는 이렇게 세세한 부분까지 신경쓰지 못한다. Install 을 누른다고 프로그램이 설치되지 않는다.

 
 

깔끔하다.
한 가지 아쉬운 점은 언어를 자동감지하지 못하는 것이다. 맞지 않은 언어를 선택하면 이렇게 숫자코드로 나온다.