본문 바로가기
잡다한 일상/짧은 이야기

PDF-Viewer로 PDF 텍스트 추출하기(OCR 메뉴)

by KaNonx카논 2017. 10. 18.
반응형

 

PDF-Viewer로 PDF 텍스트 추출하기(OCR 메뉴)


이번에는 PDF 파일을 수정 할 수 있는


PDF-Viewer 프로그램을 이용해서

 

PDF에 있는 텍스트를 추출해 보도록 하겠습니다.

 

 

물론 전에 PDF-Viewer 포스팅에서 소개한 Smallpdf 홈페이지에서 PDF를 다른 파일로 변경하는 방법도 있습니다만,

 

이번에는 PDF-Viewer내에서 한 번 텍스트 파일을 추출해 보겠습니다.

 


간단하게 따라해 볼까요?

 

 

 

우선 PDF-Viewer의 메뉴 칸에 있는 OCR 을 클릭합니다.

 

 


이런 팝업창이 뜰텐데요, 원래 PDF-Viewer에서 디폴트로 인식하는 값이 영어, 스페인어 밖에 없습니다.

 

한국어 혹은 일본어를 PDF-Viewer가 인식하게 해주기 위해서는 다른 언어 팩을 깔아줘야하는데요,

 


위의 '다른 언어..' 링크를 클릭합니다.

 

 


http://www.tracker-software.com/pdf-xchange-viewer-ocr


그리고 아래쪽에 있는 Korean 언어팩을 다운 받아서 설치한 후에,


다시 OCR로 돌아오면 Korean을 선택 할 수 있게 됩니다!

 

 

 

각 파일에 따라 다르겠지만, 페이지를 래스터화 - 인식하는데 까지 시간이 좀 걸릴수도 있습니다.

 

 


인식이 다 끝난 PDF 파일은 메뉴의 선택 도구를 클릭하고 텍스트를 드래그 하면

 

 

 


이렇게 선택이 되는 것을 확인 할 수 있습니다!


하지만, 가끔 정말 작은 단어나 흐릿한 PDF 파일은 인식이 힘들 때도 있나봅니다.

 

부디 유용하게 쓰시길 바라며 포스팅 마칩니다.

 

 

-

 

반응형

댓글