PDF-Viewer로 PDF 텍스트 추출하기(OCR 메뉴)

PDF-Viewer로 PDF 텍스트 추출하기(OCR 메뉴)

이번에는 PDF 파일을 수정 할 수 있는

PDF-Viewer 프로그램을 이용해서

PDF에 있는 텍스트를 추출해 보도록 하겠습니다.

물론 전에 PDF-Viewer 포스팅에서 소개한 Smallpdf 홈페이지에서 PDF를 다른 파일로 변경하는 방법도 있습니다만,

이번에는 PDF-Viewer내에서 한 번 텍스트 파일을 추출해 보겠습니다.

간단하게 따라해 볼까요?

우선 PDF-Viewer의 메뉴 칸에 있는 OCR 을 클릭합니다.

이런 팝업창이 뜰텐데요, 원래 PDF-Viewer에서 디폴트로 인식하는 값이 영어, 스페인어 밖에 없습니다.

한국어 혹은 일본어를 PDF-Viewer가 인식하게 해주기 위해서는 다른 언어 팩을 깔아줘야하는데요,

위의 '다른 언어..' 링크를 클릭합니다.

그리고 아래쪽에 있는 Korean 언어팩을 다운 받아서 설치한 후에,

다시 OCR로 돌아오면 Korean을 선택 할 수 있게 됩니다!

각 파일에 따라 다르겠지만, 페이지를 래스터화 - 인식하는데 까지 시간이 좀 걸릴수도 있습니다.

인식이 다 끝난 PDF 파일은 메뉴의 선택 도구를 클릭하고 텍스트를 드래그 하면

이렇게 선택이 되는 것을 확인 할 수 있습니다!

하지만, 가끔 정말 작은 단어나 흐릿한 PDF 파일은 인식이 힘들 때도 있나봅니다.

부디 유용하게 쓰시길 바라며 포스팅 마칩니다.

Monochrome :)