PDF-Viewer로 PDF 텍스트 추출하기(OCR 메뉴)
이번에는 PDF 파일을 수정 할 수 있는
PDF-Viewer 프로그램을 이용해서
PDF에 있는 텍스트를 추출해 보도록 하겠습니다.
물론 전에 PDF-Viewer 포스팅에서 소개한 Smallpdf 홈페이지에서 PDF를 다른 파일로 변경하는 방법도 있습니다만,
이번에는 PDF-Viewer내에서 한 번 텍스트 파일을 추출해 보겠습니다.
간단하게 따라해 볼까요?
우선 PDF-Viewer의 메뉴 칸에 있는 OCR 을 클릭합니다.
이런 팝업창이 뜰텐데요, 원래 PDF-Viewer에서 디폴트로 인식하는 값이 영어, 스페인어 밖에 없습니다.
한국어 혹은 일본어를 PDF-Viewer가 인식하게 해주기 위해서는 다른 언어 팩을 깔아줘야하는데요,
위의 '다른 언어..' 링크를 클릭합니다.
http://www.tracker-software.com/pdf-xchange-viewer-ocr
그리고 아래쪽에 있는 Korean 언어팩을 다운 받아서 설치한 후에,
다시 OCR로 돌아오면 Korean을 선택 할 수 있게 됩니다!
각 파일에 따라 다르겠지만, 페이지를 래스터화 - 인식하는데 까지 시간이 좀 걸릴수도 있습니다.
인식이 다 끝난 PDF 파일은 메뉴의 선택 도구를 클릭하고 텍스트를 드래그 하면
이렇게 선택이 되는 것을 확인 할 수 있습니다!
하지만, 가끔 정말 작은 단어나 흐릿한 PDF 파일은 인식이 힘들 때도 있나봅니다.
부디 유용하게 쓰시길 바라며 포스팅 마칩니다.
-
'잡다한 일상 > 짧은 이야기' 카테고리의 다른 글
건담, 가샤폰 피닉스 제로원을 조립해 보았다. (0) | 2017.11.11 |
---|---|
대구 동성로, 힐링카페 미스터힐링에서 안마를 받다! (0) | 2017.10.23 |
파일/폴더의 이름 한꺼번에 바꾸기 DarkNamer (0) | 2017.10.17 |
다이소, 고양이가 좋아하는 캣그라스 씨앗을 샀다!(캣닢) (0) | 2017.08.01 |
히어로 사업, 마케팅marketing 용어 정리 (0) | 2017.07.31 |
댓글