[Python][Project] 영상에서 문자 추출하기 – pytesseract 문자 한글 인식 ocr UB-Mannheim 최신 언어 팩 다운로드 with open asf 영어

저번에 에뮬레이터 말고 핸드폰을 직접 컨트롤하는 방법을 알아봤어요.https://blog.naver.com/dorergiverny/223184598006

[Python][Project]실제 안드로이드 스마트 폰 제어-개발자 모드 활성화 옵션 unauthorized해결 ADB_VENDOR_KEYS swipetapclick이전 ADB를 이용하고 안드로이드 에뮬레이터를 이용한 스마트 폰 제어 시뮬레이션을 했어요….blog.naver.com

이번 시간에는 영상에서 글자를 추출하는 방법에 대해서 알아보겠습니다.(1)pytesseract 라이브러리 설치 이미지에서 문자 추출 시 사용하는 라이브러리인 pytesseract 패키지를 설치합니다.VSCode 터미널에서 다음과 같이 설치합니다.

(2) OCR 프로그램 설치 이미지 인식을 위한 OCR 프로그램을 설치해야 합니다. 아래 깃허브에 접속하여 파일을 다운로드합니다.https://github.com/UB-Mannheim/tesseract/wiki

HomeTesseract 오픈소스 OCR 엔진 (메인리포지터리) – UB-Mannheim/tesseractgithub.com

HomeTesseract 오픈소스 OCR 엔진 (메인리포지터리) – UB-Mannheim/tesseractgithub.com

Windows 64bit의 경우 위 버전을 다운로드합니다.다운로드하면 다운로드 폴더에 아래 파일이 다운로드되어 있습니다.

언어는 영어로 진행합니다.

라이센스에 동의해 주시고,

컴포넌트 “Additional Language Data (download)” “.

설치 폴더는 변경하지 말고 진행하는 것이 좋습니다. 그리고 Shortcuts는 굳이 만들지 않아도 되기 때문에 Donot create shortcuts는 체크해 줍니다.

그러면 언어팩을 다운받으면서 동시에 설치를 하고 설치가 끝나면 종료를 해줍니다.

(3) 한글이 포함된 영상을 준비한 한글이 포함된 영상을 캡처하여 png 또는 jpg 형식으로 저장합니다.나는 아래와 같은 영상을 저장했습니다.(4) 코드 만들기, 이미지에서 한글을 찾아 추출하는 프로그램을 만들어 보세요.tesseract.exe 파일은 아래 경로에 설치되었네요.PIL(Python Imaging Library)은 파이썬 이미지 처리 라이브러리로 2011년 지원이 중단됐고, pillow가 PIL 후속 프로젝트로 나왔습니다. 즉, Pillow가 공식 PIL이라고 생각하시면 됩니다. 아래와 같이 코드를 작성합니다.PIL 가져오에서 Imageimport pytesseractimportos.chdir(os.path.dirname(os.path.abspath(__file__)img_path=r”를 가져옵니다.\”pytesseract.png”파이테사락. pytesseract.tesseract_context=r”C:\Program Files\Tesseract-OCR\tesseract.exe”text=pyteseract.image_to_string(Image.open(img_path), lang=’kor+eng’)print(텍스트)text print한 결과는 다음과 같습니다. 완전히는 잘 되지 않지만 어느 정도 작동하는 것을 볼 수 있습니다.그럼 이렇게 추출한 언어를 파일로 저장하는 코드를 만들어보도록 하겠습니다.(5)파일로 저장할 코드 만들기 파일을 open하는 방법을 기억하십니까?withopen(…)asf라고 하는 방법도 있고, with를 사용하지 않으려면 f=open(…)을 사용할 수도 있습니다. 하지만 f=open(…)을 사용할 경우 f.close()를 반드시 해야 합니다.PIL 가져오의 이미지 임포트 pytesseractimport osos.chdir(os.path.dirname(os.path.abspath(__file__)img_path=r”.\”pytesseract.png”파이테사락. pytesseract.tesseract_context=r”C:\Program Files\Tesseract-OCR\tesseract.exe”text=pytesseract.image_to_string(Image.open(img_path), lang=’kor+eng’)를 f:f.write(텍스트)로 오픈(r”/글변환한환 t.txt”,’w’, encoding=”utf8″)를 지정합니다상기 소스를 실행하면 아래 파일이 저장됩니다.만약 이 글자를 소리로 읽고 싶다면 어떻게 해야 하나요?텍스트를 음성으로 변환하면 되죠? https://m.blog.naver.com/dorergiverny/223179462798[Python] [Project] 텍스트를 음성으로 변환하기 -gts pip install 오류 환경설정 인식이 되지 않습니다. __file_playsound 지난 시간에 숫자 맞추기 게임을 만들면서 random number를 생성하는 방법과 예외 처리 방법에 대해 알고 있다… blog.naver.com이거는 각자 한번 해보면서 파이썬 구워가면 좋을 것 같아요.

error: Content is protected !!