[Python] EasyOCR 을 이용한 이미지에서 한글 인식하기

250x250

Link

GitHub

나의 GitHub Contribution 그래프

Loading data ...

Notice

Recent Posts

Recent Comments

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

관리 메뉴

Data Science LAB

[Python] EasyOCR 을 이용한 이미지에서 한글 인식하기 본문

🖥️ Computer Vision/ocr

[Python] EasyOCR 을 이용한 이미지에서 한글 인식하기

ㅅ ㅜ ㅔ ㅇ 2022. 10. 19. 17:26

728x90

EasyOCR 을 사용하면 손쉽게 이미지에서 한글 텍스트를 인식할 수 있다.

현재 약 80여개의 언어를 지원하고 있으며, 오픈소스이기 때문에 누구나 무료로 사용할 수 있다.

먼저, pip을 이용하여 설치를 해주어야 한다.

!pip install easyocr

필요한 모듈 불러오기

import matplotlib.pyplot as plt
from imutils.perspective import four_point_transform
from imutils.contours import sort_contours
import imutils
from easyocr import Reader
import cv2
import requests
import numpy as np
from PIL import ImageFont, ImageDraw, Image
import os
import re
import tqdm

데이터셋 구성

train.csv와 test.csv 내에 각각의 이미지 데이터의 경로가 들어있음

train, test 폴더내에는 이미지데이터셋이 png형태로 저장되어 있음

csv 파일 불러오기

train_df = pd.read_csv('../data/train.csv')
test_df = pd.read_csv('../data/test.csv')

image를 Load하는 함수 생성

def load_image(img_path):
    image_path = os.path.join('../data', img_path[2:])
    img = cv2.imread(image_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    return img

결과 반환

tqdm.pandas()
results = []

for i_path in test_df['img_path']:
    img = load_image(i_path)
    
    reader = Reader(lang_list=['ko'], gpu=True)
    result = reader.readtext(img, detail = 0)
    text = ''.join(result)
    results.append(text)

특수문자, 숫자, 공백 제거

n_result = [re.sub(r"[^\uAC00-\uD7A30-9a-zA-Z\s]", "", x) for x in results]
n_result = [re.sub(r"[0-9]", "", x) for x in n_result]
n_result = [x.replace(" ", "") for x in n_result]

n_result

결과를 csv파일로 생성

sub_df = pd.read_csv('../data/sample_submission.csv')
sub_df['text'] = n_result
sub_df.to_csv('easyocr.csv',index=False)

728x90

'🖥️ Computer Vision > ocr' 카테고리의 다른 글

[Python] Naver Cloud 한글 OCR (0)	2022.10.18
[Python] Mac에서 tesseract 설치하기 및 한글 추가 (0)	2022.09.15

'🖥️ Computer Vision/ocr' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Data Science LAB

Data Science LAB

[Python] EasyOCR 을 이용한 이미지에서 한글 인식하기 본문

[Python] EasyOCR 을 이용한 이미지에서 한글 인식하기

EasyOCR 을 사용하면 손쉽게 이미지에서 한글 텍스트를 인식할 수 있다.

'🖥️ Computer Vision > ocr' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역