박민혀기
GDSC Toy Project 글자인식, JSON 형식 소스코드, 이미지 파일 본문
import cv2
import pytesseract
import matplotlib.pyplot as plt
import requests
pytesseract.pytesseract.tesseract_cmd = R'C:\Program Files\Tesseract-OCR\tesseract'
path = "test8.jpg"
img = cv2.imread(path)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(img, lang='kor+eng')
replace_text = text.replace('.', ',')
split_text = replace_text.split()
cnt = 0
sum_flag = 0
flag = 'OK'
json_data = {}
for word in split_text:
if(flag == 'pass'):
flag = 'OK'
continue
elif(word.find("과세물품") == 0):
break
elif(cnt == 0):
json_data["menuName"] = word
elif(cnt == 1):
json_data["price"] = word
elif(cnt == 2):
json_data["number"] = word
print(json_data)
json_data.clear()
cnt = 0
flag = 'pass'
continue
cnt += 1
# print(split_text)
cv2.imshow("img", img)
cv2.waitKey(0)
# datas = {
# "menuName" : "국수", #메뉴 이름
# "price" : 6000, #메뉴 가격
# "number": 1, #메뉴 개수
# "shop" : "지짐이", #가게 이름
# "startT" : "2023-01-31T12:42"
# #방문 시간 -> 영수증에서 추출 어려우면 백엔드에서 update할게요
# }
# print(datas)
# url = "http://localhost:8080/user/create"
# headers = {'Content-Type' : 'application/json; charset = utf-8'}
# response = requests.post(url, json = datas, headers=headers)
# print(response)
'Deep Learning' 카테고리의 다른 글
캡스톤 Face_Detection, Motor_Control (0) | 2023.04.04 |
---|---|
GDSC Toy 프로젝트 주요코드 (0) | 2023.04.04 |
[OCR] Tesseract, PyTesseract Install on Windows(테스트 소스코드 포함) (0) | 2023.01.18 |
SSC_Face_Recognition, NetComm File (0) | 2022.12.18 |
우분투(Ubuntu) / OpenCV / Python / dlib 설치 (0) | 2022.12.11 |