
AI 활용 OCR 파이썬 웹 프로그램 개발
5.00
계약 금액
10,800,000원
프로젝트 기간
225일
계약 일자
2025.06.05.
프로젝트 배경
1) 문제점
- 기 기발된 OCR 프로그램에 대한 사용성 부족 (CLI 또는 Google CoLab기반 실행)
- OCR 속도가 느리고 정확도가 낮음
- 정확도 하락 요인
. 숫자가 한칸에 두 줄이 되거나 숫자가 표와 곂치는 부분 오감지
. 사용량 표가 연도를 넘어가는 경우 주요 연도만 OCR 진행 필요 (eg: 2024-02 ~ 2025-01 일 때 2024 데이터만 진행)
. 고객번호 기준 OCR하고자 하는 데이터가 다음 페이지로 넘어가는 경우
. OCR하고자 하는 문서 외 다른 문서가 들어올 경우
2) 프로젝트 목표
- 이전 진행한 프로젝트 코드 리뷰
- OpenAI, Clova OCR 활용 간접비용(전기) PDF 내 고객번호, 사용량 정보 체번
- 체번한 사용량 OCR 인식률 100% 목표
3) 주안점
- 사용성: 멀티 유저 사용을 위한 웹 기반 OCR 서비스 구축 (사용자: < 100)
- 성능: PDF 1 페이지 당 2초 이내, 인식률 100% 목표
- 기 기발된 OCR 프로그램에 대한 사용성 부족 (CLI 또는 Google CoLab기반 실행)
- OCR 속도가 느리고 정확도가 낮음
- 정확도 하락 요인
. 숫자가 한칸에 두 줄이 되거나 숫자가 표와 곂치는 부분 오감지
. 사용량 표가 연도를 넘어가는 경우 주요 연도만 OCR 진행 필요 (eg: 2024-02 ~ 2025-01 일 때 2024 데이터만 진행)
. 고객번호 기준 OCR하고자 하는 데이터가 다음 페이지로 넘어가는 경우
. OCR하고자 하는 문서 외 다른 문서가 들어올 경우
2) 프로젝트 목표
- 이전 진행한 프로젝트 코드 리뷰
- OpenAI, Clova OCR 활용 간접비용(전기) PDF 내 고객번호, 사용량 정보 체번
- 체번한 사용량 OCR 인식률 100% 목표
3) 주안점
- 사용성: 멀티 유저 사용을 위한 웹 기반 OCR 서비스 구축 (사용자: < 100)
- 성능: PDF 1 페이지 당 2초 이내, 인식률 100% 목표
바카라 실시간과 함께한 진행 과정
프로젝트 성과
웹 기반 OCR 서비스 구축
fastAPI, celery기반 멀티 유저 사용 웹 기반 OCR 서비스 구축
OCR 인식률 99.8% 달성
Naver Clova OCR, OpenAI API 활용 OCR 인식률 99.8% 달성
PDF 내 OCR 추출 속도 향상
PDF 1 페이지당 2초 이내 속도로 데이터 체번 가능
조기 납품 완료
6개월 프로젝트 기간 중 2개월 이내 개발 완료 및 조기 납품 및 클라이언트 요구 사항 만족
핵심 기능

웹 기반 서비스 구축
. FastAPI, Celery, Redis, sqlite 기반 비동기 작업 서버 구현
. 멀티 유저 사용 가능 (사용자: < 100)
. 로그인, 회원가입, 계정별 작업 페이지, 관리자 페이지(사용자 등록) 구현
. 멀티 유저 사용 가능 (사용자: < 100)
. 로그인, 회원가입, 계정별 작업 페이지, 관리자 페이지(사용자 등록) 구현

OCR 속도 및 인식률 향상
. 상용 OCR API에서 인식률 향상을 위한 pre-processing 진행
. 정확도 판단 모듈 개발 및 계층적 OCR 활용
. 정확도 판단 모듈 개발 및 계층적 OCR 활용
진행 단계
기획 및 요구사항 정리, 기존 코드 리뷰
2025.05.
. 요구사항 정리
. 개발환경 구축
. 이전 코드 분석
. 상용 AI별 OCR 장단점 분석
. 성능 향상을 위한 알고리즘 설계
. 개발환경 구축
. 이전 코드 분석
. 상용 AI별 OCR 장단점 분석
. 성능 향상을 위한 알고리즘 설계
개발 및 테스트, 런칭
2025.06.
. 설계한 알고리즘 구현
. FastAPI, Celery, Redis, sqlite 기반 비동기 작업 서버 구현
. 성능 향상을 위한 추가 알고리즘 구현
. 클라이언트 로컬 PC 내 웹 서비스 구축
. FastAPI, Celery, Redis, sqlite 기반 비동기 작업 서버 구현
. 성능 향상을 위한 추가 알고리즘 구현
. 클라이언트 로컬 PC 내 웹 서비스 구축
프로젝트 상세
1) 포트폴리오 소개
- /project/143690/ 프로젝트
- 전기고지서의 월 전기량을 엑셀로 추출하는 챗GPT+네이버 OCR 활용 파이썬 웹 프로그램 개발
- OCR 속도 향상 및 인식률 100% 목표
2) 작업 범위 및 주요 업무
- 웹 서비스 구축
. 로그인/회원가입/관리자-사용자관리/사용자 작업 페이지 개발
. 사용된 PDF 및 결과 자료 다운로드 뒤 자동 삭제
. OCR 진행 후 정해진 엑셀 서식에 맞게 엑셀 파일 생성 및 다운로드
. 사용자 100명 이하 멀티 유저 사용
- PDF 1 페이지 당 2초 이내, OCR 인식률 100% 목표
- 클라이언트 로컬 PC 내 웹 서비스 구축
3) 개발 환경
- OS: Windows 11 x64 (웹서버용)
- Language: Python
- IDE: Pycharm
- 주요 Package: openai, opencv-python, fastapi, celery
4) 주안점
- 사용성: 멀티 유저 사용을 위한 웹 기반 OCR 서비스 구축 (사용자: < 100)
- 성능: PDF 1 페이지 당 2초 이내, 인식률 100% 목표
- /project/143690/ 프로젝트
- 전기고지서의 월 전기량을 엑셀로 추출하는 챗GPT+네이버 OCR 활용 파이썬 웹 프로그램 개발
- OCR 속도 향상 및 인식률 100% 목표
2) 작업 범위 및 주요 업무
- 웹 서비스 구축
. 로그인/회원가입/관리자-사용자관리/사용자 작업 페이지 개발
. 사용된 PDF 및 결과 자료 다운로드 뒤 자동 삭제
. OCR 진행 후 정해진 엑셀 서식에 맞게 엑셀 파일 생성 및 다운로드
. 사용자 100명 이하 멀티 유저 사용
- PDF 1 페이지 당 2초 이내, OCR 인식률 100% 목표
- 클라이언트 로컬 PC 내 웹 서비스 구축
3) 개발 환경
- OS: Windows 11 x64 (웹서버용)
- Language: Python
- IDE: Pycharm
- 주요 Package: openai, opencv-python, fastapi, celery
4) 주안점
- 사용성: 멀티 유저 사용을 위한 웹 기반 OCR 서비스 구축 (사용자: < 100)
- 성능: PDF 1 페이지 당 2초 이내, 인식률 100% 목표

웹 서비스 사용 흐름 (로그인, 회원가입, 관리자승인, 작업 페이지)

OCR 성능 향상을 위한 알고리즘 흐름