프로젝트 배경
1) 문제점
- 출퇴근기록부 등 수기 문서의 데이터 입력 작업이 시간 소모적이고 반복적
- 손글씨 인식 및 표 형태 데이터 추출의 정확도 문제로 인한 재작업 빈발
- 개인 PC에서 수동 입력하는 문서는 휴먼 에러 발생 시 전체 업무 연속성에 영향
2) 프로젝트 목표
- 자동화 시스템: 이미지 문서를 자동으로 인식하여 엑셀로 변환하는 기능 개발
- AI 기반 OCR: Google Vision API를 통해 정확한 문자 인식 및 데이터 추출 기능 개발
- 업무 효율성 향상: 수작업 데이터 입력 시간을 90% 이상 단축하는 자동화 시스템 구축
3) 주안점
- 단계별 시각적 검증을 통한 정확한 데이터 추출 결과 제공
- 사용자 친화적 인터페이스로 기술적 복잡성 최소화 및 접근성 개선
- 데이터 무결성 보장을 위한 1:1 매핑 및 에러 핸들링 강화
- 출퇴근기록부 등 수기 문서의 데이터 입력 작업이 시간 소모적이고 반복적
- 손글씨 인식 및 표 형태 데이터 추출의 정확도 문제로 인한 재작업 빈발
- 개인 PC에서 수동 입력하는 문서는 휴먼 에러 발생 시 전체 업무 연속성에 영향
2) 프로젝트 목표
- 자동화 시스템: 이미지 문서를 자동으로 인식하여 엑셀로 변환하는 기능 개발
- AI 기반 OCR: Google Vision API를 통해 정확한 문자 인식 및 데이터 추출 기능 개발
- 업무 효율성 향상: 수작업 데이터 입력 시간을 90% 이상 단축하는 자동화 시스템 구축
3) 주안점
- 단계별 시각적 검증을 통한 정확한 데이터 추출 결과 제공
- 사용자 친화적 인터페이스로 기술적 복잡성 최소화 및 접근성 개선
- 데이터 무결성 보장을 위한 1:1 매핑 및 에러 핸들링 강화
프로젝트 성과
업무 처리 시간 90% 단축
기존 수작업으로 248개 셀 데이터를 입력하는데 평균 2시간이 소요되었으나, OCR 자동화 시스템 도입 후 12분으로 단축. 투시 변환, 격자선 조정, OCR 처리, 엑셀 생성까지 전 과정이 자동화.
OCR 인식 정확도 95% 이상 달성
Google Vision API 활용 및 단계별 시각적 검증 시스템을 통해 손글씨 문자 인식 정확도 95% 이상 달성. 셀별 개별 처리와 이미지 전처리 최적화로 기존 일반 OCR 대비 30% 향상된 인식률 확보.
핵심 기능

지능형 이미지 전처리 및 표 영역 검출
투시 변환 보정(굴곡된 이미지 평면화): 비스듬히 촬영된 문서를 4개 꼭짓점 클릭만으로 평면 보정
Interactive 격자선 조정: 14×31 격자를 사용자가 직접 드래그하여 표 구조에 맞게 세밀 조정
Interactive 격자선 조정: 14×31 격자를 사용자가 직접 드래그하여 표 구조에 맞게 세밀 조정

선택적 셀 추출 및 OCR 처리
타겟 셀 자동 추출: 전체 14개 열 중 필요한 8개 열(C,D,G,H,K,L,O,P)만 선별 추출
Google Vision API 연동: 각 셀별 개별 OCR 처리로 높은 문자 인식 정확도 확보
Google Vision API 연동: 각 셀별 개별 OCR 처리로 높은 문자 인식 정확도 확보

1:1 매핑 엑셀 자동 생성
정확한 주소 매핑: 추출된 셀 데이터를 엑셀 좌표(C3~P33)와 완벽하게 1:1 대응
공백 셀 보존: 내용이 없는 셀도 포함하여 원본 표 구조 완전 재현
자동 파일 생성: '출퇴근 기록부_원본파일명.xlsx'
공백 셀 보존: 내용이 없는 셀도 포함하여 원본 표 구조 완전 재현
자동 파일 생성: '출퇴근 기록부_원본파일명.xlsx'
진행 단계
요구사항 분석 및 기술 검토
2025.05.
출퇴근기록부 수작업 입력 문제점 분석,
OCR 기술 및 이미지 처리 라이브러리 검토,
Google Vision API 성능 테스트 및 비용 분석,
전체 시스템 아키텍처 설계 및 기술 스택 선정
OCR 기술 및 이미지 처리 라이브러리 검토,
Google Vision API 성능 테스트 및 비용 분석,
전체 시스템 아키텍처 설계 및 기술 스택 선정
핵심 모듈 개발
2025.05.
OpenCV 기반 이미지 전처리 및 투시 변환 모듈 개발,
격자선 조정 및 셀 분할 알고리즘 구현,
Google Vision API 연동 및 OCR 처리 로직 개발, 엑셀 파일 생성 및 데이터 매핑 시스템 구축
격자선 조정 및 셀 분할 알고리즘 구현,
Google Vision API 연동 및 OCR 처리 로직 개발, 엑셀 파일 생성 및 데이터 매핑 시스템 구축
UI/UX 개발 및 통합
2025.05.
Tkinter 기반 사용자 인터페이스 개발,
마우스 클릭 기반 ROI 선택 기능 구현,
실시간 시각적 검증 시스템 구축,
전체 파이프라인 통합 및 워크플로우 최적화
마우스 클릭 기반 ROI 선택 기능 구현,
실시간 시각적 검증 시스템 구축,
전체 파이프라인 통합 및 워크플로우 최적화
테스트 및 최적화
2025.05.
다양한 문서 형태 및 화질 조건에서 정확도 테스트,
248개 셀 처리 성능 최적화,
에러 핸들링 및 예외 상황 대응 로직 강화,
사용자 피드백 반영 및 UX 개선
248개 셀 처리 성능 최적화,
에러 핸들링 및 예외 상황 대응 로직 강화,
사용자 피드백 반영 및 UX 개선
프로젝트 상세
1) 포트폴리오 소개
- AI 자동화 솔루션 | 사무직 종사자 및 관리업무 담당자를 위한 문서 처리 자동화 프로그램 개발
- 수기로 작성된 출퇴근기록부, 근태관리표 등의 표 형태 문서를 스캔하여 자동으로 엑셀 데이터로 변환하는 OCR 기반 업무 자동화 솔루션입니다.
- 기존 수작업으로 진행되던 데이터 입력 업무를 AI 기술을 통해 자동화하여 업무 효율성을 크게 향상시키는 것을 목표로 합니다.
2) 작업 범위
- 전체 파이프라인 설계 및 개발: 이미지 전처리부터 엑셀 출력까지 End-to-End 시스템 구축
- Computer Vision 모듈 개발: OpenCV 기반 이미지 처리 및 표 영역 검출
- OCR 엔진 연동: Google Cloud Vision API 활용한 문자 인식 시스템
- GUI 인터페이스 개발: Tkinter 기반 사용자 친화적 조작 인터페이스
- 지원 환경: Windows/Mac/Linux 크로스 플랫폼 지원
3) 주요 업무
- 투시 변환 기반 이미지 보정: 비스듬히 촬영된 문서를 평면으로 자동 보정
- interactive 격자선 조정 시스템: 사용자가 직접 표 구조를 세밀하게 조정할 수 있는 UI 구현
- 지능형 셀 분할 알고리즘: 14×31 격자 구조에서 필요한 8개 열만 선택적으로 추출 (총 248개 셀)
- 실시간 시각적 검증 시스템: 셀 분할 결과를 오버레이로 표시하여 사용자 확인 후 진행
- 1:1 매핑 엑셀 출력: 추출된 셀 데이터를 정확한 엑셀 주소(C3~P33)에 자동 입력
- 배치 처리 최적화: 248개 셀 OCR을 효율적으로 병렬 처리
4) 주안점
- 정확성 우선의 단계별 검증: 각 처리 단계마다 시각적 확인을 통해 오류 최소화
- 사용자 중심의 직관적 UX: 복잡한 CV/OCR 기술을 마우스 클릭만으로 간단하게 조작 가능
- 데이터 무결성 보장: 공백 셀까지 포함한 완전한 1:1 매핑으로 데이터 누락 방지
- 확장 가능한 모듈 설계: OCR 엔진 교체, 표 구조 변경 등이 용이한 유연한 아키텍처
- 에러 핸들링 강화: 인증 오류, 파일 처리 오류 등 다양한 예외 상황에 대한 견고한 대응 체계
- AI 자동화 솔루션 | 사무직 종사자 및 관리업무 담당자를 위한 문서 처리 자동화 프로그램 개발
- 수기로 작성된 출퇴근기록부, 근태관리표 등의 표 형태 문서를 스캔하여 자동으로 엑셀 데이터로 변환하는 OCR 기반 업무 자동화 솔루션입니다.
- 기존 수작업으로 진행되던 데이터 입력 업무를 AI 기술을 통해 자동화하여 업무 효율성을 크게 향상시키는 것을 목표로 합니다.
2) 작업 범위
- 전체 파이프라인 설계 및 개발: 이미지 전처리부터 엑셀 출력까지 End-to-End 시스템 구축
- Computer Vision 모듈 개발: OpenCV 기반 이미지 처리 및 표 영역 검출
- OCR 엔진 연동: Google Cloud Vision API 활용한 문자 인식 시스템
- GUI 인터페이스 개발: Tkinter 기반 사용자 친화적 조작 인터페이스
- 지원 환경: Windows/Mac/Linux 크로스 플랫폼 지원
3) 주요 업무
- 투시 변환 기반 이미지 보정: 비스듬히 촬영된 문서를 평면으로 자동 보정
- interactive 격자선 조정 시스템: 사용자가 직접 표 구조를 세밀하게 조정할 수 있는 UI 구현
- 지능형 셀 분할 알고리즘: 14×31 격자 구조에서 필요한 8개 열만 선택적으로 추출 (총 248개 셀)
- 실시간 시각적 검증 시스템: 셀 분할 결과를 오버레이로 표시하여 사용자 확인 후 진행
- 1:1 매핑 엑셀 출력: 추출된 셀 데이터를 정확한 엑셀 주소(C3~P33)에 자동 입력
- 배치 처리 최적화: 248개 셀 OCR을 효율적으로 병렬 처리
4) 주안점
- 정확성 우선의 단계별 검증: 각 처리 단계마다 시각적 확인을 통해 오류 최소화
- 사용자 중심의 직관적 UX: 복잡한 CV/OCR 기술을 마우스 클릭만으로 간단하게 조작 가능
- 데이터 무결성 보장: 공백 셀까지 포함한 완전한 1:1 매핑으로 데이터 누락 방지
- 확장 가능한 모듈 설계: OCR 엔진 교체, 표 구조 변경 등이 용이한 유연한 아키텍처
- 에러 핸들링 강화: 인증 오류, 파일 처리 오류 등 다양한 예외 상황에 대한 견고한 대응 체계



