프로젝트 배경
1) 문제점
- 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업
- 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼
- 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움
2) 프로젝트 목표
- 문항 인식 : 각 문항들을 객체인식(YOLO 기반 비전모델)을 통해 문항영역, 지문영역, 답안 영역을 분리
- 분리 된 문항들을 주관식, 객관식 문제로 구분하고 이를 다시 OCR 기반 텍스트 추출
- 최종적으로 통합된 전자문제집 자동 분철 기술 확보
3) 주안점
- 문제 영역 간 정확한 분철을 통한 신뢰성 확보
- 문제 문항의 메타데이터(지문, 보기, 객관식 항목 텍스트 등)를 추출하여 재조합 가능한 DB로 저장
- OCR + 객체인식 모델의 멀티모달 구조로 구현하여 수동작업 배제, 처리속도 혁신적 향상(500문제 7시간 → 30분 내외로 개선)
- 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업
- 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼
- 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움
2) 프로젝트 목표
- 문항 인식 : 각 문항들을 객체인식(YOLO 기반 비전모델)을 통해 문항영역, 지문영역, 답안 영역을 분리
- 분리 된 문항들을 주관식, 객관식 문제로 구분하고 이를 다시 OCR 기반 텍스트 추출
- 최종적으로 통합된 전자문제집 자동 분철 기술 확보
3) 주안점
- 문제 영역 간 정확한 분철을 통한 신뢰성 확보
- 문제 문항의 메타데이터(지문, 보기, 객관식 항목 텍스트 등)를 추출하여 재조합 가능한 DB로 저장
- OCR + 객체인식 모델의 멀티모달 구조로 구현하여 수동작업 배제, 처리속도 혁신적 향상(500문제 7시간 → 30분 내외로 개선)
프로젝트 성과
전자 문제집 개별 문제 추출 정확도 95% 달성
- 각 시료의 단일 문항에 대하여 정확한 영역 추출이 가능한지 평가
추출 개별 문제 OCR 정확도 95% 달성
영역 추출을 통해 분리가 완료된 개별 문항 이미지 내에 존재하는 텍스트를 추출 후 결과물에 대하여 평가
추출 문제 카테고리 분류 정확도 90% 달성
개별 문항의 추출 정보를 기반으로 분석하여 카테고리 자동 분류 정확도 평가
핵심 기능

개별 문제 인식 및 추출/분할 기술
- PDF, 이미지로 스캔된 종이 문제집 기반의 문항영역 객체인식(좌표, 클래스(지문, 문항, 문제번호 등 개별영역 분류))
- OCR 기반 개별 문항 텍스트 추출
- OCR 기반 개별 문항 텍스트 추출

추출 개별 문제 분류 및 관리 기술
- 좌표/텍스트 기반 문제 구조 인식 기술 개발 카테고리 분류 기능 확보
- DB 저장 및 연동 기능 개발
- DB 저장 및 연동 기능 개발
진행 단계
문항/전체 개발 구조 분석 및 정의
2023.06.
- 모델 요구사항 및 요구 성능, 적용 플랫폼에 따른 적합 모델 선정
개별 문제 인식 및 추출/분할 기술 개발
2023.07.
- OCR 기반 개별 문항 텍스트 추출 기술 개발
- 개별 문항 인식 기술 개발
- 객체인식 기반 개별 문항 영역 추출/분할 기술 개발
- 개별 문항 인식 기술 개발
- 객체인식 기반 개별 문항 영역 추출/분할 기술 개발
추출 개별 문제 분류 및 관리 기술 개발
2023.10.
- 좌표/텍스트 기반 문제 구조 인식 기술 개발
- 문제 구조 기반 카테고리 분류 기술 개발
- DB 저장 및 연동 기능 개발
- 문제 구조 기반 카테고리 분류 기술 개발
- DB 저장 및 연동 기능 개발
프로젝트 상세
Linux에서 YOLO 기반의 객체인식 모델과 OpenCV 기반 영상처리 알고리즘을 결합하여 PDF 형식의 전자 문제집 파일에서 각 문항과 지문들을 분철하여 OCR 텍스트로 추출하는 자동 인식 및 자동 분철 기술입니다.
※ 보유 인공지능 학습 및 추론 PC
1. 인공지능 서버
AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T
DDR4-3200 ECC/REG 64GB X 8
NVIDIA RTX 4090 D6X 24GB BLOWER X 4
2. 인공지능 서버
Intel® Core™ i7-9700K (8코어 8스레드, 최대 4.9GHz) CPU
DDR4-2666 16GB × 4
NVIDIA GeForce 2080 TI 11GB × 2
3.인공지능 서버
AMD Ryzen 9 3900X (12코어 24스레드, 최대 4.6GHz) CPU
DDR4-21300 32GB × 1
NVIDIA GeForce RTX 2080 Super 8GB × 2
※ 보유 인공지능 학습 및 추론 PC
1. 인공지능 서버
AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T
DDR4-3200 ECC/REG 64GB X 8
NVIDIA RTX 4090 D6X 24GB BLOWER X 4
2. 인공지능 서버
Intel® Core™ i7-9700K (8코어 8스레드, 최대 4.9GHz) CPU
DDR4-2666 16GB × 4
NVIDIA GeForce 2080 TI 11GB × 2
3.인공지능 서버
AMD Ryzen 9 3900X (12코어 24스레드, 최대 4.6GHz) CPU
DDR4-21300 32GB × 1
NVIDIA GeForce RTX 2080 Super 8GB × 2

전자문제집 기출문제 AI 인식 결과

전자문제집 기출문제 AI 분철 및 내용 추출



NVIDIA RTX 4090 D6X 24GB BLOWER X 4

NVIDIA GeForce RTX 2080 Super 8GB × 2

NVIDIA GeForce 2080 TI 11GB × 2