바카라 사이트 추천
안녕하세요.
담당 매니저 김수민입니다.
기간제(상주) 프로젝트 희망 근무 시작일을
등록해 주시면, 파트너님의 일정에 맞는
적합한 프로젝트를 추천해 드려요.

대외비 프로젝트는 지원 요청 받은 파트너만 조회할 수 있습니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

대외비 프로젝트는 지원 요청 받은 파트너만 조회할 수 있습니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

대외비 프로젝트는 지원 요청 받은 파트너만 조회할 수 있습니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

대외비 프로젝트는 지원 요청 받은 파트너만 조회할 수 있습니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

존재하지 않는 프로젝트입니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

프로젝트를 등록한 클라이언트만 확인 가능합니다.

필터를 저장해 나에게 딱 맞는 프로젝트를 추천받아보세요!

플러스
전자문제집(PDF)파일 문항영역 자동 인식 및 자동 분철 기술
개발
PC프로그램
데이터 분석ㆍBI, AI 모델 구축, 머신러닝ㆍ딥러닝
프로젝트 배경
1) 문제점
- 기존 문제집은 인쇄된 종이로 문제가 기재되어, 메타데이터 없이 문제의 디지털화하기 위해서 수동작업
- 수동 작업 시 인건비 및 디지털화 속도(500문항 기준 7시간 내외)가 많이 소요되어 비용 낭비가 큼
- 문제집 내의 문항들은 출판사마다 양식, 형태, 글꼴 등 상이한 특징 때문에 AI 없이 자동 분철하기에 어려움

2) 프로젝트 목표
- 문항 인식 : 각 문항들을 객체인식(YOLO 기반 비전모델)을 통해 문항영역, 지문영역, 답안 영역을 분리
- 분리 된 문항들을 주관식, 객관식 문제로 구분하고 이를 다시 OCR 기반 텍스트 추출
- 최종적으로 통합된 전자문제집 자동 분철 기술 확보

3) 주안점
- 문제 영역 간 정확한 분철을 통한 신뢰성 확보
- 문제 문항의 메타데이터(지문, 보기, 객관식 항목 텍스트 등)를 추출하여 재조합 가능한 DB로 저장
- OCR + 객체인식 모델의 멀티모달 구조로 구현하여 수동작업 배제, 처리속도 혁신적 향상(500문제 7시간 → 30분 내외로 개선)
프로젝트 성과
전자 문제집 개별 문제 추출 정확도 95% 달성
- 각 시료의 단일 문항에 대하여 정확한 영역 추출이 가능한지 평가
추출 개별 문제 OCR 정확도 95% 달성
영역 추출을 통해 분리가 완료된 개별 문항 이미지 내에 존재하는 텍스트를 추출 후 결과물에 대하여 평가
추출 문제 카테고리 분류 정확도 90% 달성
개별 문항의 추출 정보를 기반으로 분석하여 카테고리 자동 분류 정확도 평가
핵심 기능
개별 문제 인식 및 추출/분할 기술
- PDF, 이미지로 스캔된 종이 문제집 기반의 문항영역 객체인식(좌표, 클래스(지문, 문항, 문제번호 등 개별영역 분류))
- OCR 기반 개별 문항 텍스트 추출
추출 개별 문제 분류 및 관리 기술
- 좌표/텍스트 기반 문제 구조 인식 기술 개발 카테고리 분류 기능 확보
- DB 저장 및 연동 기능 개발
진행 단계
문항/전체 개발 구조 분석 및 정의
2023.06.
- 모델 요구사항 및 요구 성능, 적용 플랫폼에 따른 적합 모델 선정
개별 문제 인식 및 추출/분할 기술 개발
2023.07.
- OCR 기반 개별 문항 텍스트 추출 기술 개발
- 개별 문항 인식 기술 개발
- 객체인식 기반 개별 문항 영역 추출/분할 기술 개발
추출 개별 문제 분류 및 관리 기술 개발
2023.10.
- 좌표/텍스트 기반 문제 구조 인식 기술 개발
- 문제 구조 기반 카테고리 분류 기술 개발
- DB 저장 및 연동 기능 개발
프로젝트 상세
Linux에서 YOLO 기반의 객체인식 모델과 OpenCV 기반 영상처리 알고리즘을 결합하여 PDF 형식의 전자 문제집 파일에서 각 문항과 지문들을 분철하여 OCR 텍스트로 추출하는 자동 인식 및 자동 분철 기술입니다.

※ 보유 인공지능 학습 및 추론 PC
1. 인공지능 서버
AMD 라이젠 스레드리퍼 PRO 7965WX (스톰 픽) 32C 64T
DDR4-3200 ECC/REG 64GB X 8
NVIDIA RTX 4090 D6X 24GB BLOWER X 4

2. 인공지능 서버
Intel® Core™ i7-9700K (8코어 8스레드, 최대 4.9GHz) CPU
DDR4-2666 16GB × 4
NVIDIA GeForce 2080 TI 11GB × 2

3.인공지능 서버
AMD Ryzen 9 3900X (12코어 24스레드, 최대 4.6GHz) CPU
DDR4-21300 32GB × 1
NVIDIA GeForce RTX 2080 Super 8GB × 2
전자문제집 기출문제 AI 인식 결과
전자문제집 기출문제 AI 분철 및 내용 추출
NVIDIA RTX 4090 D6X 24GB BLOWER X 4
NVIDIA GeForce RTX 2080 Super 8GB × 2
NVIDIA GeForce 2080 TI 11GB × 2

비슷한 프로젝트를 준비 중이라면?
바카라 사이트 추천 매니저와 상담하세요.

참여 개발사와 미팅 연결

프로젝트 1:1 컨설팅 제공

대한민국 대표 IT 프로젝트

작업한 파트너프로필 보기

ct******
개발 · 법인사업자

프로젝트 정보

참여 기간
2023.05. ~ 2024.01.
참여율
참여율이 100%인 프로젝트는 해당 파트너님이 온전히 작업한 결과물입니다.
외부 공동 작업의 경우 기여도에 따라 참여율이 달라지며 역할, 프로젝트 설명을 통해 업무 분야 및 참여 범위를 확인할 수 있습니다.
100%
고객사
중소벤처기업부
역할
객체인식 AI 학습 및 기반 플랫폼 개발
관련 기술
크롤링
YOLO
OpenCV
빅데이터
스크래핑
Python