프로젝트 배경
1) 문제점
- 어안 카메라로 촬영된 영상에서 기존 객체 탐지 모델의 성능 저하
- 이미지 가장자리 영역의 극심한 왜곡으로 인한 오탐지 발생
- 가장자리 객체의 작은 크기로 인한 미탐지 문제
- 표지판 등 비대상 객체를 차량 등으로 오인식하는 문제
2) 프로젝트 목표
- 탐지 정확도 향상: F1 Score 0.60 이상 달성
- 왜곡 강건성 확보: 어안 렌즈 특성에 강건한 탐지 알고리즘 개발
- 실용성 확보: 소수의 어안 카메라로 넓은 영역 모니터링 가능
- 오탐지 최소화: 도메인 특화 기법으로 비대상 객체 오인식 해결
3) 주안점
- Sliced Inference 기법을 통한 작은 객체 탐지 성능 개선
- Semi-Supervised Learning으로 비대상 객체 학습
- 다양한 DETR 모델 앙상블을 통한 성능 극대화
- Weighted Boxes Fusion으로 예측 결과 통합 최적화
- 어안 카메라로 촬영된 영상에서 기존 객체 탐지 모델의 성능 저하
- 이미지 가장자리 영역의 극심한 왜곡으로 인한 오탐지 발생
- 가장자리 객체의 작은 크기로 인한 미탐지 문제
- 표지판 등 비대상 객체를 차량 등으로 오인식하는 문제
2) 프로젝트 목표
- 탐지 정확도 향상: F1 Score 0.60 이상 달성
- 왜곡 강건성 확보: 어안 렌즈 특성에 강건한 탐지 알고리즘 개발
- 실용성 확보: 소수의 어안 카메라로 넓은 영역 모니터링 가능
- 오탐지 최소화: 도메인 특화 기법으로 비대상 객체 오인식 해결
3) 주안점
- Sliced Inference 기법을 통한 작은 객체 탐지 성능 개선
- Semi-Supervised Learning으로 비대상 객체 학습
- 다양한 DETR 모델 앙상블을 통한 성능 극대화
- Weighted Boxes Fusion으로 예측 결과 통합 최적화
프로젝트 성과
AI City Challenge 2024 Track 4 준우승
CVPR 2024 워크샵 국제 대회에서 F1 Score 0.6196 달성하여 전 세계 참가팀 중 2위 기록
탐지 성능 31% 향상
기존 베이스라인 대비 F1 Score를 0.4734에서 0.6196으로 개선, 어안 카메라 실용화 가능성 입증
오탐지율 73% 감소
Semi-Supervised Learning 적용으로 표지판 등 비대상 객체의 오인식 73% 감소
핵심 기능

Adaptive Image Enhancement
Histogram Equalization을 통한 저조도/고조도 환경 대응 및 회전 증강을 통한 다양한 카메라 각도 대응
진행 단계
문제 분석 및 데이터셋 구축
2024.02.
- FishEye8K 데이터셋 분석
- 어안 카메라 특성으로 인한 탐지 실패 패턴 분석
- 오탐지 사례 수집 및 분류
- 어안 카메라 특성으로 인한 탐지 실패 패턴 분석
- 오탐지 사례 수집 및 분류
SAHI 기반 Small Object Detection 구현
2024.02.
- Slicing Aided Hyper Inference 기법 적용
- 가장자리 영역 객체 크기 증대 전략
- 슬라이스별 추론 및 결과 통합 알고리즘 개발
- 가장자리 영역 객체 크기 증대 전략
- 슬라이스별 추론 및 결과 통합 알고리즘 개발
Semi-Supervised Learning 시스템 개발 (2024.03)
2024.03.
- LVIS 데이터셋 학습된 Co-DETR로 1,203개 객체 카테고리 pseudo labeling
- 비대상 객체 학습을 통한 discrimination 능력 향상
- 비대상 객체 학습을 통한 discrimination 능력 향상
모델 앙상블 및 최적화
2024.03.
- Co-DINO (Swin-L/ViT-L) 모델 fine-tuning
- Histogram Equalization 적용
- Weighted Boxes Fusion 기반 앙상블 구현
- Histogram Equalization 적용
- Weighted Boxes Fusion 기반 앙상블 구현
프로젝트 상세
1) 포트폴리오 소개
- CVPR 2024 AI City Challenge에서 준우승을 달성한 고성능 어안 렌즈 특화 딥러닝 모델 연구
2) 작업 범위
- 딥러닝 모델 개발: Co-DETR, Co-DINO 등 DETR 계열 모델 fine-tuning 및 최적화
- 알고리즘 연구: SAHI(Sliced Aided Hyper Inference) 기법 구현 및 개선
- 데이터 엔지니어링: FishEye8K 데이터셋 분석 및 pseudo labeling 파이프라인 구축
- 모델 앙상블: Weighted Boxes Fusion 기반 다중 모델 통합
- 성능 최적화: PyTorch 및 CUDA 기반 추론 속도 개선
- 지원 환경: GPU 서버, 어안 카메라 시스템
3) 주요 업무
- Small Object Detection 최적화: Slicing 기법으로 가장자리 영역 작은 객체 탐지율 향상
- Semi-Supervised Learning: LVIS 데이터셋 기반 1,203개 카테고리 pseudo labeling
- 다중 모델 앙상블: Co-DINO(Swin-L/ViT-L) 모델 fine-tuning 및 통합
- Adaptive Enhancement: Histogram Equalization 및 회전 증강으로 다양한 환경 대응
- 오탐지 제거 시스템: 비대상 객체 discrimination 학습으로 오인식 최소화
4) 주안점
- 어안 렌즈 특화 기술: 극심한 왜곡 환경에서도 F1 Score 0.6196 달성
- 실용성 중심 접근: 소수 카메라로 넓은 영역 커버리지 확보
- 혁신적 성능 개선: 베이스라인 대비 31% 성능 향상 및 오탐지율 73% 감소
- 국제 대회 검증: CVPR 2024 워크샵 글로벌 경쟁에서 2위 달성으로 기술력 입증
- CVPR 2024 AI City Challenge에서 준우승을 달성한 고성능 어안 렌즈 특화 딥러닝 모델 연구
2) 작업 범위
- 딥러닝 모델 개발: Co-DETR, Co-DINO 등 DETR 계열 모델 fine-tuning 및 최적화
- 알고리즘 연구: SAHI(Sliced Aided Hyper Inference) 기법 구현 및 개선
- 데이터 엔지니어링: FishEye8K 데이터셋 분석 및 pseudo labeling 파이프라인 구축
- 모델 앙상블: Weighted Boxes Fusion 기반 다중 모델 통합
- 성능 최적화: PyTorch 및 CUDA 기반 추론 속도 개선
- 지원 환경: GPU 서버, 어안 카메라 시스템
3) 주요 업무
- Small Object Detection 최적화: Slicing 기법으로 가장자리 영역 작은 객체 탐지율 향상
- Semi-Supervised Learning: LVIS 데이터셋 기반 1,203개 카테고리 pseudo labeling
- 다중 모델 앙상블: Co-DINO(Swin-L/ViT-L) 모델 fine-tuning 및 통합
- Adaptive Enhancement: Histogram Equalization 및 회전 증강으로 다양한 환경 대응
- 오탐지 제거 시스템: 비대상 객체 discrimination 학습으로 오인식 최소화
4) 주안점
- 어안 렌즈 특화 기술: 극심한 왜곡 환경에서도 F1 Score 0.6196 달성
- 실용성 중심 접근: 소수 카메라로 넓은 영역 커버리지 확보
- 혁신적 성능 개선: 베이스라인 대비 31% 성능 향상 및 오탐지율 73% 감소
- 국제 대회 검증: CVPR 2024 워크샵 글로벌 경쟁에서 2위 달성으로 기술력 입증

An example of sliced inference

Training on these non-target objects

Changes in pixel distribution with histogram equalization

Methods

CVPR 2024 Workshop paper accepted