프로젝트 배경
[문제점]
1. 전문가 인터뷰 데이터가 비정형 텍스트로 산재되어 있어 분석 및 활용이 어려움
2. 키워드 중심 정제 및 주제 분류가 수작업에 의존, 효율성과 일관성 부족
3. 데이터 기반 인사이트 도출 및 학습 자료화에 한계
[목표]
1. 자연어처리 기반 인터뷰 텍스트 자동 정제 및 핵심 키워드 추출
2. 주제별 자동 태깅 및 범주화로 검색성과 학습 편의성 향상
3. 분석 결과를 CSV/JSON 포맷으로 구조화하여 데이터셋으로 재활용 가능
[주안점]
1. 자동화된 데이터 파이프라인: 인터뷰 업로드 → 정제 → 키워드 추출 → 구조화까지 자동 처리
2. 주제/태그 대시보드 제공: 관리자 화면에서 인터뷰별 주요 키워드, 주제 태그, 정제 상태 확인 가능
3. 데이터 품질 관리 기능: 키워드 및 태깅 결과에 대한 수정·승인 기능 제공
4. 내보내기 기능 지원: 학습용, 보고서용으로 CSV/JSON 형식의 데이터 즉시 다운로드 가능
5. 접근 권한 제어: 데이터 수정/승인/삭제 등 역할별 권한 관리 기능 포함
6. 활용 로그 분석: 어떤 키워드·주제가 가장 많이 등장했는지에 대한 통계 리포트 기능
1. 전문가 인터뷰 데이터가 비정형 텍스트로 산재되어 있어 분석 및 활용이 어려움
2. 키워드 중심 정제 및 주제 분류가 수작업에 의존, 효율성과 일관성 부족
3. 데이터 기반 인사이트 도출 및 학습 자료화에 한계
[목표]
1. 자연어처리 기반 인터뷰 텍스트 자동 정제 및 핵심 키워드 추출
2. 주제별 자동 태깅 및 범주화로 검색성과 학습 편의성 향상
3. 분석 결과를 CSV/JSON 포맷으로 구조화하여 데이터셋으로 재활용 가능
[주안점]
1. 자동화된 데이터 파이프라인: 인터뷰 업로드 → 정제 → 키워드 추출 → 구조화까지 자동 처리
2. 주제/태그 대시보드 제공: 관리자 화면에서 인터뷰별 주요 키워드, 주제 태그, 정제 상태 확인 가능
3. 데이터 품질 관리 기능: 키워드 및 태깅 결과에 대한 수정·승인 기능 제공
4. 내보내기 기능 지원: 학습용, 보고서용으로 CSV/JSON 형식의 데이터 즉시 다운로드 가능
5. 접근 권한 제어: 데이터 수정/승인/삭제 등 역할별 권한 관리 기능 포함
6. 활용 로그 분석: 어떤 키워드·주제가 가장 많이 등장했는지에 대한 통계 리포트 기능
프로젝트 성과
비정형 인터뷰 데이터를 구조화된 정보로 전환하여 활용성을 크게 향상
전문가 인터뷰에서 주요 키워드와 주제를 자동 추출함으로써 인사이트 도출이 쉬워짐
주제별 태깅 시스템 도입으로 인터뷰 검색성과 분류 체계 개선
유사 주제 간 인터뷰를 묶어내고, 검색 필터링이 가능해져 자료 접근성이 강화됨
CSV/JSON/JSONL/OWL 기반 데이터셋 생성으로 2차 활용 가능
CSV/JSON/JSONL/OWL 형식으로 데이터셋 생성, 주제, 키워드별 분석·AI 학습·지식관리 등 다양한 활용에 최적화
관리자 중심 대시보드 구축으로 운영 효율성 및 품질 관리 역량 향상
키워드/태그 검토, 정제 상태 확인, 자료 다운로드 등 핵심 기능을 한 곳에서 처리 가능
핵심 기능


웹 페이지 기반 서비스 제공
- 전문가 인터뷰 업로드부터 정제까지 웹에서 간편하게 처리
- 포맷 선택(CSV/JSON 등) 후 구조화된 데이터 즉시 다운로드 가능
- 관리자 웹 대시보드로 태그 수정·품질 검수·이력 관리 일원화
- 포맷 선택(CSV/JSON 등) 후 구조화된 데이터 즉시 다운로드 가능
- 관리자 웹 대시보드로 태그 수정·품질 검수·이력 관리 일원화



AI 기반 인터뷰 데이터 분석
- 인터뷰 원문 업로드 시 AI가 자동으로 핵심 키워드 및 주요 문장 추출
- AI 모델이 인터뷰 내용을 주제별로 분류하고 관련 태그 자동 생성
- 분석 결과 통계 및 워크클라우드 생성
- AI 모델이 인터뷰 내용을 주제별로 분류하고 관련 태그 자동 생성
- 분석 결과 통계 및 워크클라우드 생성



분석 결과 저장 및 최종 보고서 생성
- 분석 완료된 인터뷰 데이터 웹에서 손쉽게 CSV, JSON, JSONL, OWL 형식으로 저장 및 관리 가능
- 추출된 주제 및 키워드를 통해 온톨로지 분석 시각화
- 최종 보고서 생성을 통한 학술 분석
- 추출된 주제 및 키워드를 통해 온톨로지 분석 시각화
- 최종 보고서 생성을 통한 학술 분석



AI 학습을 위한 다양한 포맷 Export
- CSV, JSON, JSONL, OWL 형식으로 Export 가능
진행 단계
기획 및 아키텍처 설계
2025.06.
인터뷰 데이터의 AI 분석 및 지식화 목표 수립
데이터 처리 파이프라인 및 산출물 형식(JSON, OWL 등) 정의
데이터 처리 파이프라인 및 산출물 형식(JSON, OWL 등) 정의
핵심 분석 기능 개발
2025.06.
Gen AI 연동 및 API 키 파일 관리 시스템 구축
키워드 추출, 자동 요약 등 핵심 분석 로직 개발 및 시각화 구현
키워드 추출, 자동 요약 등 핵심 분석 로직 개발 및 시각화 구현
고도화 기능 및 시스템 완성
2025.06.
주제-키워드 관계망(온톨로지) 동적 시각화 및 사용자 제어 기능 개발
종합 분석 보고서 자동 생성 기능 완성
종합 분석 보고서 자동 생성 기능 완성
자체 테스트
2025.06.
엔드투엔드 기능 QA 및 AI 결과물 품질 검증
멀티페이지 앱 구조 적용 등 최종 UI/UX 개선
멀티페이지 앱 구조 적용 등 최종 UI/UX 개선
프로젝트 상세
1) 포트폴리오 소개
- AI 기반 인터뷰 데이터 분석 및 구조화 서비스 개발
2) 작업 범위
1. 솔루션 기획 및 아키텍처 설계: 데이터 처리 파이프라인 및 AI 연동 구조 설계
2. 웹 기반 GUI 개발: Streamlit을 활용한 직관적인 사용자 인터페이스 구현
3. 핵심 분석 로직 개발: Gen AI 기반의 키워드 추출, 2-Track 요약, 관계망 분석 로직 개발
4. 데이터 시각화: 분석 결과(키워드 빈도, 온톨로지)의 동적 시각화 기능 구현
5. 데이터 Export 시스템 구축: CSV, JSON, AI 학습용 데이터셋(JSONL), 지식 그래프(OWL) 등 다양한 형식의 데이터셋 생성 및 다운로드 기능 개발
6. 지원 환경: 반응형 웹 (데스크톱, 태블릿, 모바일 등 다양한 기기에서 최적화된 화면 제공)
3) 주요 업무
1. Gen AI 기반 텍스트 자동 분석 시스템:
- 맥락 기반 키워드 추출: 단순 빈도수를 넘어, 질문의 의도를 파악하여 핵심 개념어를 명사구 형태로 추출합니다.
- 2-Track 자동 요약 생성: 간결한 '핵심 문장(Key Points)' 요약과 부드러운 '서술형(Summary)' 요약을 동시에 제공합니다.
2. 주제-키워드 간 온톨로지(Ontology) 관계망 자동 생성 및 시각화:
- '주제'와 '키워드' 간의 연결 관계를 자동으로 분석하여 네트워크 그래프로 시각화합니다.
- 여러 주제에 공통으로 등장하는 '허브 키워드'를 식별하여 핵심 인사이트를 제공합니다.
3. AI 기반 종합 분석 보고서 자동 생성:
- 정량적 통계(키워드 빈도, 주제 분포)와 온톨로지 분석 결과를 종합하여, 논문에 인용 가능한 수준의 학술적 보고서를 Markdown 형식으로 자동 생성합니다.
4. 다양한 형식의 데이터셋 Export 기능:
- 기본적인 CSV, JSON 형식은 물론, 대규모 AI 모델 학습에 최적화된 JSONL, 그리고 지식 그래프 표준 언어인 OWL 형식의 데이터셋 생성을 지원합니다.
4) 주안점
1. 분석 결과물의 품질 확보: 최신 LLM모델을 도입하여 분석 결과의 정확성과 품질을 극대화했습니다. 특히, 정교한 프롬프트 엔지니어링을 통해 AI가 사용자의 의도에 맞는 결과물을 생성하도록 유도했습니다.
2. 데이터의 확장성 및 재활용성 설계: 분석 결과를 단순히 보여주는 것을 넘어, 향후 맞춤형 AI 모델 개발과 지식 그래프 구축의 기반이 될 수 있도록 JSONL, OWL과 같은 표준 데이터 형식의 Export 기능을 구현하는 데 집중했습니다.
3. 사용자 경험(UX) 중심의 직관적인 UI/UX 설계: 멀티페이지 앱 구조, API 키 외부 파일 관리, 사용자 제어 슬라이더 등을 도입하여, 비개발자도 복잡한 AI 분석 기능을 쉽고 안정적으로 사용할 수 있도록 사용 편의성을 높였습니다.
4. 효율적인 API 관리: 여러 분석 작업을 단일 API 호출로 처리하는 통합 프롬프트 기법과, 작업의 성격에 맞는 최적의 모델을 전략적으로 사용하여 API 할당량 문제를 해결했습니다.
- AI 기반 인터뷰 데이터 분석 및 구조화 서비스 개발
2) 작업 범위
1. 솔루션 기획 및 아키텍처 설계: 데이터 처리 파이프라인 및 AI 연동 구조 설계
2. 웹 기반 GUI 개발: Streamlit을 활용한 직관적인 사용자 인터페이스 구현
3. 핵심 분석 로직 개발: Gen AI 기반의 키워드 추출, 2-Track 요약, 관계망 분석 로직 개발
4. 데이터 시각화: 분석 결과(키워드 빈도, 온톨로지)의 동적 시각화 기능 구현
5. 데이터 Export 시스템 구축: CSV, JSON, AI 학습용 데이터셋(JSONL), 지식 그래프(OWL) 등 다양한 형식의 데이터셋 생성 및 다운로드 기능 개발
6. 지원 환경: 반응형 웹 (데스크톱, 태블릿, 모바일 등 다양한 기기에서 최적화된 화면 제공)
3) 주요 업무
1. Gen AI 기반 텍스트 자동 분석 시스템:
- 맥락 기반 키워드 추출: 단순 빈도수를 넘어, 질문의 의도를 파악하여 핵심 개념어를 명사구 형태로 추출합니다.
- 2-Track 자동 요약 생성: 간결한 '핵심 문장(Key Points)' 요약과 부드러운 '서술형(Summary)' 요약을 동시에 제공합니다.
2. 주제-키워드 간 온톨로지(Ontology) 관계망 자동 생성 및 시각화:
- '주제'와 '키워드' 간의 연결 관계를 자동으로 분석하여 네트워크 그래프로 시각화합니다.
- 여러 주제에 공통으로 등장하는 '허브 키워드'를 식별하여 핵심 인사이트를 제공합니다.
3. AI 기반 종합 분석 보고서 자동 생성:
- 정량적 통계(키워드 빈도, 주제 분포)와 온톨로지 분석 결과를 종합하여, 논문에 인용 가능한 수준의 학술적 보고서를 Markdown 형식으로 자동 생성합니다.
4. 다양한 형식의 데이터셋 Export 기능:
- 기본적인 CSV, JSON 형식은 물론, 대규모 AI 모델 학습에 최적화된 JSONL, 그리고 지식 그래프 표준 언어인 OWL 형식의 데이터셋 생성을 지원합니다.
4) 주안점
1. 분석 결과물의 품질 확보: 최신 LLM모델을 도입하여 분석 결과의 정확성과 품질을 극대화했습니다. 특히, 정교한 프롬프트 엔지니어링을 통해 AI가 사용자의 의도에 맞는 결과물을 생성하도록 유도했습니다.
2. 데이터의 확장성 및 재활용성 설계: 분석 결과를 단순히 보여주는 것을 넘어, 향후 맞춤형 AI 모델 개발과 지식 그래프 구축의 기반이 될 수 있도록 JSONL, OWL과 같은 표준 데이터 형식의 Export 기능을 구현하는 데 집중했습니다.
3. 사용자 경험(UX) 중심의 직관적인 UI/UX 설계: 멀티페이지 앱 구조, API 키 외부 파일 관리, 사용자 제어 슬라이더 등을 도입하여, 비개발자도 복잡한 AI 분석 기능을 쉽고 안정적으로 사용할 수 있도록 사용 편의성을 높였습니다.
4. 효율적인 API 관리: 여러 분석 작업을 단일 API 호출로 처리하는 통합 프롬프트 기법과, 작업의 성격에 맞는 최적의 모델을 전략적으로 사용하여 API 할당량 문제를 해결했습니다.









