프로젝트 배경
공공 및 민간 정책 수립 시 활용 가능한 사회 이슈 기반 수요예측 데이터를 확보하기 위해, 크롤링 기반 텍스트 수집 → 불용어 제거 → 연관 키워드 분석 → 시각화까지의 전처리 자동화 시스템을 구축하였습니다.
실제 사용자(지자체/정책입안자/연구자)가 텍스트마이닝 결과를 직관적으로 확인할 수 있도록 워드클라우드, 키워드 맵, 연관 분석 기반 UI를 구성하였습니다.
실제 사용자(지자체/정책입안자/연구자)가 텍스트마이닝 결과를 직관적으로 확인할 수 있도록 워드클라우드, 키워드 맵, 연관 분석 기반 UI를 구성하였습니다.
프로젝트 성과
• 데이터 구매 비용 절감
데이터마트 외부 구매 대비 약 60% 예산 절감
(텍스트마이닝 전용 DB 연동, 커스텀 사전 관리 구조 도입)
(텍스트마이닝 전용 DB 연동, 커스텀 사전 관리 구조 도입)
• 정책 대응형 키워드 분석 체계 구축
비정형 텍스트 기반 이슈 감지→키워드 그룹화→이벤트별 자동 태깅까지 자동화
• 활용성 중심의 분석 시각화 UI 구축
키워드 연관도 그래프/워드클라우드/분석통계 등을 시각적으로 제공하여 비전문가도 해석 가능
핵심 기능

✅ 포털/블로그/뉴스 등 다채널 크롤링 시스템
• 키워드 기반 수집 채널 지정 가능, 최대 1,000건/일 단위 수집 지원


✅ 사용자 주제 기반 키워드 추출 및 불용어 필터링
• 재학증명서 등 공공 이슈 기반 키워드 연관도 분석 자동 수행



✅ 워드클라우드 및 키워드 관계도 시각화
• 키워드 사용 빈도 및 연관성을 시각화해 직관적 흐름 확인 가능

✅ 데이터 수집/분석 UI 시스템, 데이터 패키징 및 수치 요약
• 수집 리스트 관리, 분석 내역 로그, 기간별 통계 조회 등 관리자 기능 지원
• 핵심 키워드/연관도/빈도 수치 통합 요약 제공
• 핵심 키워드/연관도/빈도 수치 통합 요약 제공
진행 단계
데이터 수요 도출 및 키워드 정의
2024.11.
• 텍스트마이닝 수요 기관 대상 인터뷰 및 분석 대상 키워드 구조 정의
• 주제별 키워드 클러스터링 모델 도출
• 주제별 키워드 클러스터링 모델 도출
크롤링/필터링 시스템 개발 및 적용
2024.12.
• 데이터 수집 시스템 설계 (TEXTOM 연동)
• 불용어 사전 설계 및 품사 기반 필터 적용
• 불용어 사전 설계 및 품사 기반 필터 적용
분석 알고리즘 및 시각화 적용
2025.01.
• 키워드 매핑, 연관 분석 알고리즘 구성
• 워드클라우드, 유사도 맵 등 시각화 결과 생성
• 워드클라우드, 유사도 맵 등 시각화 결과 생성
관리자 시스템 및 수요기관 안내자료 제작
2025.02.
• 결과 분석 UI, 가격 견적 시스템, 다운로드 기능 탑재
• 수요기관 대상 교육자료 제작 및 설명회 진행
• 수요기관 대상 교육자료 제작 및 설명회 진행
프로젝트 상세
• 포트폴리오 소개
본 프로젝트는 지자체 및 공공기관의 수요예측을 돕기 위해 설계된 데이터 기반 정책지원 시스템입니다.
일반 텍스트 자료로부터 사회적 관심사를 자동으로 추출하고 시각화하며, 이를 통해 향후 정책 수립의 참고 지표로 활용 가능하도록 구현하였습니다.
이를 통해 인감증명서 온라인 발급 수요의 타당성을 확인, 인감증명서 온라인 발급이 진행되었습니다.
• 작업 범위
• 기획: 크롤링 대상/범위 선정, 사용자 흐름 설계
• 디자인: 데이터 분석결과 시각화 UI 설계
• 개발: 크롤링→불용어 제거→시각화→결과 다운로드 전과정 자동화
• 기타: 수요기관 교육자료 제작, 시스템 이용가이드 제공
• 주요 기능 및 업무
• 사용자 키워드 기반 데이터 수집 → 전처리 → 분석 → 시각화 자동화
• 연관도, 빈도, 시계열 변화 등을 기반으로 키워드 맵 자동 생성
• 수집량, 기간, 키워드 수 등 기준에 따른 자동 요금 계산 시스템 구축
• 관련 증명서, 공공 서류 키워드(재학증명서, 가족관계증명서 등) 중심 분석
• 주안점
• 공공기관/소상공인/교육기관 등 다양한 수요처에 적합한 인터페이스 구성
• 불필요한 키워드 제거 및 정책용 주제군 중심의 필터링 체계 적용
• 후속 활용(예: 공모사업 지원, 증빙자료 구성)을 고려한 결과 포맷 구성
본 프로젝트는 지자체 및 공공기관의 수요예측을 돕기 위해 설계된 데이터 기반 정책지원 시스템입니다.
일반 텍스트 자료로부터 사회적 관심사를 자동으로 추출하고 시각화하며, 이를 통해 향후 정책 수립의 참고 지표로 활용 가능하도록 구현하였습니다.
이를 통해 인감증명서 온라인 발급 수요의 타당성을 확인, 인감증명서 온라인 발급이 진행되었습니다.
• 작업 범위
• 기획: 크롤링 대상/범위 선정, 사용자 흐름 설계
• 디자인: 데이터 분석결과 시각화 UI 설계
• 개발: 크롤링→불용어 제거→시각화→결과 다운로드 전과정 자동화
• 기타: 수요기관 교육자료 제작, 시스템 이용가이드 제공
• 주요 기능 및 업무
• 사용자 키워드 기반 데이터 수집 → 전처리 → 분석 → 시각화 자동화
• 연관도, 빈도, 시계열 변화 등을 기반으로 키워드 맵 자동 생성
• 수집량, 기간, 키워드 수 등 기준에 따른 자동 요금 계산 시스템 구축
• 관련 증명서, 공공 서류 키워드(재학증명서, 가족관계증명서 등) 중심 분석
• 주안점
• 공공기관/소상공인/교육기관 등 다양한 수요처에 적합한 인터페이스 구성
• 불필요한 키워드 제거 및 정책용 주제군 중심의 필터링 체계 적용
• 후속 활용(예: 공모사업 지원, 증빙자료 구성)을 고려한 결과 포맷 구성

NIA 정부 문서 온라인 발급 관련 수요 조사 포트폴리오