Skip to content
@Public-Data-Quality

Public-Data-Quality

LLM 기반 공공데이터 품질 관리 및 분석 자동화 시스템

LLM 기반 공공데이터 품질 관리 및 분석 자동화 시스템

Image
행정안전부 데이터정보화담당관이 보유한 본 저작물은 “공공누리” 제4유형: 출처표시 + 상업적 이용금지 + 변경금지 조건에 따라 이용할 수 있습니다.

파이프라인

Image

주요 기능

초기 화면

Image
  • 성능 및 비용 효율성에 대한 검증 결과를 기반으로 GPT-4o-mini 모델 선정

검증 결과

Image
  • LLM 기반 규칙 결정 후 형식 검증, 통계적 검증, LLM 기반 의미적 검증 수행
  • 출력된 검증 결과의 경우 문자열 의미적 일관성 오류, 문자열 잘림 오류, 도메인 허용값 오류 등 정형 데이터뿐만 아니라 비정형 데이터에서도 발생 가능한 오류를 효과적으로 탐지할 수 있음을 확인

데이터 미리보기

Image
  • 표준 용어 매핑의 경우 공공데이터 공통 표준 용어 데이터 사용

추천 데이터 분석

Image
  • 컬럼 명 및 샘플 데이터를 LLM이 보고 분석 항목 도출 및 분석 코드 작성
  • 실행 버튼 클릭을 통해 작성된 분석 코드 실행 가능
  • 출력된 분석 결과의 경우 시설 종류 별 CCTV 설치 비율으로 초등학교 근처에 CCTV가 가장 많이 설치되어 있음을 확인

Popular repositories Loading

  1. Public-Data-Quality-BE Public-Data-Quality-BE Public

    Python

  2. Public-Data-Quality-FE Public-Data-Quality-FE Public

    JavaScript

  3. .github .github Public

Repositories

Showing 3 of 3 repositories

Top languages

Loading…

Most used topics

Loading…