행정안전부 데이터정보화담당관이 보유한 본 저작물은 “공공누리” 제4유형: 출처표시 + 상업적 이용금지 + 변경금지 조건에 따라 이용할 수 있습니다.
- 성능 및 비용 효율성에 대한 검증 결과를 기반으로 GPT-4o-mini 모델 선정
- LLM 기반 규칙 결정 후 형식 검증, 통계적 검증, LLM 기반 의미적 검증 수행
- 출력된 검증 결과의 경우 문자열 의미적 일관성 오류, 문자열 잘림 오류, 도메인 허용값 오류 등 정형 데이터뿐만 아니라 비정형 데이터에서도 발생 가능한 오류를 효과적으로 탐지할 수 있음을 확인
- 표준 용어 매핑의 경우 공공데이터 공통 표준 용어 데이터 사용
- 컬럼 명 및 샘플 데이터를 LLM이 보고 분석 항목 도출 및 분석 코드 작성
- 실행 버튼 클릭을 통해 작성된 분석 코드 실행 가능
- 출력된 분석 결과의 경우 시설 종류 별 CCTV 설치 비율으로 초등학교 근처에 CCTV가 가장 많이 설치되어 있음을 확인