SlideShare a Scribd company logo
2014 국가DB사업 관계기관 합동교육
LOD 구축 공정 가이드라인
거대한 정 보 덩 어 리
웹을
거대한 가 능 성 덩 어 웹으로리
거대한 가 능 성 덩 어 웹을리
누구나 활 용 할 수 있
데이터 웹으로 만들기 위한 유연한 표준
는
Web of
Data
LOD 구축 공정 가이드라인
• 추진배경
– 세계 각 국의 열린 정부(Gov2.0) 정책과 데이터개방, 새정부의 정부3.0
정책 추진으로 공공데이터에 대한 개방, 활용을 위한 노력 가속
– 시맨틱 웹, 링크드 데이터의 확산으로 기존 문서 중심의 웹에 데이터
중심의 새로운 생태계 구성을 위한 세계적인 노력 확산
– 이를 구현하기 위한 새로운 기술 표준인 Linked Data의 이해와 공유
필요
– 기존 데이터베이스구축방법론은 디지털화 자료와 메타데이터 구축에
초점을 두고 있어 링크드 데이터에 대한 새로운 가이드라인 필요
• 목적
– 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데
이터를 웹에 발행하고자 하는 기관이나 사업자들에게 표준적인 링크드
데이터 발행 공정을 제공함
링크드 데이터 구축 사업 추진에 실제적으로 적용 가능한 가이드라인 개발
체계적이고 효율적인 구축 과정 제공
일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고
• 추진방법
– 전문가와 현장 담당자를 중심으로 한 작업반(Working Group)을 중심
으로 가이드라인 작성
• 범위
– 링크드 데이터 구축을 위한 사업수행에 직접적으로 활용이 가능한 작
업공정을 중심으로 한 가이드라인 개발에 초점
• 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이터
를 웹에 발행하고자 하는 기관이나 사업자들에게 표준적인 링크드 데이터
발행 공정을 제공함
• 추진일정
– 내용구성 : 2013년 10월 ~ 2014년 2월
– 출판 : 2014년 4월
• 주요 고려사항
– 기존의 데이터베이스구축방법론에 익숙한 이용자 계층을 고려하여 기
존 구성방식을 유지
– 가장 일반적인 개발방법(온톨로지 개발)의 채용
– 링크드 데이터 발행에 실제 현장에서 적용하고 있는 방법의 채용
• 다운로드 : Koea DB 자료실
• http://koreadb.data.go.kr/
01.개요
추진배경, 가이드 구성, 기대효과 설명
02.링크드데이터 구축공정
전체, 세부 공정 절차도 제공
03.태스크별 상세내용
준비, 구축 및 발행단계별 상세 수행내용 제공
04.산출물 상세내용
단계별 산출물 형식 및 예시 제공
부록
링크드 데이터 선정기준, URI 생성 관리지침, 발행 후
체크리스트
3 2 1 C
단계 세그먼트 태스크 원천자료유형
• 현재 가이드라인에서는 원천자료유형 구분이 공통과정(Common)으로 통일됨.
• 향후 링크드 데이터 사업의 확산에 발맞추어 다양한 데이터유형, 다양한 조직
적 특성 등이 반영될 경우 공정 세구분 추진
110C 현황조사
120C 구축대상선정
130C 계획수립
210C 실행계획
310C 명세화
410C 용어 설계
510C 온톨로지 설계
610C 데이터변환(RDF화)
710C 저장 및 발행
720C 등록
220C 원천데이터 준비
230C 원천데이터 반입
준비단계 구축 및 발행 단계
외부데이터는 현재 변환 대상 데이터가 다른 기관과 연계되어 있는 경우 혹은 본 사업
의 추진 대상이 2개 이상 기관간의 공동추진인 경우의 데이터로 새로운 외부 데이터
와의 인터 링킹을 의미하지 않음
세그먼트 태스크번호 태스크정의 주요활동 산출물
현황조사
110C
111C 요구사항분석
 사용자요구사항분석
– RFP,사업수행계획서의명시된요구사항체계화
• 요구사항분석서
112C 기초조사
 내부데이터분석
– 링크드데이터에적합한내부자원파악(데이터형
태,분류등)
 외부데이터분석
– 연계가능한도메인에대한고려(적합성,협조가능,
공개여부등)
• 기초현황조사서
• 원천데이터목록
1. 준비단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
구축
대상선정
120C
121C 기준정의
• 링크드데이터구축기준정의
– 링크드데이터구축대상데이터선정기준마련
– 데이터발행을위한구축및공개범위정의
122C
구축대상자료
세부조사
• 대상데이터상세조사
– 선정기준표
– 구축대상데이터에대한저작권조사
– 원천데이터의형태조사
– 원천데이터내사용가능한메타데이터의특징조
사
• 선정데이터조사서
123C
구축대상자료
선정
• 구축대상자료선정
– 구축및연계대상및건수확정
124C 구축방안정의
• 구축대상자료에대한구축방안정의
– 링크드데이터구축및서비스방향설정
– 데이터모델링가이드확립
• 구축계획서
1. 준비단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
계획수립
130C
131C 요건정의
 링크드데이터구축및서비스시고려사항및요건정
의
– 원천데이터입수시고려사항및요건정의
– 구축대상의형태및포맷정의
– 의미관계모델링설계를위한제약및규칙정의
– 데이터변환및연계시고려해야할사항을정의
– 자료검사및품질(원천데이터에대한)요건정의
– 서비스를위한저작권처리방안정의
구축계획서
132C 공정설계
 구축대상별상세공정설계
– 자료준비및실행단계에대한계획수립
– 구축각단계에대한태스크및작업내용정의
– 단계별공정산출물정의
– 각단계별사용툴(및장비)선정
공정도
133C 시범 데이터 구축
• 시범 데이터 구축
– 시범 구축 대상 데이터 선정
– 시범 데이터 자료 준비
– 모델링 가이드에 따른 테스트 모델링 수행
– 시범 데이터 결과물에 따른 모델링 지침 및
산출물 보완
– 실 구축 중 발생 예상 문제점 정의 및 해결방
안 준비(원천데이터의 구조적, 데이터 양적
문제로 변환 후 재활용, 연계 등에 문제 발생
가능성 파악)
시범데이터 구축
보고서
1. 준비단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
실행계획
210C
211C
구축대상데이터반
출계획수립
 구축대상데이터반출에따른계획안정의
– 구축대상데이터보유기관및담당자와반출에따
른협의진행
– 구축대상데이터반출에따른시기,방법,조건에대
한정의
– 반출에따른지침확립
구축대상데이터반
출지침서
212C 연계 계획수립
 외부데이터연계를위한계획수립
– 연계를위한외부링크드데이터목록정의
– 대상데이터의건수및내용확인
– 외부데이터연계를위한모델링가이드보완
원천데이터
준비
220C
221C
구축 대상 데이터 목
록작성
 원천데이터목록작성
– 반입되는원천데이터에대한목록작성
– 데이터에대한중복성검토
– 관리번호(제어번호)부여
구축대상데이터목
록
222C
구축 대상 데이터 이
관점검
 구축대상데이터이관점검
– 구축대상데이터보수,구축대상데이터목록변경
및대체
1. 준비단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
원천데이터
반입
230C
231C 데이터반입
 반입데이터확인
– 구축대상목표데이터목록표에근거한반입자료량
확인
– 미반입,추가반입될데이터에대한확인 인수인계증
232C 추가반입
• 추가반입작업
– 반입시누락되거나잘못된자료에대한추가반입
1. 준비단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
명세화
310C
311C 목적및범위설정  링크드데이터로구축하고자하는목적과범위설정
• 구축명세서
312C 도메인기술  해당도메인의특징등을상세기술
313C 시나리오구성  관리자,이용자시나리오구성
314C
적합질의
(competency
questions)구성
 추론 등 링크드 데이터로 변환하는 시스템이 응답해야
하는적합질의를구성
2. 구축 및 발행 단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
용어설계
410C
411C 기존체계분석
 데이터모델,온톨로지현황조사
• 기구축된표준데이터모델,온톨로지확인및재활용확
인
– 기존에존재하는온톨로지,어휘집분석
온톨로지,
어휘 분석서
412C 어휘분석
 구축대상데이터가사용하고있는어휘분석
– 기관에서정의한어휘사용여부조사
– 표준어휘집사용여부조사
413C 용어선정 • 변환대상용어선정
414C 표준용어집구축
 국내외표준용어집선정
– 원천데이터를가장잘표현할수있는용어집선정
– 기관에서정의한어휘선정
표준 용어집
415C 용어매핑
 원천데이터용어를표준용어로매핑
– 매핑규칙구축
2. 구축 및 발행 단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
온톨로지설계
510C
511C 모델정의  도메인개념모델정의 개념 모델 명세서
512C 계층화  클래스계층화상향식/하향식/조합식
온톨로지모델 명세
서513C 관계정의  속성,관계정의
514C
제약설계
(restriction)
 클래스제약(classrestrictions)설계
 속성제약(propertyrestrictions)설계
2. 구축 및 발행 단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
데이터변환
(RDF화)
610C
611C 매핑규칙점검
 원천데이터와 변환대상 데이터 요소 간의 매핑 규칙 점
검
612C 변환규칙점검  변환기를통해변환될변환규칙점검
613C 데이터변환  데이터변환수행
614C 인스턴스생성  인스턴스생성
615C 일관성확인  온톨로지일관성확인
616C 유효성검증
 변환데이터품질검증
 적합질의유효성검증
데이터 검증서
2. 구축 및 발행 단계
세그먼트 태스크번호 태스크정의 주요활동 산출물
저장및발행
710C
711C
데이터 저장방식
결정
 데이터저장방식결정
– 관계형DB,RDF저장소,file시스템
712C 데이터저장  데이터저장
713C
데이터 발행 방식
결정
 데이터발행방식결정
– RDB2RDF(D2R)
– RDFa활용CMS
– 링크드데이터인터페이스
– 웹서버(WebServer)
714C 데이터발행 • 데이터발행 발행명세서
등록
720C
721C  추후국내데이터등록플랫폼구축후추가예정
2. 구축 및 발행 단계
• 공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가?
• 데이터에 대한 저작권 문제는 없는가?
• 개인정보에 위배되지 않는가?
• 구축 후 오픈 라이선스(Creative Commons와 같은)로 활용이 가능한가?
• 데이터 제공자는 참조사이트를 보유하고 있는가?
• 데이터의 확보가 가능한가?
• 데이터 오픈에 대한 정책을 보유하고 있는가?
Check Point: 누구나 자유롭게 쓸 수 있는 형태의 데이터를 가지고 있고, 이를 뒷받침해
줄 수 있는 성문화된 정책이 존재하는가?
Check Point: URI가 나타내는 객체, 개념, 관계가 서비스 목적에 부합하고 누구나 쉽게
이해할 수 있는 분류방식과 추측이 가능한 형태인가?
Check Point: 웹에서 제공하는 서비스로서 불편함이 없고, 데이터를 활용하기에 충분하고
안정적인 정보를 제공하고 있는가?
• 가이드라인의 주 사용자 확대 설정
– 링크드 데이터 사업을 준비하는 주관기관, 혹은 사업담당자가 사업 준
비 단계부터 참고할 수 있는 단계 추가 필요
– 링크드 데이터 구축 방법 외 하나의 정보화 사업으로써 특징을 반영할
수 있는 단계 추가 필요
– 기존 데이터베이스 구축 가이드라인에 익숙한 사용자(고착화된 업무
처리 절차, 구체적인 산출물과 업무처리 절차 등)임을 고려
• 가이드라인은 사업이 계속되고 데이터 발굴작업 등이 계속되면서
각 데이터의 특성이나 보유 기관의 특성이 지속적으로 반영되고 수
정, 업데이트 되는 과정 필요
– 매년 사업종료 후 내용 수정 필요, 현장에서 문제점등을 즉시 파악할
수 있도록 소통채널 개설 필요)
LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인

More Related Content

PPTX
SPARQL Cheat Sheet
PDF
Linked Open Data Tutorial
PPTX
LOD (linked open data) part 2 lod 구축과 현황
PPTX
문화유산 정보와 시맨틱웹 응용
PDF
Knowledge Graphs as a Pillar to AI
PPTX
LOD(linked open data) part 1 lod 란 무엇인가
PPTX
Linked Data 4 principles
PPTX
RDF 개념 및 구문 소개
SPARQL Cheat Sheet
Linked Open Data Tutorial
LOD (linked open data) part 2 lod 구축과 현황
문화유산 정보와 시맨틱웹 응용
Knowledge Graphs as a Pillar to AI
LOD(linked open data) part 1 lod 란 무엇인가
Linked Data 4 principles
RDF 개념 및 구문 소개

What's hot (20)

PPTX
Towards an Open Research Knowledge Graph
PPT
Understanding RDF: the Resource Description Framework in Context (1999)
PPTX
RDF와 Graph의 이해 및 오라클 Spartial&Graph 소개
PDF
LODAC 2017 Linked Open Data Workshop
PDF
SPARQL 사용법
PDF
Introduction to Knowledge Graphs and Semantic AI
PPTX
RDF Data Model
PDF
Building Knowledge Graphs in 10 steps
PDF
An Introduction to SPARQL
PDF
FIWARE Global Summit - Idra: A Solution for Open Data Interoperability
PDF
Introduction to Knowledge Graphs: Data Summit 2020
PDF
Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 -
PDF
Slides: Knowledge Graphs vs. Property Graphs
PDF
Natural Language Processing with Graph Databases and Neo4j
PPT
SPARQL Tutorial
PDF
Linked Data Tutorial
PDF
RDF 해설서
PPTX
ShEx vs SHACL
PPTX
PiCANet, Pytorch Implementation (Korean)
PPTX
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
Towards an Open Research Knowledge Graph
Understanding RDF: the Resource Description Framework in Context (1999)
RDF와 Graph의 이해 및 오라클 Spartial&Graph 소개
LODAC 2017 Linked Open Data Workshop
SPARQL 사용법
Introduction to Knowledge Graphs and Semantic AI
RDF Data Model
Building Knowledge Graphs in 10 steps
An Introduction to SPARQL
FIWARE Global Summit - Idra: A Solution for Open Data Interoperability
Introduction to Knowledge Graphs: Data Summit 2020
Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 -
Slides: Knowledge Graphs vs. Property Graphs
Natural Language Processing with Graph Databases and Neo4j
SPARQL Tutorial
Linked Data Tutorial
RDF 해설서
ShEx vs SHACL
PiCANet, Pytorch Implementation (Korean)
[오원석 Kswc2010]데이터의 가치를 높이는 linked data
Ad

Similar to LOD 구축 공정 가이드라인 (20)

PDF
링크드 데이터 구축 공정 가이드V1.0
PPTX
고려대 교육정보서비스 시스템 4-5주
PDF
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
PDF
Zum인터넷 big data 활용사례 김우승연구소장
PDF
데이터드리븐 DX 추진방안_202306.pdf
PDF
빅데이터플랫폼구축_개방형플랫폼중심.pdf
PPTX
도메인주도설계
PDF
빅 데이터, 새로운 통찰력
PDF
2014 한국 링크드 데이터 사례집
PPT
Big Data Overview
PDF
도서관 Linked Open Data의 필요성
PDF
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
PPTX
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
PDF
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
PPTX
[경북] I'mcloud information
PPTX
빅데이터의 이해
PDF
Statistics and linked data
PPT
공공데이터 개방현황 및 포털 발전방향
PPTX
웹보메트릭스와 계량정보학01 2
PDF
Pharmaceutical Industry and Linked Data
링크드 데이터 구축 공정 가이드V1.0
고려대 교육정보서비스 시스템 4-5주
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
Zum인터넷 big data 활용사례 김우승연구소장
데이터드리븐 DX 추진방안_202306.pdf
빅데이터플랫폼구축_개방형플랫폼중심.pdf
도메인주도설계
빅 데이터, 새로운 통찰력
2014 한국 링크드 데이터 사례집
Big Data Overview
도서관 Linked Open Data의 필요성
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
[경북] I'mcloud information
빅데이터의 이해
Statistics and linked data
공공데이터 개방현황 및 포털 발전방향
웹보메트릭스와 계량정보학01 2
Pharmaceutical Industry and Linked Data
Ad

More from Hansung University (20)

PDF
AI에게 이유를 묻다: 설명 가능한 인공지능(XAI: eXplainable AI)
PDF
Open Science - 열린 학술 저작, 공유 생태계
PDF
데이터 활용과 가치 보전 관점에서 공공문서의 기술적 요건
PDF
데이터베이스활용기술전망
PDF
도서관 및 관련기관의 DMP(Data Management Plan) 지원 서비스(pre-print)
PDF
Linked Open Data
PPTX
2014 odb 한국현황
PDF
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
PDF
데이터베이스활용기술전망
PDF
digital archiving
PDF
library linked data
PDF
LOD를 말하다: Europeana, BBC, LinkedUp
PDF
국립중앙도서관 RDA 실행전략 보고서
PPTX
PDF
도서관 분야의 링크드 데이터 구축 동향
PPTX
링크드 데이터 사례
PPTX
도서관 링크드 데이터 동향(KISTI)
PPTX
도서관은 웹에 존재하는가
PPTX
국립중앙도서관 RDA 실행전략
PPTX
국가서지정보 Open Public Data Platform 구축
AI에게 이유를 묻다: 설명 가능한 인공지능(XAI: eXplainable AI)
Open Science - 열린 학술 저작, 공유 생태계
데이터 활용과 가치 보전 관점에서 공공문서의 기술적 요건
데이터베이스활용기술전망
도서관 및 관련기관의 DMP(Data Management Plan) 지원 서비스(pre-print)
Linked Open Data
2014 odb 한국현황
개방형 데이터(Open Data) 평가를 위한 오픈데이터 측정지표 현황 분석
데이터베이스활용기술전망
digital archiving
library linked data
LOD를 말하다: Europeana, BBC, LinkedUp
국립중앙도서관 RDA 실행전략 보고서
도서관 분야의 링크드 데이터 구축 동향
링크드 데이터 사례
도서관 링크드 데이터 동향(KISTI)
도서관은 웹에 존재하는가
국립중앙도서관 RDA 실행전략
국가서지정보 Open Public Data Platform 구축

LOD 구축 공정 가이드라인

  • 3. 거대한 정 보 덩 어 리 웹을 거대한 가 능 성 덩 어 웹으로리
  • 4. 거대한 가 능 성 덩 어 웹을리 누구나 활 용 할 수 있 데이터 웹으로 만들기 위한 유연한 표준 는
  • 7. • 추진배경 – 세계 각 국의 열린 정부(Gov2.0) 정책과 데이터개방, 새정부의 정부3.0 정책 추진으로 공공데이터에 대한 개방, 활용을 위한 노력 가속 – 시맨틱 웹, 링크드 데이터의 확산으로 기존 문서 중심의 웹에 데이터 중심의 새로운 생태계 구성을 위한 세계적인 노력 확산 – 이를 구현하기 위한 새로운 기술 표준인 Linked Data의 이해와 공유 필요 – 기존 데이터베이스구축방법론은 디지털화 자료와 메타데이터 구축에 초점을 두고 있어 링크드 데이터에 대한 새로운 가이드라인 필요
  • 8. • 목적 – 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데 이터를 웹에 발행하고자 하는 기관이나 사업자들에게 표준적인 링크드 데이터 발행 공정을 제공함 링크드 데이터 구축 사업 추진에 실제적으로 적용 가능한 가이드라인 개발 체계적이고 효율적인 구축 과정 제공 일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고
  • 9. • 추진방법 – 전문가와 현장 담당자를 중심으로 한 작업반(Working Group)을 중심 으로 가이드라인 작성 • 범위 – 링크드 데이터 구축을 위한 사업수행에 직접적으로 활용이 가능한 작 업공정을 중심으로 한 가이드라인 개발에 초점 • 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이터 를 웹에 발행하고자 하는 기관이나 사업자들에게 표준적인 링크드 데이터 발행 공정을 제공함 • 추진일정 – 내용구성 : 2013년 10월 ~ 2014년 2월 – 출판 : 2014년 4월
  • 10. • 주요 고려사항 – 기존의 데이터베이스구축방법론에 익숙한 이용자 계층을 고려하여 기 존 구성방식을 유지 – 가장 일반적인 개발방법(온톨로지 개발)의 채용 – 링크드 데이터 발행에 실제 현장에서 적용하고 있는 방법의 채용
  • 11. • 다운로드 : Koea DB 자료실 • http://koreadb.data.go.kr/ 01.개요 추진배경, 가이드 구성, 기대효과 설명 02.링크드데이터 구축공정 전체, 세부 공정 절차도 제공 03.태스크별 상세내용 준비, 구축 및 발행단계별 상세 수행내용 제공 04.산출물 상세내용 단계별 산출물 형식 및 예시 제공 부록 링크드 데이터 선정기준, URI 생성 관리지침, 발행 후 체크리스트
  • 12. 3 2 1 C 단계 세그먼트 태스크 원천자료유형 • 현재 가이드라인에서는 원천자료유형 구분이 공통과정(Common)으로 통일됨. • 향후 링크드 데이터 사업의 확산에 발맞추어 다양한 데이터유형, 다양한 조직 적 특성 등이 반영될 경우 공정 세구분 추진
  • 13. 110C 현황조사 120C 구축대상선정 130C 계획수립 210C 실행계획 310C 명세화 410C 용어 설계 510C 온톨로지 설계 610C 데이터변환(RDF화) 710C 저장 및 발행 720C 등록 220C 원천데이터 준비 230C 원천데이터 반입 준비단계 구축 및 발행 단계
  • 14. 외부데이터는 현재 변환 대상 데이터가 다른 기관과 연계되어 있는 경우 혹은 본 사업 의 추진 대상이 2개 이상 기관간의 공동추진인 경우의 데이터로 새로운 외부 데이터 와의 인터 링킹을 의미하지 않음 세그먼트 태스크번호 태스크정의 주요활동 산출물 현황조사 110C 111C 요구사항분석  사용자요구사항분석 – RFP,사업수행계획서의명시된요구사항체계화 • 요구사항분석서 112C 기초조사  내부데이터분석 – 링크드데이터에적합한내부자원파악(데이터형 태,분류등)  외부데이터분석 – 연계가능한도메인에대한고려(적합성,협조가능, 공개여부등) • 기초현황조사서 • 원천데이터목록 1. 준비단계
  • 15. 세그먼트 태스크번호 태스크정의 주요활동 산출물 구축 대상선정 120C 121C 기준정의 • 링크드데이터구축기준정의 – 링크드데이터구축대상데이터선정기준마련 – 데이터발행을위한구축및공개범위정의 122C 구축대상자료 세부조사 • 대상데이터상세조사 – 선정기준표 – 구축대상데이터에대한저작권조사 – 원천데이터의형태조사 – 원천데이터내사용가능한메타데이터의특징조 사 • 선정데이터조사서 123C 구축대상자료 선정 • 구축대상자료선정 – 구축및연계대상및건수확정 124C 구축방안정의 • 구축대상자료에대한구축방안정의 – 링크드데이터구축및서비스방향설정 – 데이터모델링가이드확립 • 구축계획서 1. 준비단계
  • 16. 세그먼트 태스크번호 태스크정의 주요활동 산출물 계획수립 130C 131C 요건정의  링크드데이터구축및서비스시고려사항및요건정 의 – 원천데이터입수시고려사항및요건정의 – 구축대상의형태및포맷정의 – 의미관계모델링설계를위한제약및규칙정의 – 데이터변환및연계시고려해야할사항을정의 – 자료검사및품질(원천데이터에대한)요건정의 – 서비스를위한저작권처리방안정의 구축계획서 132C 공정설계  구축대상별상세공정설계 – 자료준비및실행단계에대한계획수립 – 구축각단계에대한태스크및작업내용정의 – 단계별공정산출물정의 – 각단계별사용툴(및장비)선정 공정도 133C 시범 데이터 구축 • 시범 데이터 구축 – 시범 구축 대상 데이터 선정 – 시범 데이터 자료 준비 – 모델링 가이드에 따른 테스트 모델링 수행 – 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완 – 실 구축 중 발생 예상 문제점 정의 및 해결방 안 준비(원천데이터의 구조적, 데이터 양적 문제로 변환 후 재활용, 연계 등에 문제 발생 가능성 파악) 시범데이터 구축 보고서 1. 준비단계
  • 17. 세그먼트 태스크번호 태스크정의 주요활동 산출물 실행계획 210C 211C 구축대상데이터반 출계획수립  구축대상데이터반출에따른계획안정의 – 구축대상데이터보유기관및담당자와반출에따 른협의진행 – 구축대상데이터반출에따른시기,방법,조건에대 한정의 – 반출에따른지침확립 구축대상데이터반 출지침서 212C 연계 계획수립  외부데이터연계를위한계획수립 – 연계를위한외부링크드데이터목록정의 – 대상데이터의건수및내용확인 – 외부데이터연계를위한모델링가이드보완 원천데이터 준비 220C 221C 구축 대상 데이터 목 록작성  원천데이터목록작성 – 반입되는원천데이터에대한목록작성 – 데이터에대한중복성검토 – 관리번호(제어번호)부여 구축대상데이터목 록 222C 구축 대상 데이터 이 관점검  구축대상데이터이관점검 – 구축대상데이터보수,구축대상데이터목록변경 및대체 1. 준비단계
  • 18. 세그먼트 태스크번호 태스크정의 주요활동 산출물 원천데이터 반입 230C 231C 데이터반입  반입데이터확인 – 구축대상목표데이터목록표에근거한반입자료량 확인 – 미반입,추가반입될데이터에대한확인 인수인계증 232C 추가반입 • 추가반입작업 – 반입시누락되거나잘못된자료에대한추가반입 1. 준비단계
  • 19. 세그먼트 태스크번호 태스크정의 주요활동 산출물 명세화 310C 311C 목적및범위설정  링크드데이터로구축하고자하는목적과범위설정 • 구축명세서 312C 도메인기술  해당도메인의특징등을상세기술 313C 시나리오구성  관리자,이용자시나리오구성 314C 적합질의 (competency questions)구성  추론 등 링크드 데이터로 변환하는 시스템이 응답해야 하는적합질의를구성 2. 구축 및 발행 단계
  • 20. 세그먼트 태스크번호 태스크정의 주요활동 산출물 용어설계 410C 411C 기존체계분석  데이터모델,온톨로지현황조사 • 기구축된표준데이터모델,온톨로지확인및재활용확 인 – 기존에존재하는온톨로지,어휘집분석 온톨로지, 어휘 분석서 412C 어휘분석  구축대상데이터가사용하고있는어휘분석 – 기관에서정의한어휘사용여부조사 – 표준어휘집사용여부조사 413C 용어선정 • 변환대상용어선정 414C 표준용어집구축  국내외표준용어집선정 – 원천데이터를가장잘표현할수있는용어집선정 – 기관에서정의한어휘선정 표준 용어집 415C 용어매핑  원천데이터용어를표준용어로매핑 – 매핑규칙구축 2. 구축 및 발행 단계
  • 21. 세그먼트 태스크번호 태스크정의 주요활동 산출물 온톨로지설계 510C 511C 모델정의  도메인개념모델정의 개념 모델 명세서 512C 계층화  클래스계층화상향식/하향식/조합식 온톨로지모델 명세 서513C 관계정의  속성,관계정의 514C 제약설계 (restriction)  클래스제약(classrestrictions)설계  속성제약(propertyrestrictions)설계 2. 구축 및 발행 단계
  • 22. 세그먼트 태스크번호 태스크정의 주요활동 산출물 데이터변환 (RDF화) 610C 611C 매핑규칙점검  원천데이터와 변환대상 데이터 요소 간의 매핑 규칙 점 검 612C 변환규칙점검  변환기를통해변환될변환규칙점검 613C 데이터변환  데이터변환수행 614C 인스턴스생성  인스턴스생성 615C 일관성확인  온톨로지일관성확인 616C 유효성검증  변환데이터품질검증  적합질의유효성검증 데이터 검증서 2. 구축 및 발행 단계
  • 23. 세그먼트 태스크번호 태스크정의 주요활동 산출물 저장및발행 710C 711C 데이터 저장방식 결정  데이터저장방식결정 – 관계형DB,RDF저장소,file시스템 712C 데이터저장  데이터저장 713C 데이터 발행 방식 결정  데이터발행방식결정 – RDB2RDF(D2R) – RDFa활용CMS – 링크드데이터인터페이스 – 웹서버(WebServer) 714C 데이터발행 • 데이터발행 발행명세서 등록 720C 721C  추후국내데이터등록플랫폼구축후추가예정 2. 구축 및 발행 단계
  • 24. • 공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가? • 데이터에 대한 저작권 문제는 없는가? • 개인정보에 위배되지 않는가? • 구축 후 오픈 라이선스(Creative Commons와 같은)로 활용이 가능한가? • 데이터 제공자는 참조사이트를 보유하고 있는가? • 데이터의 확보가 가능한가? • 데이터 오픈에 대한 정책을 보유하고 있는가? Check Point: 누구나 자유롭게 쓸 수 있는 형태의 데이터를 가지고 있고, 이를 뒷받침해 줄 수 있는 성문화된 정책이 존재하는가?
  • 25. Check Point: URI가 나타내는 객체, 개념, 관계가 서비스 목적에 부합하고 누구나 쉽게 이해할 수 있는 분류방식과 추측이 가능한 형태인가?
  • 26. Check Point: 웹에서 제공하는 서비스로서 불편함이 없고, 데이터를 활용하기에 충분하고 안정적인 정보를 제공하고 있는가?
  • 27. • 가이드라인의 주 사용자 확대 설정 – 링크드 데이터 사업을 준비하는 주관기관, 혹은 사업담당자가 사업 준 비 단계부터 참고할 수 있는 단계 추가 필요 – 링크드 데이터 구축 방법 외 하나의 정보화 사업으로써 특징을 반영할 수 있는 단계 추가 필요 – 기존 데이터베이스 구축 가이드라인에 익숙한 사용자(고착화된 업무 처리 절차, 구체적인 산출물과 업무처리 절차 등)임을 고려 • 가이드라인은 사업이 계속되고 데이터 발굴작업 등이 계속되면서 각 데이터의 특성이나 보유 기관의 특성이 지속적으로 반영되고 수 정, 업데이트 되는 과정 필요 – 매년 사업종료 후 내용 수정 필요, 현장에서 문제점등을 즉시 파악할 수 있도록 소통채널 개설 필요)