정유진님의 “웹2.0 기획론’ 책을 보다가 좋은 서비스를 제공하기 위한 데이터는 어때야 하는지에 대한 정리가 잘 되어 있어서 인용해 본다.
- 커버리지(coverage)
분야의 내용을 빠짐없이 포함하는 데이터인가?
ex) 산 데이터: 전국의 산이 모두 포함되어 있는가?
영화 데이터: 국내외 모든 영화 정보가 포함되어 있는가?
- 중복없음
같은 데이터가 중복해서 존재하지 않는가?
- 정확성/신뢰성
정확한 데이터인가? 신뢰할 수 있는가?
비정형의 데이터를 어떻게 정제할 것인가?
부정확한 데이터를 어떻게 판별하고 걸러낼 것인가?
- 최신성
최신의 데이터인가?
수정.삭제되거나 새로 만들어진 내용은 반영되는가?
- 데이터 운영
데이터 업그레이를 통해 최근의 살아있는 데이터를 유지, 보수할 수 있는 프로세스가 갖추어져 있는가?
사용자의 데이터 관련 C/S는 어떻게, 어떤 프로세스로 대응할 것인가?
어뷰즈(abuse) 데이터를 어떻게 판별하고, 걸러낼 것인가?
- 저작권
저작권이 분명한 데이터인가?
데이터의 소유권을 어떻게 확인하고 관리할 것인가?
사용자가 만든 데이터에 대해 명확한 저작권 정책을 갖추고 있는가?
웹2.0 시대 새로이 추가되는 요건들
- 메타데이터
데이터와 관련된 메타데이터가 잘 구축되어, 사람들이 다양한 방법으로 데이터를 찾을 수 있느가?
- 활용성
많은 사람에게 데이터가 여러 컨텍스트에서 사용될 수 있느가?
다른 애플리케이션이나 서비스에서 활용될 수 있는가?
데이터에서 필요한 부분만 떼어내서 활용할 수 있는가?
- 인기도
얼마나 많은 사람들이 필요로 하는 데이터인가?
얼마나 인기 있는 데이터인가?
데이터의 인기도가 잘 표현되고 있는가?
- 포맷
표준 포맷으로 제공되어 외부 서비스에서 자유롭게 활용할 수 있는가?
공통의 기준에 따라 데이터가 처리될 수 있는가?
- 관련성
지금 이 사람, 이 상황에 얼마나 연관된 데이터인가?
필요할 때 제공할 수 있는가?
서비스 제공자가 양질의 데이터를 제공하는 것도 중요하지만, 요즘은 그 데이타로 인해 파생되는 다른 데이타나 사람간의 관계가 더 중요한것 같다.