웹2.0 시대 좋은 데이터의 요건

정유진님의 “웹2.0 기획론’ 책을 보다가 좋은 서비스를 제공하기 위한 데이터는 어때야 하는지에 대한 정리가 잘 되어 있어서 인용해 본다.

전통적인 좋은 데이터 요건

  • 커버리지(coverage)
    분야의 내용을 빠짐없이 포함하는 데이터인가?
    ex) 산 데이터: 전국의 산이 모두 포함되어 있는가?
    영화 데이터: 국내외 모든 영화 정보가 포함되어 있는가?
  • 중복없음
    같은 데이터가 중복해서 존재하지 않는가?
  • 정확성/신뢰성
    정확한 데이터인가? 신뢰할 수 있는가?
    비정형의 데이터를 어떻게 정제할 것인가?
    부정확한 데이터를 어떻게 판별하고 걸러낼 것인가?
  • 최신성
    최신의 데이터인가?
    수정.삭제되거나 새로 만들어진 내용은 반영되는가?
  • 데이터 운영
    데이터 업그레이를 통해 최근의 살아있는 데이터를 유지, 보수할 수 있는 프로세스가 갖추어져 있는가?
    사용자의 데이터 관련 C/S는 어떻게, 어떤 프로세스로 대응할 것인가?
    어뷰즈(abuse) 데이터를 어떻게 판별하고, 걸러낼 것인가?
  • 저작권
    저작권이 분명한 데이터인가?
    데이터의 소유권을 어떻게 확인하고 관리할 것인가?
    사용자가 만든 데이터에 대해 명확한 저작권 정책을 갖추고 있는가?

웹2.0 시대 새로이 추가되는 요건들



  • 메타데이터
    데이터와 관련된 메타데이터가 잘 구축되어, 사람들이 다양한 방법으로 데이터를 찾을 수 있느가?
  • 활용성
    많은 사람에게 데이터가 여러 컨텍스트에서 사용될 수 있느가?
    다른 애플리케이션이나 서비스에서 활용될 수 있는가?
    데이터에서 필요한 부분만 떼어내서 활용할 수 있는가?
  • 인기도
    얼마나 많은 사람들이 필요로 하는 데이터인가?
    얼마나 인기 있는 데이터인가?
    데이터의 인기도가 잘 표현되고 있는가?
  • 포맷
    표준 포맷으로 제공되어 외부 서비스에서 자유롭게 활용할 수 있는가?
    공통의 기준에 따라 데이터가 처리될 수 있는가?
  • 관련성
    지금 이 사람, 이 상황에 얼마나 연관된 데이터인가?
    필요할 때 제공할 수 있는가?

서비스 제공자가 양질의 데이터를 제공하는 것도 중요하지만, 요즘은 그 데이타로 인해 파생되는 다른 데이타나 사람간의 관계가 더 중요한것 같다.