본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

실생활로 구현된 10가지 빅 데이터

OSS 게시글 작성 시각 2013-03-29 11:32:02

2013년 03월 27일 (수)

ⓒ CIO Korea, Thor Olavsrud | Network World


빅 데이터에 대해서는 과장된 측면이 많다. 그러나 세계의 데이터가 18개월마다 두 배씩, 기하급수적으로 증가하고 있다는 것은 결코 과장이 아니다. 그리고 이제는 이 데이터가 알게 모르게 우리 실생활의 모든 측면과 연계되고 있다. 빅 데이터를 통해 이루어지는 현실 세계의 방대한 데이터 분석 사례 10가지를 살펴보자.



넷플릭스
넷플릭스(Netflix)는 스트리밍 비디오 고객만 2,900만 명에 이르는, 미국에서 가장 큰 상용 스트리밍 비디오 제공업체다. 또한 데이터를 스폰지처럼 빨아들이는 업체이기도 하다. 사용자들이 보는 비디오, 비디오를 보는 시간/장소/기기에 대한 데이터를 수집한다. 사용자가 언제 되감기를 하고 빨리 감기를 하는지, 언제 일시 중지하는지, 언제 재생을 완전히 중단하는지에 대한 데이터도 갖고 있다.

넷플릭스는 자체 프로그램을 생산하기 시작했는데, 바로 이 과정에 넷플릭스가 보유한 모든 데이터가 사용된다. 넷플릭스는 데이터를 기반으로 BBC 미니시리즈 '하우스 오브 카드(House of Cards)'를 리메이크하기 위한 라이선스를 취득했다. 또한 배우 케빈 스페이시와 감독 데이비드 핀처의 팬 데이터를 원작 배우/감독의 팬 데이터와 상호 연계해 이들을 프로그램 제작에 발탁하기도 했다.


앤시스트리닷컴
앤시스트리닷컴(Ancestry.com)은 가족력을 조사하고 가계도를 만들기 위한 서비스를 제공한다. 표면적으로는 단순해 보이지만 이 서비스를 위해 역사 기록, 출생 기록, 사망 기록, 전쟁 및 이민 기록, 심지어 연감에 이르기까지 110억 개 이상의 기록과 4페타바이트(PB)의 콘텐츠를 유지해야 한다. 게다가 이런 기록은 손으로 쓰여진 경우도 많다.

앤시스트리닷컴은 첨단 콘텐츠 처리 기술을 사용해 콘텐츠 색인을 분류하고 검색 가능하도록 정리한다. 또한 고객이 연계 고리를 찾는 데 도움을 주기 위해 DNA 처리 기능을 추가하며 이로써 새로운 데이터 스트림도 생성하고 있다. 약간의 타액만 있으면 고객의 DNA를 추출해 데이터베이스에 포함된, 예를 들어 먼 친척과 같은 사람들을 찾아준다.


마운트 시나이 메디컬센터
마운트 시나이 메디컬센터(Mount Sinai Medical Center)는 미국에서 가장 오래되고 가장 큰 의과 대학 부속 병원 가운데 하나이며, 가장 유명한 의료 교육 및 생물 의학 연구 기관이기도 하다. 이 기관은 일부 혈통에서 항생제에 대한 내성이 발생하는 이유를 파악하기 위해 빅 데이터 분야 신생 기업인 아야스디(Ayasdi)의 기술을 사용해 100만 개의 DNA 변형을 포함한 전체 대장균 게놈 유전체를 분석한다.

전 세계 수백만 명의 사람들에게 영향을 미치는 이 박테리아는 약물에 대한 내성을 일으키는 것으로 알려졌다. 아야스디의 기술은 새로운 수학 연구 분야인 위상 데이터 분석(TDA)을 적용해 데이터의 양상을 파악한다.


캘리포니아 ISO
캘리포니아 인디펜던트 시스템 오퍼레이터(Independent System Operator, ISO)는 캘리포니아 전력망의 80%에 해당하는 전류를 관리하며, 4만km 이상의 전력선을 통해 약 3,500만 명의 소비자에게 연간 2억 8,900만 MW/h를 제공한다. 캘리포니아 ISO는 상황 지능(situational intelligence)을 위해 스페이스 타임 인사이트(Space-TIme Insight) 사의 소프트웨어를 사용하는데, 이 소프트웨어는 기후 데이터, 센서, 계측 장비 등 여러 출처에서 가져오는 방대한 규모의 데이터를 연계, 분석할 수 있게 해주며 사용자는 시각적 디스플레이를 통해 재사용 가능한 에너지원 활용을 최적화하는 방법을 파악하고 전력 공급과 수요의 균형을 맞추고 잠재적 위기에 신속하게 대응할 수 있다.


하이드로 원 네트워크
하이드로 원(Hydro One)은 온타리오 전역의 가정과 기업에게 전기를 공급한다. 하이드로 원은 온타리오의 2만 9,000km에 이르는 고압 송전망과 12만 3,000km의 저전압 분배 시스템을 갖추고 약 130만 명의 고객에게 서비스를 제공한다. 하이드로 원은 스페이스-타임 인사이트 사의 지역 및 시각 분석 소프트웨어를 사용해 송전 및 분배 자산의 안정성을 개선한다.

이 시스템을 통해 자산 관리자는 장시간에 걸친 자산 성능, 자산 교체 전략 및 자산 유지보수 요구 사항에 맞춰 정보에 근거한 의사 결정을 내릴 수 있다. 이 솔루션은 SAP ECC, SAP BW, GIS 시스템을 포함한 다양한 시스템의 데이터 및 기능과 실시간 데이터를 통합하여 하이드로 원 자산에 대한 전체적인 시야를 제공한다.


오리건 보건과학대학
오리건 보건과학대학(Oregon Health & Science University, OHSU)은 레벨 1 트라우마 센터와 소아 병원, 두 개의 연계 병원을 보유한 미국 오리건 주의 공립대학이다. OHSU는 스탠리 블랙/데커(Stanley Black and Decker) 스탠리 헬스케어(Stanley Healthcare) 사업부의 모바일뷰(MobileView) 소프트웨어를 타블로 소프트웨어(Tableau Software)의 데이터 가상화와 통합 사용해 환자의 순환계통에 수작업으로는 불가능한 수준의 정밀함으로 수분, 약물 또는 영양소를 주입하기 위한 4,000개 주입 펌프의 실시간 위치와 상태를 추적한다.

또한 이 기술을 통해 OHSU는 과거와 현재의 적정 재고 수준을 분석, 향후의 적정 재고 수준을 예측하고 더 적절히 계획함으로써 재고 할당 및 활용도를 높일 수 있다.


라스베이거스 시
대부분의 공공 기관들은 오래된 기록과 부정확한 정보로 인해 땅 속에 매립된 자산의 정확한 위치를 모르고 있으며, 그 결과 전력선이 끊기거나 수도관이 파열되어 거주민들에게 서비스가 중단되는 일이 흔히 발생한다. 미국 라스베이거스 시(The City of Las Vegas)는 이런 문제를 피하기 위해 스마트 데이터를 활용해 공공재 네트워크의 실시간 모델을 개발했다.

라스베이거스 시는 VTN 컨설팅(VTN Consulting)의 도움을 받아 다양한 출처의 데이터를 오토데스크(Autodesk) 기술을 사용해 만든 하나의 실시간 3D 모델로 통합했다. 이 모델은 지상/지하 공공재를 모두 포함하며 시 지하에 위치한 주요 자산의 위치와 상태를 시각화하는 데 사용된다.


마이애미-데이드 카운티
미국 플로리다의 마이애미-데이드 카운티(Miami-Dade County)는 정부 지도자들이 수자원 관리, 교통 정체 경감, 공공 안전 개선과 관련해 좀 더 정확한 정보에 근거한 의사 결정을 내릴 수 있도록 지원하기 위해 IBM의 스마트시티 이니셔티브와 손잡고 35개 자치구와 마이애미 시의 주요 사업을 통합했다.

IBM은 클라우드 컴퓨팅 환경의 심층적인 분석 기술을 사용해 마이애미-데이드 카운티에 정부 기관과 각 부처가 상호 협업하고 사업을 시각화할 수 있는 인텔리전트 대시보드를 제공한다. 예를 들어 마이애미-데이드 카운티 공원 부서는 물이 새거나 부식된 수도관을 찾아 수리함으로써 올해 100만 달러를 절약할 수 있을 것으로 예상하고 있다.


테니스 오스트레일리아
호주 오픈 대회를 운영하는 테니스 오스트레일리아(Tennis Australia)는 한 해의 대부분 동안 중소 기업과 유사한 형태로 운영된다. 그러나호주 오픈이 열리는 2주 동안에는 데이터 집약적인 거대 조직으로 변모하며 즉각적인 분석과 의사 결정을 위해 정확한 콘텐츠와 데이터, 통계에 대한 무중단 접근을 필요로 한다.

테니스 오스트레일리아는 IBM의 실시간 데이터 분석 소프트웨어를 활용해 토너먼트 스케줄과 선수의 인기도, 과거 데이터 기록과 소셜 미디어 대화 분량을 점검해 토너먼트 웹 사이트에 대한 팬들의 데이터 수요를 예측한다. 이 수요에 근거해 적절한 수준의 컴퓨팅 파워를 할당할 수 있다.


DPR 컨스트럭션
DPR 컨스트럭션(DPR Construction)은 미션 베이에 15억 달러 규모의 UCSF 메디컬센터를 건설하고 있는 미국 종합 건설업체다. UCSF 메디컬센터는 수십 년 만에 새로 지어지는 첫 메디컬센터다.

DPR은 오토데스크의 3D 기술을 활용해 디자이너들이 공기 흐름, 건물 주향, 바닥 면적, 환경 복원력, 건물 성능 등에 대한 데이터를 정보가 실시간으로 상호작용하는 하나의 가상 모델에 통합할 수 있도록 했다. 이로써 건축가와 디자이너, 건축 팀은 운영 환경에서 수억 개의 데이터 마커를 파악하고 시각화 및 해석할 수 있다.




※ 본 내용은 한국IDG(주)(http://www.itworld.co.kr)의 저작권 동의에 의해 공유되고 있습니다.
Copyright ⓒITWORLD. 무단전재 및 재배포 금지



[원문출처 : http://www.ciokorea.com/slideshow/16342]

맨 위로
맨 위로