IT Life/세미나, 컨퍼런스

[세미나 참관기] IBM Information On Demand 2012 (2012.2.22 인터컨티넨탈 호텔)

2020 지구의 원더키디 2012. 2. 22. 21:15


■ 행사일정 : 2012. 2.22 (수) 오후 1:30 ~ 6:10 / 서울 그랜드 인터콘티넨탈 호텔 2F 그랜드 볼룸


■ 참관개요 : 

- CDR이라는 엄청냔 량의 데이터를 가공하여 트래픽 정보를 생산하는 시스템의 관리자로서,
 데이터 핸들링에 대한 솔루션 및 새로운 insight 창출 방안, 타사의 사례 등을 살펴보고자 함.


■ 참관후기 :
인터컨티넨탈 호텔의 2층 그랜드 볼륨 3개를 전부 사용한, 규모가 꽤 큰 세미나 였다.
대략 400~500명 정도의 사람들이 참관을 하였으며, 각종 부스에는 이번 세미나와 관계된 솔루션 및 장비 업체들의 홍보가 진행되고 있었다. 보통 이런 세미나에서 부스 참관은 정말 관심이 있는 몇 몇 사람들만 하게 되는데, 이번에는 마치 커피 쿠폰 처럼 된 카드를 나누어 주고, 홍보 부스에서 도장을 하나씩, 총 7개를 찍어오면 경품을 추첨하여 주는 방식이었다.
사람들은 모두 도장을 받으려고 혈안이...

기조연설을 할 때, 동시통역기가 모든 테이블에 준비되어 있었다.
또한 Break Time에는 핫도그, 미니햄버거, 미니피자, 커피, 쥬스 등이 제공되었다.
 



[세션1 : 똑똑한 의사 결정 : ‘빅 데이터’를 사용하여 새로운 인사이트 얻기]
▶ 빅 데이터란 무엇인가 (아래 중, 2가지 속성을 만족하면 빅 데이터라고 할 수있다)
- Volume : 스트리밍 데이터 / 대용량 데이터의 이동
- Variety : 다양한 관계형 및 비정형구조 데이터에 대한 분석
   데이터의 유형이 전통적인 정형성 데이터에서 비정형성 데이터로 다양화되고 있음. (트위터, 페이스북)  
- Velocity : 테라바이트에서 제타바이트로의 확장
    상상을 초월하는 속도로 데이터가 쌓이고 있음. 

단순한 텍스트 분석이 아닌, 다양한 형태의 데이터를 활용하여 고객의 비즈니스 인사이트를 확장코자 한다.

▶ 
빅 데이터로의 전형적인 접근 방식

- 기존 : 비즈니스 사용자가 어떤 보고서/통계를 볼 지 결정 → IT부서에서는 기능 구현을 위한 인프라를 구성.
   (월 세일즈 리포트, 고객 서베이 통계)
- 빅 데이터 접근 방식 :
IT에서 데이터의 모델을 분석하기 위해 플랫폼 선 구성 
→ 비즈니스에서는 무엇을 확인하고 활용할 수 있는지 탐구
(브랜드 정서, 제품전략, 자원의 최대 활용)


▶ 사례별 적용 시나리오
1. WATSON 사례
  • IBM의 컴퓨터 WATSON이 미국 JEOPARDY!에 출연.
  • 자연어로 이루어진 퀴즈에 대한 답변을 함. 3초 만에.
2. Vestas 사례
  • 운영중인 터빈 장비에서 센서 데이터를 수집하여 실제 결과를 이해.
  • 운영 기간, 서비스 중지 시까지의 시간, 바람과 터빈 사이의 상호 작용 최적화.
  • 수 백개의 변수를 가진 1킬로미너 그리드 내에서 최적의 터빈 위치를 찾기 위한 날씨 모델링 3주-3일 / JAQL
3. 조산아들의 위험 감지를 위한 빅 데이터 분 석
  • 온타리오 대학 병원에서는 빅 데이터에 대한 분서을 화룡하여 신생아들의 상태를 24시간 모니터링 하고 있음.
  • 여러 장비에서 도출되는 데이터를 규합하여 위험 상태를 감지.
  • 산소 포화도, 혈얍도 등의 데이터를 묶어서 결정을 내려 줌
4. 교통, 트래픽 관리를 위한 빅 데이터 분석
  • GPS, Cell-Phone, 공공 운송수단, 운행 시간, 사고 등등 다양한 데이터 소스를 활용하여 결과를 도출
  • 25% 트래픽 감소, 수송 고객이 4만명 이상 증가, 20%의 택시 수입 증가, 40% 배기가스 감소
5. CDR분석을 위한 빅 데이터 분석

  • CDR로 들어오는 데이터를 DW로 바로 얹어서 분석했음.
  • 콜 속성상 중복 데이터가 많이 발생함. 중복 제거 작업등이 필요했음. -> 시간이 너무 많이 소요됨. 12시간.
  • 실시간 요금 청구를 위해서는 많은 데이터에 대한 조정 작업이 필요함
  • 웨어하우스 내애서 중복 제거작업을 하기 위해서는 12시간이 소요되었으나 1초 만에 완료됨.
  • 6 Billions CDR / 일, IT복잡성 감소.

6. 스마트 인프라 관리를 위한 빅 데이터 분 석
  • 장비에서 나오는 모니터링 데이터, 전력량 등을 통합관리 하기 위한 플랫폼 구축.
  • 빌딩 내의 에너지 관리, 장비 관리 및 관리 예측.
  • IP로 관리 가능한 어플리케이션들의 모니터링 및 예측 분석
  • 다양한 데이터 소스 - tEXT, XML,  No scheme
7. 시설 감시와 보안을 위한 빅 데이터 분석
  • 스트림 플랫폼에 기반하여 최첨단 기술. 매설된 장치에서 나오는 음향 시그널을 실시간으로 분석

[세션2 : 

MDM(Master Data Management) 100% 활용하기

]

마스터 데이터는 전사적으로 업무 프로세스에 사용되는 높은 가치의 중요한 정보임.

업무와 어플리케이션의 기준이 되는 심장과 같은 데이터.


회사가 어떤 것을 하는지에 따라 마스터 데이터가 차이 난다.

금융이나 통신은 고객과 상품의 계약에 의해서 수익을 창출하니까 고객정보, 계약정보가 중요함.

제조사, 유통사는 물건을 사거나 파는 행위에 의해서 수익을 창출하니까 제품정보, 자재, 부품정보가 중요함.


DW나 BI에서 분석되는 데이터는 깨끗하게 정제된 데이터들이다.

기존에 버려지고 있었던 데이터들 - CDR 콜 데이터들 / 상품평 / 공정에서 떨어지는 센서 데이터들 / 증권사는 SNS에서 발생하는 다양한 화제 정보 - 들을 사용하기 위함이다.


마스터 데이터와 연관을 지어서 빅 데이터를 분석하기 위함.

제조업의 측면에서 본 다면 A라는 공정과 B라는 공정의 데이터를 같이 봐야 하는 경우.

빅 데이터를 고민할 때, 마스터 데이터도 함께 고민하여야 한다.

 
 

▶ Master Data Management?

통합디비, 통합어플리케이션이 아니다.

마스터 데이터에 대한 규정, 기술, 프로세스를 전체 조직에 걸쳐서 제공, 조정, 관리 하는 것이다.

MDM의 성공을 위해서는 Governance를 고려해야 함.


기존 실패이유 : 통합했어도 각 시스템은 다르기 때문에 결국 변질되게 됨.


여러 조직에 분산되어 있는 마스터 데이터에 대한 생성, 변경 업무를 집중 관리한다

MDM이라고 하는 것은 INTEGRATION의 중앙에 위치.

회사에서 사용하는 모든 데이터 - 메타, 판매, 빅 데이터 등- 의 기준이 되는 역할을 한다.

특정 업무를 위한 시스템이 아니다.


▶ Master Data Management의 동향

정보 거버넌스가 필수임. (단순 IT의 노력으로는 부족. 전사적 거버넌스 관점)

프로세스를 통한 관리가 필요하며, 이를 위해 BPM과의 연계를 고려.

단일 도메인, 스타일 -> 복수 도메인, 스타일로 다양해지는 요구사항



▶ 업무적 요구사항

매출 / 전략적 접근 / 비용 / 규정 준수

MDM하나가 해결할 수 없다. 마스터 데이터를 잘 모아놓고 관리, 컨트롤하는 것 이다.

물론 전사적으로 관리하면서 많은 것을 할 수 있다. 


[세션3 : Business Analytics의 완성과 미래 - 산업별 예측분석(Predictive Analytics) 사례]

기업에서 의사결정 및 각종 내부분석을 수행, 조회, 결과 점검을 지원하는 솔루션.

OLAP 등 기업 데이터를 활용하여 컨설팅 하는 작업.


비즈니스를 분석하고 솔루션을 도입하는 것은 과거의 정보를 자유롭게 분석하여 미래를 예측/대비하기 위해서다.


▶ 현재의 BA는 무엇을 분석하고 있는가?

현재 BA라는 것은, 과거의 데이터를 그냥 보고 있을 뿐이다..? (매출, 고객수 등)

현재 BA는 미래를 사람이 직접 추정하게 한다.


▶ Predict Analytics

PA를 빼고 BA를 논하는 것은 이제 의미가 없다.

PA = Advanced Analytics + Decision Optimization

AA : 데이터 마이닝, 텍스트 마이닝, 비쥬얼리제이션, 리포팅

DA :  Rules Engine, Recommandation Engine, Optimization Engine


최적화란 정확한 예측을 통해서 얼마나 올 줄 알고, 얼마의 좌석을 준비해야 하는가?

 

BA : 과거와 현재의 비즈니스를 요약하는 것.

PA : 미래의 비즈니스를 예측하고 최적화 하는 것.


▶ 
공공-고속도로

교통량 정보를 이용하여 소요 예정시간을 예측해 냄.


▶ 면세점 경영계획

면세품의 수요 예측. ERP를 통한 실질적인 계획 수립을 위한 호텔 취급 면세품의 수요 예측 모델 개발.

면세품 판매 현황 및 각종 경제 지표를 고려한 최적 회위모형을 개발.

시장 수요 / 개별 수요 예측 모델 개발/자동화.


▶ 인터넷쇼핑몰

고객이 구매하고자 하는 물품과 가장 연관성이 높은 물품을 추천하는 모델을 통한 추가 매출 달성.

데이터 마이닝의 연관 알고리즘을 통 하여.추가 추전. (옥션 : 청바지를 사면 후드티를 추천)


▶ 제조-제철회사의 불량인자 탐색]

최종 제품의 다양한 불량요인. 공정 중에서 어떤 단계에 발생했는지 모름.

의사결정나무 분석 기법을 이용하여 일정 공정이 지나면 실제 불량이 발생할 지 예측하는 모델 개발.

QC기법을 도입하여 품질도 예측.


▶ 저축은행 연체 예측

소액대출자들의 대출 연체가 높음.

기존 신용등급모델로는 한계점.


마이닝 신경망 분석을 이용하여, 실제 연체가 될지 안 될지에 대한 예측모델 개발.

기존 신평사의 모델보다 2~3배 높은 정확도.


개인별 연체 확률값 도출. (각종 콜 센터등에서 연체 방지 활동 돌입)


▶ 방송 시청률 예측

광고 시청률에 따라, 광고 시간대 구매여부 결정.

장르나 출연진, 시간대 등을 토대로 해서 이 광고 시간대를 사야 하나 말아야 하나 결정할 수 있는 조언.


통계적 시계열 모델, Bass의 확산 모델, SOV-TOMS 등의 기법 이용.