[슈퍼차지 파워BI] 데이터 모델링 이란?

2020. 11. 18. 14:54나의 일상/나의 책 정리

728x90
반응형

슈퍼차지 파워BI를 1회독 완료 하였네요.

저에게는 도움이 많이 되는 책이었습니다. 보자마자 바로 써먹은 Case도 있고요. 아주 난이도가 있는 책은 아니기 때문에 처음 DAX를 접하는 사람도 예제를 따라하며 익힐 수 있다고 생각됩니다. 

특히 '필터 컨텍스트' 관련 부분은 많은 도움이 되었습니다. 이전에 SQLBI 사이트의 강의를 통해 배웠던 개념을 다시 복습 할 수 있어 좋았습니다. 

종종 책에서 정리 해 놓은 개념들을 정리 하고 싶을때 마다 꺼내서 포스팅 하며 익혀 두는 것이 좋을 것 같아서 먼저 오늘은 책의 1장에 나오는 "데이터 모델링 이란" 설명 부분을 발췌하여 정리합니다. 

파워 Bl에서 시용하는 데이터 모델링 엔진은 엑셀의 파워 피벗과 동일하다. 데이터 모델링은 IT Bl 전문가의 영역이기 때문에 비즈니스 사용자에게는 친숙하지 않은 용어였다. 하지만 엑셀의 파워 피벗과 파워 Bl 덕분에 무척 친숙해졌다.

 데이터 모델링이란?
 데이터 모델링은 데이터를 다양한 원본에서 가져와 로드하고 구조화한 후, 연관 된 테이블끼리 연결하고, 이를 분석에 활용하기 위해 데이터의 품질을 높이거나 추가하는 등과 같은 절차를 의미한다. 데이터 모델링의 목표는 원하는 결값이나 산출물을 얻고자 할 때마다 데이터를 준비할 필요 없이 곧바로 사용할 수 있게 하는 것이다.

 데이터 모델링의 절치는 다음과 같다.

▷데이터를 모두 가져올지, 요약 데이터만 가져올지 등 분석 대상이 되는 데이터의 최적 구조와 모(Shape)을 결정한다.
원본에서 데이터 모델로 (여기에서는파워Bl를의미) 데이터를 로드한다.
여러 테이블 사이에 논리적 관계를 설정한다(엑셀의 VLOOKUP과 유사)
데이터 유형을 지정한다(: 데이터 열이 숫자인지, 통화값인지, 텍스트인지 선택)
분석에 사용하기 위해 원본 데이터에 없는 계산된 (Calculated column)이나 측정 값(measure) 추가한다.
예를 들면, 판매 가격 및 원가만 있는 판매 정보 테이블에 매출 이익, 매출 이익율 등과 같은 새로운 열을 추가한다. 이렇게 추가 된 열이나 측정값은 보고서 사용자들이 재사용할 수 있다.
계산된 열이나 측정값에 의미 있는 이름을 붙인다.

  DAX 언어를 배우고 파워 Bl를 사용해 데이터 테이블을 연결한다는 것은 데이터 모델링을 실제로 학습한다는 것을 의미한다 이 용어가 낯설 수도 있지만, 걱정할 필요 없다. 이 책을 마칠 무렵에는 파워 Bl를 활용하는 뛰어난 데이터 전문가의 길에 들어 서게 될 것이다. 다만, 이 책에서 다루는 기술을 배우는 것은 데이터 전문가가 되기위한 것임을 잊지말자.

생각해보면 저도 데이터 모델링이란 말 많이 씁니다. 물론 위 내용과는 조금 다른 의미로 사용합니다. 저는 주로 업무 프로세스에서 사용되는 데이터를 설계하는 과정이란 의미로 사용합니다. 구글에 검색하면 보다 기술적인 이야기가 대부분이죠. 

이 책에서는 '분석을 위한 리포팅을 하는 것'을 목적으로 구성되는 데이터 모델을 만드는 작업에 초점을 두어 설명합니다. 파워BI가 사용되는 주된 목적과 부합하는 적절한 정의라 생각됩니다. 그러니까 저자의 의도대로면 우리는 이책을 통해서 데이터 분석을 위해 필요한 도구(DAX)를 만드는 방법을 배우는 것이죠

방법은 익히면 됩니다. 모르는 것은 배우면 될 일이죠. 하지만 숙련도를 갖는 것은 다른 문제죠. 보다 효율적이고 빠르게 데이터 모델링을 할 수 있다면 짧은 시간에 더 많은 시행착오를 겪을 수 있는 기회를 갖게 되는 셈입니다. 이 기회를 통해서 획기적인 성과를 만들 수 있다고 생각합니다. 

데이터 모델링의 방법을 알고 있는가는 기본이 되고 여기에 얼만큼의 노하우를 가지고 있는가가 성과를 내는 핵심이 될 것입니다.

 

728x90
반응형