[파워쿼리기능소개] 5-1. 변환 - 홈 탭의 열과 행 관리

2020. 7. 1. 00:15엑셀/파워쿼리기능소개

728x90
반응형

드디어 가장 어려운 변환에 대한 기능 소개입니다. 변환과 관련된 기능은 직접 눌러가며 익히는 것이 좋습니다. 다루어야 할 내용이 많다보니 여러 편으로 나누어서 포스팅 할 계획입니다. 오늘은 그 첫번째로 행과 열을 다루는 방법에 대해서 소개합니다. 

* 지금까지 거의 포스팅이 마찬가지 이지만 저도 이것 저것 눌러보고 구글링하여 해당 기능을 배우고 그 기반으로 작성을 합니다. 부족해도 너그럽게 봐주세요. 실제 제가 작업하면서 사용하지 않은 기능은 파악하고 정리하는데 시간이 좀 소요되네요. 저도 필요한 기능만 쓰니까요. 전체를 다 소개하기는 힘드네요. 그래서 변환 관련 기능도 쓰는 것 위주로 합니다. 

오늘 소개할 기능

1. 열관리 

열(Column)에 대한 기본적인 관리 기능입니다.

먼저 '열 선택' 입니다. 열선택을 클릭하면 다음과 같이 열을 선택하는 팝업이 나오는데 여기서 제외 시킨 열은 로드되지 않습니다. 필요한 열만 선택한다고 생각하면 됩니다. 

다른열제거와 다를 것이 없습니다. 제가 그렇게 생각하는 이유는 열선택을 한 뒤 작성된 M코드 식과 다른열 삭제를 한 결과가 동일한 코드로 처리되기 때문인데요. 단, 열을 선택하고 삭제한 경우에는 Remove 로 처리되고 나머지는 SelectColumns 로 처리됩니다. 

적용된 단계 목록을 보면 '제거된 다른 열 수' 단계명 옆에 설정 버튼이 생깁니다. 이 버튼을 클릭하면 다시 셀 선택을 할 수 있습니다. 

불필요한 데이터를 모두 가지고 작업을 수행 할 필요가 없죠. 오히려 속도등 방해가 되므로 지우는 것이 좋습니다. 파워쿼리로 작업할 때와 엑셀 시트의 작업과 비교해보죠. 엑셀 시트에서는 지우거나 숨겨야죠. 허나 숨기는건 양을 줄이는것이 아니므로 무겁습니다. 그리고 지우게 되면 데이터는 가벼워지나 대신 무엇을 지웠는지 확인이 어렵죠. 

물론 파워쿼리도 속도란 성능 면에서는 좋은편이 아닙니다. 양이 많아지면 파일이 다운되는 경우가 많습니다. 하지만 몇 만줄의 데이터를 엑셀시트에서 다루는 것에 비하면 할 만한 작업이라 생각됩니다. 

원본 데이터의 양이 많으면 줄여야 합니다. 필요없는 필드를 지우고 작업을 시작하는 것을 추천드리고 물론 더 좋은 것은 필요한 만큼의 원본 데이터를 구하는 것이겠죠. 

 

2. 행감소 

행감소는 필요없는 행을 삭제하고 데이터 부분만 남기기 위해서 많이 사용합니다. 

그림과 같이 원본데이터가 필드 헤더가 반복된 경우나 불필요한 공백 행이 삽입된 경우 주로 사용됩니다. 중복된 항목을 제거하는 기능은 유니크한 값목록을 얻기위해서도 많이 사용합니다. 

'중복된 항목 제거' 나 '빈 행 제거' 수행 시 주의 할 점은 중복여부를 선택된 열 기준으로 판단한다는 것입니다. 특정 열 기준으로 빈값을 제거 하고 싶은 것이 이라면 열을 지정하고 처리해야 하고 그렇지 않은 경우에는 반대로 전체 열을 선택한 상태에서 제거를 실행해야 합니다. 

 

* 오늘은 주중인 관계로 간단히 줄입니다. 

 

728x90
반응형