다음을 통해 공유


다른 데이터 조각이 있는 파티션 병합

파티션 마법사에서 지정한 데이터 조각이 있는 여러 파티션을 병합할 때는 파티션 처리 후 결과 파티션에 예기치 않은 잘못된 데이터가 포함될 수 있습니다. 이것을 막기 위해 결과 파티션에서 데이터를 지정하는 필터를 만들 수 있습니다.

필터를 사용하여 중복 데이터 방지

예를 들어 3가지 청량 음료 제품에 대한 정보가 포함된 큐브에 동일한 팩트 테이블을 사용하는 3개의 파티션이 있습니다. 이러한 파티션에는 각 제품을 기반으로 하는 데이터 조각이 있습니다. 파티션 1에는 [ColaFull]에 대한 데이터가 포함되고 파티션 2에는 [ColaDecaf]에 대한 데이터가 포함되며 파티션 3에는 [ColaDiet]에 대한 데이터가 포함됩니다. 파티션 3이 파티션 2로 병합되면 결과 파티션(파티션 2)의 데이터와 큐브 데이터는 정확하게 됩니다. 그러나 파티션 2가 처리될 때 필터가 없으면 제품 수준에서 멤버의 부모에 의해 그 내용이 결정되는 수도 있습니다. 이 부모 [SoftDrinks]에는 파티션 1의 제품인 [ColaFull]도 포함됩니다. 파티션 2를 처리하면 [ColaFull]을 비롯하여 모든 청량 음료 데이터와 함께 파티션이 로드됩니다. 큐브에는 [ColaFull]에 대한 중복된 데이터가 포함되고 최종 사용자에게는 잘못된 데이터가 반환됩니다.

이 예에서는 파티션 3을 파티션 2로 병합한 후 결과 파티션 2에 ("Product" = 'ColaDecaf' OR "Product" = 'ColaDiet')와 같은 필터를 지정하여 팩트 테이블에서 [ColaDecaf] 및 [ColaDiet]에 대한 데이터만 추출하고 [ColaFull]에 관련된 데이터는 제외하도록 지정할 수 있습니다. 다른 방법으로는 파티션 2와 파티션 3이 만들어질 때 그에 대한 필터를 지정할 수 있으며 이러한 필터들은 병합기 프로세스 중에 결합됩니다. 어떤 방법을 사용하든 파티션 처리 후 큐브에는 중복 데이터가 포함되지 않습니다.

참고 항목

개념