콜 센터 데이터의 데이터 원본 뷰 추가(중급 데이터 마이닝 자습서)

이 태스크에서는 콜 센터 데이터에 액세스하는 데 사용할 데이터 원본 뷰를 추가합니다. 탐색을 위한 초기 신경망 모델과 권장하는 데 사용할 로지스틱 회귀 모델 모두를 작성하는 데 동일한 데이터가 사용됩니다.

또한 데이터 원본 뷰 디자이너를 사용하여 요일에 대한 열을 추가합니다. 이는 원본 데이터가 콜 센터 데이터를 날짜별로 추적하더라도 해당 요일이 평일 또는 주중인지 여부에 따라 호출량 및 서비스 품질 측면 모두에 경험적으로 되풀이되는 패턴이 있기 때문입니다.

절차

데이터 원본 뷰를 추가하려면

  1. 솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 새 데이터 원본 뷰를 선택합니다.

    데이터 원본 뷰 마법사가 열립니다.

  2. 데이터 원본 뷰 마법사 시작 페이지에서 다음을 클릭합니다.

  3. 데이터 원본 선택 페이지의 관계형 데이터 원본에서 Adventure Works DW Multidimensional 2012 데이터 원본을 선택합니다. 이 데이터 원본이 없을 경우 기본 데이터 마이닝 자습서를 참조하십시오. 다음을 클릭합니다.

  4. 테이블 및 뷰 선택 페이지에서 다음 테이블을 선택하고 오른쪽 화살표를 클릭하여 데이터 원본 뷰에 추가합니다.

    • FactCallCenter(dbo)

    • DimDate

  5. 다음을 클릭합니다.

  6. 마법사 완료 페이지에서는 기본적으로 데이터 원본 뷰의 이름이 Adventure Works DW Multidimensional 2012 로 지정되어 있습니다. 이름을 CallCenter로 변경한 다음 마침을 클릭합니다.

    데이터 원본 뷰 디자이너가 열리면서 CallCenter 데이터 원본 뷰가 표시됩니다.

  7. 데이터 원본 뷰 창 안쪽을 마우스 오른쪽 단추로 클릭하고 테이블 추가/제거를 선택합니다. DimDate 테이블을 선택한 다음 확인을 클릭합니다.

    관계는 각 테이블의 DateKey 열 간에 자동으로 추가되어야 합니다. 이 관계를 사용하여 DimDate 테이블에서 EnglishDayNameOfWeek 열을 얻어 이를 모델에 사용합니다.

  8. 데이터 원본 뷰 디자이너에서 FactCallCenter 테이블을 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.

    명명된 계산 만들기 대화 상자에서 다음 값을 입력합니다.

    열 이름

    DayOfWeek

    설명

    DimDate 테이블에서 요일을 얻음

    (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    해당 식이 필요한 데이터를 생성하는지 확인하려면 FactCallCenter 테이블을 마우스 오른쪽 단추로 클릭한 다음 데이터 탐색을 선택합니다.

  9. 데이터가 사용 가능한지 검토하는 데에 1분 정도 소요되며, 이를 통해 데이터 마이닝에 해당 데이터가 어떻게 사용되는지 알 수 있습니다.

열 이름

포함

FactCallCenterID

데이터를 데이터 웨어하우스로 가져올 때 만든 임의 키입니다.

이 열은 고유 레코드를 식별하며 데이터 마이닝 모델에 대한 사례 키로 사용해야 합니다.

DateKey

콜 센터 운영 날짜로, 정수로 표시됩니다. 정수 날짜 키는 데이터 웨어하우스에서 종종 사용되지만, 날짜 값으로 그룹화하려는 경우 날짜/시간 형식으로 날짜를 구할 수도 있습니다.

공급업체에서 각 운영일의 각 교대조에 대해 별도의 보고서를 제공하기 때문에 날짜는 고유하지 않습니다.

WageType

날짜가 평일인지, 아니면 주말 또는 공휴일인지를 나타냅니다.

주말과 평일 간에 고객 서비스 품질에 차이가 있을 수 있으므로 이 열을 입력으로 사용합니다.

Shift

통화를 기록한 교대조를 나타냅니다. 이 콜 센터는 영업일을 4개의 교대조인 오전, 오후 1, 오후 2 및 자정으로 나눕니다.

교대조가 고객 서비스 품질에 영향을 줄 수 있으므로 이를 입력으로 사용합니다.

LevelOneOperators

근무 중인 첫 번째 수준의 전화 상담원 수를 나타냅니다.

콜 센터 직원은 첫 번째 수준부터 시작하므로 이러한 직원은 덜 숙련되어 있습니다.

LevelTwoOperators

근무 중인 두 번째 수준의 전화 상담원 수를 나타냅니다.

직원이 두 번째 수준의 전화 상담원이 되기 위해서는 특정 서비스 시간을 기록해야 합니다.

TotalOperators

교대조 동안 근무하는 총 전화 상담원 수입니다.

Calls

교대조 동안 받은 호출 수입니다.

AutomaticResponses

자동 호출 처리 시스템인 IVR(Interactive Voice Response)을 통해 완전히 처리된 호출 수입니다.

Orders

호출 결과로 발생한 주문 수입니다.

IssuesRaised

호출로 인해 생성된 후속 작업이 필요한 문제 수입니다.

AverageTimePerIssue

들어오는 호출에 응답하는 데 필요한 평균 시간입니다.

ServiceGrade

일반적인 서비스 품질을 나타내는 메트릭으로, 전체 교대조에 대한 중단율로 측정됩니다. 중단율이 높을수록 고객이 불만을 느끼며 잠재 주문 기회를 놓칠 가능성이 높습니다.

데이터에는 단일 날짜 열을 기반으로 한 네 개의 서로 다른 열인 WageType, DayOfWeek, ShiftDateKey가 포함되어 있습니다. 일반적으로 데이터 마이닝에서는 동일한 데이터로부터 파생된 여러 열을 사용하는 것이 바람직하지 않습니다. 이는 값들이 서로 너무 강한 상관 관계를 갖고 있으며 기타 패턴을 명확하게 나타내지 못할 수 있기 때문입니다.

그러나 DateKey의 경우 너무 많은 고유 값이 포함되어 있으므로 이를 모델에서 사용하지 않습니다. ShiftDayOfWeek 사이에는 직접적인 관계가 없으며, WageTypeDayOfWeek는 부분적으로만 관련되어 있습니다. 공선성에 대해 염려되는 경우 사용 가능한 전체 열을 사용하여 구조를 만든 다음 각 모델의 서로 다른 열을 무시하고 그 영향을 시험할 수 있습니다.

단원의 다음 태스크

신경망 구조 및 모델 만들기(중급 데이터 마이닝 자습서)

참고 항목

개념

다차원 모델의 데이터 원본 뷰