콜 센터 모델에 대한 예측 만들기(중급 데이터 마이닝 자습서)

 

적용 대상: SQL Server 2016 Preview

교대조, 전화 상담원 수, 호출 및 서비스 등급에 대한 몇 가지 사항을 배웠으므로 이제 비즈니스 분석 및 계획에 사용할 수 있는 일부 예측 쿼리를 만들 준비가 되었습니다. 먼저 탐구 모델에서 일부 예측을 만들어 몇 가지 가정을 테스트합니다. 다음으로 로지스틱 회귀 모델을 사용하여 대량 예측을 만듭니다.

이 단원에서는 사용자가 예측 쿼리의 개념에 대해 이미 잘 알고 있다고 가정합니다.

신경망 모델을 사용하여 예측 만들기

다음 예에서는 탐색을 위해 만든 신경망 모델을 사용하여 단일 예측을 만드는 방법을 보여 줍니다. 단일 예측은 모델에서 서로 다른 값을 사용하여 결과를 살펴볼 수 있는 좋은 방법입니다. 이 시나리오에서는 6명의 경력 전화 상담원이 근무하는 경우 요일을 지정하지 않고 자정 교대조에 대한 서비스 등급을 예측합니다.

신경망 모델을 사용하여 단일 쿼리를 만들려면

  1. SQL Server Data Tools(SSDT)에서 사용할 모델이 들어 있는 솔루션을 엽니다.

  2. 데이터 마이닝 디자이너에서 클릭 된 마이닝 모델 예측 탭 합니다.

  3. 마이닝 모델 창에서 클릭 모델 선택합니다.

  4. 마이닝 모델 선택 대화 상자에는 마이닝 구조 목록이 표시 됩니다. 마이닝 구조를 확장하여 해당 구조와 연결된 마이닝 모델 목록을 봅니다.

  5. Call Center Default 마이닝 구조를 확장하고 신경망 모델 Call Center - LR을 선택합니다.

  6. 마이닝 모델 메뉴에서 단일 쿼리를 선택합니다.

    단일 쿼리 입력 마이닝 모델의 열에 매핑된 열이 있는 대화 상자가 나타납니다.

  7. 단일 쿼리 입력 대화 상자, 교대조에 대 한 행을 클릭 한 다음 선택 자정합니다.

  8. Lvl 2 Operators 및 형식에 대 한 행을 클릭 합니다. 6합니다.

  9. 아래에 있는 절반은 마이닝 모델 예측 탭에서 표의 첫 번째 행을 클릭 합니다.

  10. 소스 열에서 아래쪽 화살표를 클릭 하 고 선택 예측 함수합니다. 에 필드 열에서 선택 PredictHistogram합니다.

    자동으로이 예측 함수와 함께 사용할 수 있는 인수 목록에 표시 된 조건/인수 상자입니다.

  11. 열 목록에서 ServiceGrade 열을 끌어는 마이닝 모델 창에는 조건/인수 상자입니다.

    열 이름이 자동으로 인수로 삽입됩니다. 이 입력란으로 끌어다 놓을 임의의 예측 가능한 특성 열을 선택할 수 있습니다.

  12. 단추를 클릭 스위치를 쿼리 결과 뷰에서, 예측 쿼리 작성기의 위쪽 모퉁이에 있습니다.

예상 결과에는 각 예측에 대한 지지도 및 확률 값과 함께 이 입력에 따라 각 서비스 등급에 대해 가능한 예측 값이 포함됩니다. 언제든지 디자인 뷰로 돌아가 입력을 변경하거나 더 많은 입력을 추가할 수 있습니다.

로지스틱 회귀 모델을 사용하여 예측 만들기

비즈니스 문제 관련 특성을 이미 알고 있는 경우 로지스틱 회귀 모델을 사용하여 일부 특성을 변경했을 때의 효과를 예측할 수 있습니다. 로지스틱 회귀는 일반적으로 독립 변수의 변경 내용을 기반으로 예측을 수행 하는 데 사용 되는 통계 방법: 예를 들어, 그는 재무 상태 평가에 고객 인구 통계에 따라 고객 동작을 예측 합니다.

이 작업에서는 예측에 사용할 데이터 원본을 만든 다음 여러 가지 비즈니스 질문에 대답하는 데 유용한 예측을 만드는 방법을 배웁니다.

대량 예측에 사용할 데이터 생성

입력된 데이터를 제공 하는 방법은 여러 가지: 스프레드시트에서 직원 수준을 가져올 하 고 다음 달에 대 한 서비스 품질을 예측 하는 모델을 통해 해당 데이터를 실행할 수 있습니다 예를 들어 있습니다.

이 단원에서는 데이터 원본 뷰 디자이너를 사용하여 명명된 쿼리를 만듭니다. 이 명명된 쿼리는 직원 중 전화 상담원의 최대 수, 받은 최소 전화 수 및 발생한 평균 문제 수를 일정표의 각 교대조에 대해 계산하는 사용자 지정 Transact-SQL 문입니다. 그런 다음 해당 데이터를 마이닝 모델에 조인하여 다가올 날짜의 계열에 대한 예측을 수행합니다.

대량 예측 쿼리에 대한 입력 데이터를 생성하려면
  1. 솔루션 탐색기에서 마우스 오른쪽 단추로 클릭 데이터 원본 뷰, 를 선택한 다음 새 데이터 원본 뷰합니다.

  2. 데이터 원본 뷰 마법사에서 선택 Adventure Works DW Multidimensional 2012 클릭 한 다음 확인 하 고 데이터 원본으로 다음합니다.

  3. 테이블 및 뷰 선택 페이지에서 클릭 다음 없이 테이블을 선택 합니다.

  4. 마법사 완료 페이지에서 이름을 입력 하 고 Shifts합니다.

    이 이름은 솔루션 탐색기에서 데이터 원본 뷰의 이름으로 나타납니다.

  5. 빈 디자인 창을 마우스 오른쪽 단추로 클릭 한 다음 선택 새 명명 된 쿼리합니다.

  6. 명명 된 쿼리 만들기 대화 상자에 대 한 이름, 형식 Shifts for Call Center합니다.

    이 이름은 데이터 원본 뷰 디자이너에 명명된 쿼리의 이름으로만 나타납니다.

  7. 다음 쿼리 문을 대화 상자의 아래쪽 중간에 있는 SQL 텍스트 창에 붙여 넣습니다.

    SELECT DISTINCT WageType, Shift,   
    AVG
    (Orders) as AvgOrders, MIN
    (Orders) as MinOrders, MAX
    (Orders) as MaxOrders,  
    AVG
    (Calls) as AvgCalls, MIN
    (Calls) as MinCalls, MAX
    (Calls) as MaxCalls,  
    AVG
    (LevelTwoOperators) as AvgOperators, MIN
    (LevelTwoOperators) as MinOperators, MAX
    (LevelTwoOperators) as MaxOperators,  
    AVG
    (IssuesRaised) as AvgIssues, MIN
    (IssuesRaised) as MinIssues, MAX
    (IssuesRaised) as MaxIssues  
    FROM dbo.FactCallCenter  
    GROUP BY Shift, WageType  
    
  8. 디자인 창에서 Shifts for Call Center 테이블을 마우스 오른쪽 단추로 누르고 데이터 탐색 T-SQL 쿼리에 의해 반환 된 데이터를 미리 보려면 합니다.

  9. 탭을 마우스 오른쪽 단추로 클릭 Shifts.dsv (디자인) 클릭 하 고 저장 새 데이터 원본 뷰 정의 저장 합니다.

각 교대조에 대한 서비스 메트릭 예측

지금까지 각 교대조에 대한 일부 값을 생성했으므로 이제는 이러한 값을 작성한 로지스틱 회귀 모델의 입력으로 사용하여 비즈니스 계획에 사용할 수 있는 일부 예측을 생성합니다.

새 DSV를 예측 쿼리에 대한 입력으로 사용하려면
  1. 데이터 마이닝 디자이너에서 클릭 된 마이닝 모델 예측 탭 합니다.

  2. 마이닝 모델 창에서 클릭 모델 선택, Call Center-LR 사용 가능한 모델 목록에서 선택 합니다.

  3. 마이닝 모델 메뉴 옵션의 선택을 취소 단일 쿼리합니다. 단일 쿼리 입력이 손실된다는 경고가 표시됩니다. 확인을 클릭합니다.

    단일 쿼리 입력 바뀝니다 대화 상자는 입력 테이블 선택 대화 상자입니다.

  4. 사례 테이블 선택을 클릭합니다.

  5. 테이블 선택 대화 상자, 데이터 원본 목록에서 selectShifts 합니다. 에 테이블/뷰 이름 목록에서 Shifts for Call Center (수 수 자동으로 선택) 하 고 클릭 한 다음 선택 확인 합니다.

    마이닝 모델 예측 디자인 화면이 입력 데이터에서 및 모델에서의 열 이름과 데이터 형식을 기반으로 생성 된 매핑을 표시 하도록 업데이트 됩니다.

  6. 조인 선을 마우스 오른쪽 단추로 클릭 한 다음 선택 연결 수정합니다.

    이 대화 상자에서는 매핑된 열과 매핑되지 않은 열을 정확하게 볼 수 있습니다. 마이닝 모델에는 Calls, Orders, IssuesRaised 및 LvlTwoOperators 열이 포함되어 있으므로 사용자가 원본 데이터의 이 열을 기반으로 만든 집계로 매핑할 수 있습니다. 이 시나리오에서는 평균으로 매핑합니다.

  7. LevelTwoOperators 옆의 빈 셀을 클릭 하 고 선택 Shifts for Call Center.AvgOperators합니다.

  8. Calls 옆에 있는 빈 셀을 클릭 Shifts for Call Center.AvgCalls합니다. 다음을 클릭 하 고 확인합니다.

각 교대조에 대한 예측을 만들려면
  1. 아래쪽에 있는 표에 절반는 예측 쿼리 작성기, 아래에서 빈 셀을 클릭 소스 한 다음 Shifts for Call Center를 선택 합니다.

  2. 아래의 빈 셀에서 필드, Shift를 선택 합니다.

  3. 표의 다음 빈 줄을 클릭하고 위에 설명한 절차를 반복하여 WageType에 대한 다른 행을 추가합니다.

  4. 표에서 다음 빈 줄을 클릭합니다. 에 소스 열에서 선택 예측 함수합니다. 에 필드 열에서 선택 Predict합니다.

  5. ServiceGrade 열을 끌어에서 마이닝 모델 창에서 표 아래로 및에 조건/인수 셀입니다. 에 별칭 필드를 입력 Predicted Service Grade합니다.

  6. 표에서 다음 빈 줄을 클릭합니다. 에 소스 열에서 선택 예측 함수합니다. 에 필드 열에서 선택 PredictProbability합니다.

  7. ServiceGrade 열을 끌어에서 마이닝 모델 창에서 표 아래로 및에 조건/인수 셀입니다. 에 별칭 필드를 입력 확률합니다.

  8. 클릭 쿼리 결과 뷰로 전환 예측을 봅니다.

다음 표에서는 각 교대조에 대한 결과 예를 보여 줍니다.

Shift WageType Predicted Service Grade 확률
AM holiday 0.165 0.377520666
midnight holiday 0.105 0.364105573
PM1 holiday 0.165 0.40056055
PM2 holiday 0.165 0.338532973
AM weekday 0.165 0.370847617
midnight weekday 0.08 0.352999173
PM1 weekday 0.165 0.317419177
PM2 weekday 0.105 0.311672027

응답 시간 단축이 서비스 등급에 미치는 영향 예측

지금까지 각 교대조에 대한 일부 평균 값을 생성하고 이러한 값을 로지스틱 회귀 모델의 입력으로 사용했습니다. 그러나 중단율을 0.00-0.05 범위 내로 유지하려는 비즈니스 목표에는 이 결과가 충분하지 않습니다.

따라서 서비스 등급에 대한 응답 시간의 큰 영향력을 보여 준 원래 모델을 기반으로 하여 운영 팀에서는 호출에 응답하는 평균 시간을 줄이면 서비스 품질을 향상시킬 수 있는지를 평가하는 일부 예측을 실행하기로 결정합니다. 예를 들어 현재 통화 응답 시간을 90% 또는 80%까지 줄이면 서비스 등급 값이 어떻게 될지 살펴 봅니다.

각 교대조의 평균 응답 시간을 계산하는 DSV(데이터 원본 뷰)를 만드는 것은 간단합니다. 그런 다음에는 해당 평균 응답 시간의 80% 또는 90%를 계산하는 열을 추가합니다. 그런 다음 DSV를 모델에 대한 입력으로 사용할 수 있습니다.

정확한 단계를 여기에서 보여 주지는 않지만 다음 표에서 응답 시간을 현재 응답 시간의 80% 또는 90%까지 줄일 경우 서비스 등급에 대한 영향을 비교해 봅니다.

이러한 결과를 통해 서비스 품질의 향상을 위해서는 대상 교대조에서 응답 시간을 현재 수준의 90%로 줄여야 한다는 결론을 내릴 수 있습니다.

교대조, 임금 및 요일 현재 평균 응답 시간으로 예측되는 서비스 품질 응답 시간을 90퍼센트 줄여 예측되는 서비스 품질 응답 시간 80% 감소를 사용 하 여 서비스 품질 예측
Holiday AM 0.165 0.05 0.05
Holiday PM1 0.05 0.05 0.05
Holiday Midnight 0.165 0.05 0.05

모델에서 만들 수 있는 여러 가지 기타 예측 쿼리가 있습니다. 예를 들어 특정 서비스 수준을 만족하기 위해 또는 특정 개수의 들어오는 호출에 응답하기 위해 필요한 전화 상담원 수를 예측할 수 있습니다. 로지스틱 회귀 모델에 여러 출력을 포함할 수 있기 때문에 여러 개별 모델을 만들지 않아도 서로 다른 독립 변수 및 결과를 쉽게 경험할 수 있습니다.

주의

Excel 2007용 데이터 마이닝 추가 기능에서는 로지스틱 회귀 마법사를 제공하기 때문에 서비스 등급을 특정 교대조에 대한 대상 수준으로 개선하는 데 필요한 두 번째 수준의 전화 상담원의 수와 같은 복잡한 질문에 보다 쉽게 대답할 수 있습니다. 데이터 마이닝 추가 기능은 무료로 다운로드할 수 있으며 신경망 또는 로지스틱 회귀 알고리즘을 기반으로 하는 마법사를 포함합니다. 자세한 내용은 다음 링크를 참조하십시오.

결론

이 단원에서는 Microsoft 신경망 알고리즘 및 Microsoft 로지스틱 회귀 알고리즘을 기반으로 하는 마이닝 모델을 생성, 사용자 지정 및 해석하는 방법을 배웠습니다. 이러한 모델 유형은 복잡하고 거의 제한 없이 다양하게 분석될 수 있으므로 복잡하고 마스터하기가 어렵습니다.

그러나 이러한 알고리즘 요인의 여러 조합을 통해 반복 하 고 자동으로 또는 TRANSACT-SQL을 사용 하 여 데이터의 수동 탐색을 통해 발견 하기 매우 어려운 통찰력에 대 한 통계 지원을 제공 하는 가장 강력한 상관 관계를 식별할 수 Power Pivot합니다.

관련 항목:

로지스틱 회귀 모델 쿼리 예제
Microsoft 로지스틱 회귀 알고리즘
Microsoft 신경망 알고리즘
신경망 모델 쿼리 예제