콜 센터 모델에 대한 예측 만들기(중급 데이터 마이닝 자습서)

아티클
11/10/2015

교대조, 전화 상담원 수, 호출 및 서비스 등급에 대한 몇 가지 사항을 배웠으므로 이제 비즈니스 분석 및 계획에 사용할 수 있는 일부 예측 쿼리를 만들 준비가 되었습니다. 먼저 탐구 모델에서 일부 예측을 만들어 몇 가지 가정을 테스트합니다. 다음으로 로지스틱 회귀 모델을 사용하여 대량 예측을 만듭니다.

이 단원에서는 사용자가 예측 쿼리의 개념에 대해 이미 잘 알고 있다고 가정합니다.

신경망 모델을 사용하여 예측 만들기

다음 예에서는 탐색을 위해 만든 신경망 모델을 사용하여 단일 예측을 만드는 방법을 보여 줍니다. 단일 예측은 모델에서 서로 다른 값을 사용하여 결과를 살펴볼 수 있는 좋은 방법입니다. 이 시나리오에서는 6명의 경력 전화 상담원이 근무하는 경우 요일을 지정하지 않고 자정 교대조에 대한 서비스 등급을 예측합니다.

신경망 모델을 사용하여 단일 쿼리를 만들려면

SQL Server Data Tools(SSDT)에서 사용할 모델이 들어 있는 솔루션을 엽니다.
데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.
마이닝 모델 창에서 모델 선택을 클릭합니다.
마이닝 모델 선택 대화 상자에는 마이닝 구조 목록이 표시됩니다. 마이닝 구조를 확장하여 해당 구조와 연결된 마이닝 모델 목록을 봅니다.
Call Center Default 마이닝 구조를 확장하고 신경망 모델 Call Center - LR을 선택합니다.
마이닝 모델 메뉴에서 단일 쿼리를 선택합니다.

단일 쿼리 입력 대화 상자가 표시됩니다. 이 대화 상자의 열은 마이닝 모델의 열에 매핑됩니다.
단일 쿼리 입력 대화 상자에서 Shift에 대한 행을 클릭한 다음 midnight를 선택합니다.
Lvl 2 Operators에 ��한 행을 클릭하고 6을 입력합니다.
마이닝 모델 예측 탭의 아래쪽 중간에 있는 표에서 첫 번째 행을 클릭합니다.
원본 열에서 아래쪽 화살표를 클릭하고 예측 함수를 선택합니다. 필드 열에서 PredictHistogram을 선택합니다.

이 예측 함수와 함께 사용할 수 있는 인수 목록이 조건/인수 상자에 자동으로 나타납니다.
마이닝 모델 창에 있는 열 목록에서 ServiceGrade 열을 조건/인수 상자로 끌어다 놓습니다.

열 이름이 자동으로 인수로 삽입됩니다. 이 입력란으로 끌어다 놓을 임의의 예측 가능한 특성 열을 선택할 수 있습니다.
예측 쿼리 작성기의 위쪽 모퉁이에 있는 쿼리 결과 뷰로 전환 단추를 클릭합니다.

예상 결과에는 각 예측에 대한 지지도 및 확률 값과 함께 이 입력에 따라 각 서비스 등급에 대해 가능한 예측 값이 포함됩니다. 언제든지 디자인 뷰로 돌아가 입력을 변경하거나 더 많은 입력을 추가할 수 있습니다.

로지스틱 회귀 모델을 사용하여 예측 만들기

비즈니스 문제 관련 특성을 이미 알고 있는 경우 로지스틱 회귀 모델을 사용하여 일부 특성을 변경했을 때의 효과를 예측할 수 있습니다. 로지스틱 회귀는 독립 변수의 변경 내용을 기반으로 예측을 만드는 데 일반적으로 사용되는 통계 방법입니다. 예를 들어 로지스틱 회귀는 고객 인구 통계를 기반으로 고객 동작을 예측하기 위해 재무 상태 평가에 사용됩니다.

이 작업에서는 예측에 사용할 데이터 원본을 만든 다음 여러 가지 비즈니스 질문에 대답하는 데 유용한 예측을 만드는 방법을 배웁니다.

대량 예측에 사용할 데이터 생성

여러 가지 방법으로 입력 데이터를 제공할 수 있습니다. 예를 들어 스프레드시트에서 직원 수준을 가져오고 해당 데이터를 모델을 통해 실행하여 다음 달의 서비스 품질을 예측할 수 있습니다.

이 단원에서는 데이터 원본 뷰 디자이너를 사용하여 명명된 쿼리를 만듭니다. 이 명명된 쿼리는 직원 중 전화 상담원의 최대 수, 받은 최소 전화 수 및 발생한 평균 문제 수를 일정표의 각 교대조에 대해 계산하는 사용자 지정 Transact-SQL 문입니다. 그런 다음 해당 데이터를 마이닝 모델에 조인하여 다가올 날짜의 계열에 대한 예측을 수행합니다.

대량 예측 쿼리에 대한 입력 데이터를 생성하려면

솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭한 다음 새 데이터 원본 뷰를 선택합니다.
데이터 원본 뷰 마법사에서 Adventure Works DW Multidimensional 2012 를 데이터 원본으로 선택한 후 다음을 클릭합니다.
테이블 및 뷰 선택 페이지에서 테이블을 선택하지 않고 다음을 클릭합니다.
마법사 완료 페이지에서 Shifts라는 이름을 입력합니다.

이 이름은 솔루션 탐색기에서 데이터 원본 뷰의 이름으로 나타납니다.
빈 디자인 창을 마우스 오른쪽 단추로 클릭하고 새 명명된 쿼리를 선택합니다.
명명된 쿼리 만들기 대화 상자에서 이름에 Shifts for Call Center를 입력합니다.

이 이름은 데이터 원본 뷰 디자이너에 명명된 쿼리의 이름으로만 나타납니다.

다음 쿼리 문을 대화 상자의 아래쪽 중간에 있는 SQL 텍스트 창에 붙여 넣습니다.

SELECT DISTINCT WageType, Shift, 
AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,
AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,
AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,
AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues
FROM dbo.FactCallCenter
GROUP BY Shift, WageType

다자인 창에서 Shifts for Call Center 테이블을 마우스 오른쪽 단추로 클릭하고 데이터 탐색을 선택하여 T-SQL 쿼리가 반환한 데이터를 미리 봅니다.
Shifts.dsv(디자인) 탭을 마우스 오른쪽 단추로 클릭한 다음 저장을 클릭하여 새 데이터 원본 뷰 정의를 저장합니다.

각 교대조에 대한 서비스 메트릭 예측

지금까지 각 교대조에 대한 일부 값을 생성했으므로 이제는 이러한 값을 작성한 로지스틱 회귀 모델의 입력으로 사용하여 비즈니스 계획에 사용할 수 있는 일부 예측을 생성합니다.

새 DSV를 예측 쿼리에 대한 입력으로 사용하려면

데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.
마이닝 모델 창에서 모델 선택을 클릭하고 사용 가능한 모델 목록에서 Call Center - LR을 선택합니다.
마이닝 모델 메뉴에서 단일 쿼리 옵션의 선택을 취소합니다. 단일 쿼리 입력이 손실된다는 경고가 표시됩니다. 확인을 클릭합니다.

단일 쿼리 입력 대화 상자가 입력 테이블 선택 대화 상자로 바뀝니다.
사례 테이블 선택을 클릭합니다.
테이블 선택 대화 상자의 데이터 원본 목록에서Shifts를 선택합니다. 테이블/뷰 이름 목록에서 Shifts for Call Center(자동으로 선택될 수 있음)를 선택한 다음 확인을 클릭합니다.

마이닝 모델 예측 디자인 화면이 입력 데이터 및 모델의 열 이름 및 데이터 형식을 기반으로 생성된 매핑을 표시하도록 업데이트됩니다.
조인 선을 마우스 오른쪽 단추로 클릭한 다음 연결 수정을 선택합니다.

이 대화 상자에서는 매핑된 열과 매핑되지 않은 열을 정확하게 볼 수 있습니다. 마이닝 모델에는 Calls, Orders, IssuesRaised 및 LvlTwoOperators 열이 포함되어 있으므로 사용자가 원본 데이터의 이 열을 기반으로 만든 집계로 매핑할 수 있습니다. 이 시나리오에서는 평균으로 매핑합니다.
LevelTwoOperators 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgOperators를 선택합니다.
Calls 옆의 빈 셀을 클릭하고 Shifts for Call Center.AvgCalls를 선택한 다음 확인을 클릭합니다.

각 교대조에 대한 예측을 만들려면

예측 쿼리 작성기의 아래쪽 중간에 있는 표에서 원본 아래에 있는 빈 셀을 클릭한 다음 Shifts for Call Center를 선택합니다.
필드 아래의 빈 셀에서 Shift를 선택합니다.
표의 다음 빈 줄을 클릭하고 위에 설명한 절차를 반복하여 WageType에 대한 다른 행을 추가합니다.
표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 Predict를 선택합니다.
마이닝 모델 창에서 표 아래로 ServiceGrade 열을 끌어 조건/인수 셀에 놓습니다. 별칭 필드에 Predicted Service Grade를 입력합니다.
표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 PredictProbability를 선택합니다.
마이닝 모델 창에서 표 아래로 ServiceGrade 열을 끌어 조건/인수 셀에 놓습니다. 별칭 필드에 Probability를 입력합니다.
쿼리 결과 뷰로 전환을 클릭하여 예측을 봅니다.

다음 표에서는 각 교대조에 대한 결과 예를 보여 줍니다.

Shift	WageType	Predicted Service Grade	확률
AM	holiday	0.165	0.377520666
midnight	holiday	0.105	0.364105573
PM1	holiday	0.165	0.40056055
PM2	holiday	0.165	0.338532973
AM	weekday	0.165	0.370847617
midnight	weekday	0.08	0.352999173
PM1	weekday	0.165	0.317419177
PM2	weekday	0.105	0.311672027

응답 시간 단축이 서비스 등급에 미치는 영향 예측

지금까지 각 교대조에 대한 일부 평균 값을 생성하고 이러�� 값을 로지스틱 회귀 모델의 입력으로 사용했습니다. 그러나 중단율을 0.00-0.05 범위 내로 유지하려는 비즈니스 목표에는 이 결과가 충분하지 않습니다.

따라서 서비스 등급에 대한 응답 시간의 큰 영향력을 보여 준 원래 모델을 기반으로 하여 운영 팀에서는 호출에 응답하는 평균 시간을 줄이면 서비스 품질을 향상시킬 수 있는지를 평가하는 일부 예측을 실행하기로 결정합니다. 예를 들어 현재 통화 응답 시간을 90% 또는 80%까지 줄이면 서비스 등급 값이 어떻게 될지 살펴 봅니다.

각 교대조의 평균 응답 시간을 계산하는 DSV(데이터 원본 뷰)를 만드는 것은 간단합니다. 그런 다음에는 해당 평균 응답 시간의 80% 또는 90%를 계산하는 열을 추가합니다. 그런 다음 DSV를 모델에 대한 입력으로 사용할 수 있습니다.

정확한 단계를 여기에서 보여 주지는 않지만 다음 표에서 응답 시간을 현재 응답 시간의 80% 또는 90%까지 줄일 경우 서비스 등급에 대한 영향을 비교해 봅니다.

이러한 결과를 통해 서비스 품질의 향상을 위해서는 대상 교대조에서 응답 시간을 현재 수준의 90%로 줄여야 한다는 결론을 내릴 수 있습니다.

교대조, 임금 및 요일	현재 평균 응답 시간으로 예측되는 서비스 품질	응답 시간을 90퍼센트 줄여 예측되는 서비스 품질	응답 시간을 80퍼센트 줄여 예측되는 서비스 품질
Holiday AM	0.165	0.05	0.05
Holiday PM1	0.05	0.05	0.05
Holiday Midnight	0.165	0.05	0.05

모델에서 만들 수 있는 여러 가지 기타 예측 쿼리가 있습니다. 예를 들어 특정 서비스 수준을 만족하기 위해 또는 특정 개수의 들어오는 호출에 응답하기 위해 필요한 전화 상담원 수를 예측할 수 있습니다. 로지스틱 회귀 모델에 여러 출력을 포함할 수 있기 때문에 여러 개별 모델을 만들지 않아도 서로 다른 독립 변수 및 결과를 쉽게 경험할 수 있습니다.

설명

Excel 2007용 데이터 마이닝 추가 기능에서는 로지스틱 회귀 마법사를 제공하기 때문에 서비스 등급을 특정 교대조에 대한 대상 수준으로 개선하는 데 필요한 두 번째 수준의 전화 상담원의 수와 같은 복잡한 질문에 보다 쉽게 대답할 수 있습니다. 데이터 마이닝 추가 기능은 무료로 다운로드할 수 있으며 신경망 또는 로지스틱 회귀 알고리즘을 기반으로 하는 마법사를 포함합니다. 자세한 내용은 다음 링크를 참조하십시오.

Office 2005용 SQL Server 2008 데이터 마이닝 추가 기능: 목표 검색 및 가상 시나리오 분석
Office 2007용 SQL Server 2008 데이터 마이닝 추가 기능: 목표 검색 시나리오 분석, 가상 시나리오 분석 및 예측 계산기

결론

이 단원에서는 Microsoft 신경망 알고리즘 및 Microsoft 로지스틱 회귀 알고리즘을 기반으로 하는 마이닝 모델을 생성, 사용자 지정 및 해석하는 방법을 배웠습니다. 이러한 모델 유형은 복잡하고 거의 제한 없이 다양하게 분석될 수 있으므로 복잡하고 마스터하기가 어렵습니다.

그러나 이러한 알고리즘은 요인의 여러 조합을 통해 반복을 수행하고 가장 강력한 상관 관계를 자동으로 식별할 수 있습니다. 이를 통해 Transact-SQL이나 PowerPivot을 사용한 데이터의 수동 탐색을 통해서는 발견하기가 매우 어려운 통찰력에 대한 통계학적 지원을 제공합니다.