콜 센터 데이터의 데이터 원본 뷰 추가(중급 데이터 마이닝 자습서)
적용 대상: SQL Server 2016 Preview
이 태스크에서는 콜 센터 데이터에 액세스하는 데 사용할 데이터 원본 뷰를 추가합니다. 탐색을 위한 초기 신경망 모델과 권장하는 데 사용할 로지스틱 회귀 모델 모두를 작성하는 데 동일한 데이터가 사용됩니다.
또한 데이터 원본 뷰 디자이너를 사용하여 요일에 대한 열을 추가합니다. 이는 원본 데이터가 콜 센터 데이터를 날짜별로 추적하더라도 해당 요일이 평일 또는 주중인지 여부에 따라 호출량 및 서비스 품질 측면 모두에 경험적으로 되풀이되는 패턴이 있기 때문입니다.
절차
데이터 원본 뷰를 추가하려면
솔루션 탐색기, 를 마우스 오른쪽 단추로 클릭 데이터 원본 뷰, 를 선택 하 고 새 데이터 원본 뷰합니다.
데이터 원본 뷰 마법사가 열립니다.
데이터 원본 뷰 마법사 시작 페이지에서 다음을 클릭합니다.
에 데이터 소스 선택 페이지의 관계형 데이터 원본, 선택는 Adventure Works DW Multidimensional 2012 데이터 원본입니다. 이 데이터 소스를 하지 않은 경우 참조 기본 데이터 마이닝 자습서합니다. 다음을 클릭합니다.
에 테이블 및 뷰 선택 페이지에서 다음 표에서 선택한 데이터 원본 뷰를 추가 하려면 오른쪽 화살표를 클릭 합니다.
FactCallCenter(dbo)
DimDate
다음을 클릭합니다.
에 마법사 완료 데이터 원본 뷰의 이름이 기본적으로 페이지 Adventure Works DW Multidimensional 2012합니다. 이름을 CallCenter, 를 클릭 하 고 마침합니다.
데이터 원본 뷰 디자이너가 열리면서 표시 하는 CallCenter 데이터 원본 뷰를 합니다.
데이터 원본 뷰 창 안쪽을 마우스 오른쪽 단추로 누르고 테이블 추가/제거합니다. 테이블을 DimDate 클릭 확인합니다.
간의 관계를 자동으로 추가 해야는 DateKey 각 테이블의 열입니다. 이 관계를 사용 하면 열에서 가져올 수는 EnglishDayNameOfWeek, 에서 DimDate 테이블 모델에 사용 합니다.
데이터 원본 뷰 디자이너에서 테이블을 마우스 오른쪽 단추로 클릭 FactCallCenter, 를 선택 하 고 새 명명 된 계산합니다.
에 명명 된 계산 만들기 대화 상자에서 다음 값을 입력 합니다.
열 이름 DayOfWeek Description DimDate 테이블에서 요일을 얻음 식 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)
식은 데이터를 만듭니다를 확인 하려면 테이블을 마우스 단추로 필요한 FactCallCenter, 를 선택한 다음 데이터 탐색합니다.
데이터가 사용 가능한지 검토하는 데에 1분 정도 소요되며, 이를 통해 데이터 마이닝에 해당 데이터가 어떻게 사용되는지 알 수 있습니다.
열 이름 | 포함 |
---|---|
FactCallCenterID | 데이터를 데이터 웨어하우스로 가져올 때 만든 임의 키입니다. 이 열은 고유 레코드를 식별하며 데이터 마이닝 모델에 대한 사례 키로 사용해야 합니다. |
DateKey | 콜 센터 운영 날짜로, 정수로 표시됩니다. 정수 날짜 키는 데이터 웨어하우스에서 종종 사용되지만, 날짜 값으로 그룹화하려는 경우 날짜/시간 형식으로 날짜를 구할 수도 있습니다. 공급업체에서 각 운영일의 각 교대조에 대해 별도의 보고서를 제공하기 때문에 날짜는 고유하지 않습니다. |
WageType | 날짜가 평일인지, 아니면 주말 또는 공휴일인지를 나타냅니다. 있기 차이가 고객 서비스 품질에서 주중 및 주말에 대 한 입력으로이 열을 사용 합니다. |
Shift | 통화를 기록한 교대조를 나타냅니다. 이 콜 센터는 영업일을 4개의 교대조인 오전, 오후 1, 오후 2 및 자정으로 나눕니다. 교대조가 고객 서비스 품질에 영향을 줄 수 있으므로 이를 입력으로 사용합니다. |
LevelOneOperators | 근무 중인 첫 번째 수준의 전화 상담원 수를 나타냅니다. 콜 센터 직원은 첫 번째 수준부터 시작하므로 이러한 직원은 덜 숙련되어 있습니다. |
LevelTwoOperators | 근무 중인 두 번째 수준의 전화 상담원 수를 나타냅니다. 직원이 두 번째 수준의 전화 상담원이 되기 위해서는 특정 서비스 시간을 기록해야 합니다. |
TotalOperators | 교대조 동안 근무하는 총 전화 상담원 수입니다. |
Calls | 교대조 동안 받은 호출 수입니다. |
AutomaticResponses | 자동 호출 처리 시스템인 IVR(Interactive Voice Response)을 통해 완전히 처리된 호출 수입니다. |
Orders | 호출 결과로 발생한 주문 수입니다. |
IssuesRaised | 호출로 인해 생성된 후속 작업이 필요한 문제 수입니다. |
AverageTimePerIssue | 들어오는 호출에 응답하는 데 필요한 평균 시간입니다. |
ServiceGrade | 서비스의 전체적인 품질을 나타내는 메트릭으로으로 측정 되는 중단 율 전체 교대조에 대 한 합니다. 중단율이 높을수록 고객이 불만을 느끼며 잠재 주문 기회를 놓칠 가능성이 높습니다. |
데이터는 단일 날짜 열을 기반으로 하는 네 개의 다른 열에 참고: WageType, DayOfWeek, Shift, 및 DateKey합니다. 일반적으로 데이터 마이닝에서는 동일한 데이터로부터 파생된 여러 열을 사용하는 것이 바람직하지 않습니다. 이는 값들이 서로 너무 강한 상관 관계를 갖고 있으며 기타 패턴을 명확하게 나타내지 못할 수 있기 때문입니다.
하지만 사용 하지 것입니다 DateKey 모델에 너무 많은 고유 값이 들어 있으므로 합니다. 간에 직접 관계가 없습니다 Shift 및 DayOfWeek, 및 WageType 및 DayOfWeek 부분적 으로만 관련 됩니다. 공선성에 대해 염려되는 경우 사용 가능한 전체 열을 사용하여 구조를 만든 다음 각 모델의 서로 다른 열을 무시하고 그 영향을 시험할 수 있습니다.
단원의 다음 태스크
신경망 구조 및 모델 ( 중급 데이터 마이닝 자습서 ) 만들기