Neural ağ yapısı ve modeli (Ara veri madenciliği Öğreticisi) oluşturma
Bir veri araştırma modeli, önce veri madenciliği Sihirbazı yeni veri kaynak görünümünü temel alan yeni bir araştırma yapısı oluşturmak için kullanmanız gerekir.Bu görevi bir araştırma yapısı oluşturmak için sihirbaz kullanır ve aynı saat temel alan bir ilişkili araştırma modeli oluşturmak Microsoft Neural ağ algoritması.
Neural ağ son derece esnek ve çok bileşimi girdileri ve çıktıları ve analiz edebilirsiniz çünkü en iyi sonuçlar elde etmek için veri işleme çeşitli yollar ile denemeler yapmalısınız.Örneğin, veri biçimini özelleştirmek isteyebilirsiniz binned, veya gruplandırılmış belirli iş gereksinimlerini hedef almak.Bunu yapmak için yeni bir sütun eklemek araştırma yapısı , sayısal verileri farklı bir şekilde gruplandırır ve sonra yeni sütunu kullanan bir model oluşturmak.Bazı Mavi Havacılık yapmak için bu veri madenciliği modelleri kullanır.
Son olarak, hangi Etkenler iş sorunuz için çok büyük bir etkiye sahip neural ağ modeli öğrendiğiniz zaman için ayrı bir modeli oluşturacak tahmin ve Skor.Kullanacağınız Microsoft Logistic regresyon algoritması, neural ağ modeli esas ancak göre bir çözüm bulmak için getirilmiştirbelirli girdileri.
Varsayılan arama merkezi yapısı oluşturma
Varsayılan neural ağ araştırma yapısı ve modeli oluşturmak için
Solution Explorer'da, Business Intelligence Development Studio, sağ Mining yapıları ve Yeni Mining yapısı.
Üzerinde veri Mining Sihirbazı'na Hoş Geldiniz sayfa,'ı İleri.
Üzerinde tanım yöntemi seçin sayfa, emin olun Varolan ilişkisel veri ambarıtabanı veya veri ambarı ambar seçilir ve i İleri.
Üzerinde veri madenciliği yapısı oluşturma sayfa, doğrulayın seçeneğini bir araştırma modeli ile araştırma yapısı oluşturmak seçilir.
Aşağı açılan listesinde seçeneğini tıklatın hangi veri madenciliği tekniği kullanmak istiyorsunuz?, sonra Microsoft Neural ağları.
Neural ağlarda logistic regresyon modelleri tabanlı olduğundan, aynı yapısını yeniden ve yeni bir araştırma modeli ekleyin.
' I İleri.
The Select Data Source View page appears.
Altında kullanılabilir veri kaynak görünümleri, select Çağrı merkezi,'ı tıklatın ve İleri.
Üzerinde Tablo türlerini belirtmek sayfa, select durumda yanındaki onay kutusunu FactCallCenter tablo.' I İleri.
Üzerinde belirt eğitim veri Seç sayfa anahtar yanında sütun FactCallCenterID.
Seçin Predict ve Giriş onay kutuları.
Seçin anahtar, Giriş, ve Predict onay kutularını aşağıdaki gösterildiği gibi tablo:
Tablo/sütun
Anahtar/giriş/tahmin
AutomaticResponses
Giriş
AverageTimePerIssue
Giriş ve tahmin
Calls
Giriş
DateKey
Kullanmayın.
DayOfWeek
Giriş
FactCallCenterID
Anahtar
IssuesRaised
Giriş
LevelOneOperators
Giriş ve tahmin
LevelTwoOperators
Giriş
Orders
Giriş ve tahmin
ServiceGrade
Giriş ve tahmin
Shift
Giriş
TotalOperators
Kullanmayın.
WageType
Giriş
Üzerinde sütunların belirtin İçerik ve veri türü sayfasında, kılavuzdaki sütunları, içerik türleri ve veri türleri aşağıdaki gösterildiği gibi içerdiğini doğrulayın tablove i İleri.
Columns
İçerik türü
Veri Türleri
AutomaticResponses
Sürekli
Uzun
AverageTimePerIssue
Sürekli
Uzun
Calls
Sürekli
Uzun
DayOfWeek
Ayrık
Metin
FactCallCenterID
Anahtar
Uzun
IssuesRaised
Sürekli
Uzun
LevelOneOperators
Sürekli
Uzun
LevelTwoOperators
Sürekli
Uzun
Orders
Sürekli
Uzun
ServiceGrade
Sürekli
Double
Shift
Ayrık
Metin
WageType
Ayrık
Metin
Üzerinde sınama küme oluştur sayfa, seçenek için metin kutusunu temizleyin veri sınama yüzde.' I İleri.
Üzerinde Sihirbazı Tamamlanıyor sayfa için Araştırma yapısı adı, türü Çağrı merkezi.
İçin madenciliği model adı, type Call Center Default nnve i Son.
The Allow drill through box is disabled because you cannot drill through to data with neural network models.
Solution Explorer'da veri adını sağ araştırma yapısı o, yeni oluşturulmuş ve select işlemi.
Discretization anlama
Sayısal öngörülebilir özniteliğine sahip bir neural ağ modeli oluşturduğunuzda, varsayılan olarak, Microsoft Neural ağ algoritması öznitelik sürekli bir numarası gibi davranır.Örneğin, ServiceGrade öznitelik teorik olarak 0.00 (tüm aramalar yanıtlanır) aralıkları için 1,00 (tüm arayanlar Kapat) sayıdır.Bu veri küme dağılımı aşağıdaki değerlere sahiptir:
Model işlediğinizde beklediğinizden sonucunda, çıkışları farklı şekilde gruplandırılmış olabilir.Örneğin, kümeleme değer grupları bulmak için kullandığı varsayılan model ayıran ServiceGrade gibi bu aralıkları içine: 0.0748051948 - 0.09716216215.Bu gruplandırma matematiksel olarak doğru olsa da, böyle aralıkları kadar iş kullanıcıları için anlamlı olabilir.Sayısal değerler farklı şekilde gruplandırmak için kopya veya birden çok sayısal veri kopyalarını oluşturabilirsiniz sütun ve veri madenciliği algoritma değerleri nasıl işleneceğini belirtin.Örneğin, algoritma beşten fazla gözlerinin değerleri bölmek belirtebilir.
Analysis Services binning veya sayısal veri işleme için yöntemler sağlar.Aşağıdaki tablo sonuçlar arasındaki farklılıklar gösterilmektedir, çıkış öznitelik ServiceGrade üç farklı şekilde işlenir:
Sürekli bir numara değerlendirmesini
Kümeleme olarak gerçekleşen olası en iyi yöntem, değer ayırmak algoritmasının değerlerdeki
Sayıları eşit alanları yöntem binned belirtme
Varsayılan model (sürekli) |
Tarafından binnedkümeleme |
Eşit alanlar tarafından binned |
---|---|---|
VALUEDESTEK
Eksik0
0.09875120
|
VALUEDESTEK
< 0.074805194834
0.0748051948 - 0.0971621621527
0.09716216215 - 0.1329729729539
0.13297297295 - 0.16749999997510
>= 0.16749999997510
|
VALUEDESTEK
< 0.0726
0.07 - 0.0022
0.09 - 0.1136
>= 0.1236
|
Bu tablo, değer sütununda sürekli numarasını nasıl işlenmiş gösterir ve Destek sütun satırların sayısını, bu değer, aralık veya değer türü bulunamadı gösterir.Binning seçenekleri hakkında daha fazla bilgi için bkz: Discretization yöntemleri (veri madenciliği).
Not
Siz bu İstatistikler modelinin Marjinal istatistikleri düğüm tüm verileri işlendikten sonra elde edebilirsiniz.Marjinal istatistikleri düğüm hakkında daha fazla bilgi için bkz: Neural ağ modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Alternatively, rather than using the numeric values, you could add a separate derived column that classifies the service grades into predefined target ranges, such as Best (ServiceGrade <= 0.05), Acceptable (0.10 > ServiceGrade > 0.05), and Poor (ServiceGrade >= 0.10).
Bir sütun, bir kopyasını oluşturmak ve Discretization yöntemini değiştirme
Analysis Services veri madenciliği, sayısal veri binned emin şekilde kolayca değiştirebilirsiniz hedef verileri içeren bir kopyasını bir sütun ekleyerek bir araştırma yapısı içinde ve discretization yöntem değiştirme.
Aşağıdaki yordam bir kopyasını hedef öznitelik içeren araştırma sütun açıklar ServiceGrade.Herhangi bir sütun birden çok kopyasını oluşturabilirsiniz bir araştırma yapısı, öngörülebilir öznitelik dahil olmak üzere.
Sayısal değerler kopyalanan gruplandırma sonra özelleştirmek sütun, gruplandırmalar karmaşıklığını azaltmak için.Bu öğretici için eşit alanları discretization yöntem kullanın ve dört demetleri belirtin.Buradan neden gruplandırmalar yöntem oldukça yakın ilgi iş kullanıcılarınız için hedef değerleri kalırlar.
Not
Verileri ilk incelenmesi sırasında Ayrıca çeşitli discretization yöntemleriyle denemeniz veya verileri ilk kümeleme deneyin.
Bir sütunda özelleştirilmiş bir kopyasını oluşturmak içinaraştırma yapısı
Solution Explorer'da, yeni oluşturduğunuz araştırma yapısı çift tıklatın.
Araştırma yapısı, sekmesini bir araştırma yapısı Sütun Ekle.
De sütununu Seç iletişim kutusunda seçin ServiceGrade listesinden kaynak sütun, i Tamam.
Yeni bir sütun araştırma yapısı sütunlar listesine eklenir.Varsayılan olarak, yeni araştırma sütun aynı ada sayısal bir sonek ile varolan bir sütun vardır: for example, ServiceGrade 1.Bu adı değiştirebilirsiniz sütun daha açıklayıcı olması için.
Discretization yöntem de belirtirsiniz.
Sağ ServiceGrade 1 ve Özellikler.
De Özellikler penceresinde, bulun ad özellik ve Call Center Binned nn için adını değiştirin.
Tüm ilgili araştırma modeli sütun adı için aynı değişikliği yapmak istediğinizi soran bir iletişim kutusu görüntülenir.Click No.
De Özellikler penceresinde, bölümünü bulun Veri türü ve gerekirse genişletin.
Özellik değerini değiştirmek Content dan Continuous için Discretized.
Aşağıdaki özellikler kullanılabilir.Aşağıdaki gösterildiği gibi özelliklerin değerlerini değiştirmek tablo:
Özellik
Varsayılan değer
Yeni değer
DiscretizationMethod
Continuous
EqualAreas
DiscretizationBucketCount
Değer yok
4
Not
Varsayılan değer olan DiscretizationBucketCount aslında algoritma otomatik olarak en uygun demetleri. sayısını belirler yani 0,Bu nedenle, bu değerini sıfırlamak isterseniz, özellik , varsayılan olarak 0 yazın.
Veri Mining Tasarımcısı'nda [NULL]'ı Mining modeller sekmesi.
Bir kopyasını, bir araştırma yapısı sütunu eklediğinizde, kullanım bayrağı kopya otomatik olarak fark küme için Ignore.Genellikle, bir araştırma yapısı bir kopyasını bir sütun eklediğinizde, kopyayı özgün sütunu ile birlikte analiz için kullanacağınız değil veya algoritma diğer ilişkiler görünmez hale getirmemelidir iki sütun arasında güçlü bir korelasyon bulacaksınız.
Yeni araştırma modeli için bir araştırma yapısı ekleme
Hedef öznitelik için yeni bir gruplandırma oluşturmuş olduğunuz artık, kullandığı yeni bir araştırma modeli eklemenize gerek ayrık değerli sütun.İşiniz bittiğinde, CallCenter Araştırma yapısı iki veri madenciliği modelleri vardır:
Araştırma modeli, Call Center Default NN, tutamaçları ServiceGrade değerler olarak sürekli bir aralık.
Araştırma modeli, Call Center Binned NN, discretizes ServiceGrade değerlere dört ayrı demetleri.
Yeni alarak bir araştırma modeli eklemek içinayrık değerli sütun
Oluşturulan yeni araştırma yapısı Solution Explorer'da sağ tıklatın ve seçin açık.
' I Mining modeller sekmesi.
' I ilgili araştırma modeli oluşturma.
De Yeni Mining modeli iletişim kutusu için Model adı, type Call Center Binned nn.De algoritma adı Seç aşağı açılan liste Microsoft Neural ağ.
Yeni araştırma modeli içinde bulunan sütunlar listesinde bulun ServiceGradeve kullanımdan değiştirmek Predict için Ignore.
Benzer şekilde, bulun ServiceGrade Binnedve kullanımdan değiştirmek Ignore için Predict.
Normalde farklı öngörülebilir öznitelikleri kullanın veri madenciliği modelleri karşılaştıramazsınız.Bununla birlikte, SQL Server 2008, bir diğer ad için bir araştırma modeli sütun oluşturmaYani, yeniden ServiceGrade Binned içinde sütun araştırma modeli özgün sütun. aynı ada sahip olacak şekildeVerileri farklı discretized rağmen daha sonra doğrudan bu iki modeli doğruluğunu grafikte karşılaştırabilirsiniz.
Bir araştırma modeli bir araştırma yapısı sütun için bir diğer ad eklemek için
De Mining modeller altında sekme yapısı, select ServiceGrade Binned.
Dikkat Özellikler pencere ScalarMiningStructure sütun nesnesinin özelliklerini görüntüler.
Sütun için araştırma modeli altında 'yiServiceGrade Binned NNsütun karşılık gelen hücre ServiceGrade Binned.
Not Bu şimdi Özellikler penceresi MiningModelColumn nesne özelliklerini görüntüler.
Bulun ad özellik, değerini değiştirin ve ServiceGrade.
Bulun Açıklama özellik ve tür geçici bir sütun diğer ad ad adı.
The Properties window should contain the following information:
Özellik
Değer
Açıklama
Geçici bir sütun diğer ad ad adı
No
ServiceGrade Binned
Bayrakları modelleme
Ad
Servis notu
SourceColumn kimliği
Hizmet notu 1
Kullanım
Tahmin
Herhangi bir yeri tıklatın Mining modeli sekmesi.
Kılavuzun yeni geçici bir sütun diğer ad ad adı gösterecek şekilde güncelleştirilir ServiceGrade, sütun kullanımı yanında.Araştırma yapısı ve iki veri madenciliği modelleri içeren kılavuz aşağıdaki gibi görünmelidir:
Yapı
Çağrı Merkezi varsayılan nn
Çağrı merkezi Binned nn
Microsoft Neural ağ
Microsoft Neural ağ
AutomaticResponses
Giriş
Giriş
AverageTimePerIssue
Tahmin
Tahmin
Aramalar
Giriş
Giriş
DayOfWeek
Giriş
Giriş
FactCallCenterID
Anahtar
Anahtar
IssuesRaised
Giriş
Giriş
LevelOneOperators
Giriş
Giriş
LevelTwoOperators
Giriş
Giriş
Sipariş
Giriş
Giriş
Binned ServceGrade
Yoksay
Tahmin (ServiceGrade)
ServiceGrade
Tahmin
Yoksay
Shift
Giriş
Giriş
Toplam İşletmenleri
Giriş
Giriş
WageType
Giriş
Giriş
Model işleme
Son olarak, oluşturduğunuz modelleri karşılaştırılabilir olmasını sağlamak için tohum parametresi hem varsayılan hem de binned modelleri için küme.Garanti her modeli aynı noktadan veri işleme başlar tohum değerini ayarlama.
Not
Tohum parametresi için sayısal bir değer belirtmezseniz, sql Server Analysis Services modelinin adını temel alarak bir tohum oluşturacaktır.Neural ağ modeli ve logistic regresyon modeli farklı adlara sahip olduğundan gerekir küme bunlar aynı sırada verileri işleme sağlamak için tohum değeri.
Tohum belirtin ve modelleri işlemek için
De Mining modeli sekmesinde, sağ tıklatın sütun adlı modeli için Call Center - LRve Ayarla algoritma parametreleri.
Satır holdout_seed parametresi altında boş hücre tıklatın değerive 1.Click OK.Yapısı ile ilişkili her model için bu adımı yineleyin.
Not
İlgili tüm modeller için aynı tohum kullandığınız sürece tohum seçtiğiniz değer, önemli değildir.
De Mining modeller Seç menüsünden işlem Mining yapısı ve tüm modeller.' I Evet güncelleştirilmiş veri madenciliği projeyi sunucuya dağıtmak için.
De İşlem Mining modeli iletişim kutusunda'ı çalıştırmak.
Tıklatın kapatmak kapatmak için Süreci devam eden iletişim kutusunu tıklatın ve sonra kapatmak yeniden İşlem Mining modeli iletişim kutusu.
Oluşturduğunuz iki ilgili veri madenciliği modelleri artık, verilerdeki ilişkileri keşfetmek için veri inceleyeceksiniz.