Makale
07/26/2011

Neural ağ yapısı ve modeli (Ara veri madenciliği Öğreticisi) oluşturma

Bir veri araştırma modeli, önce veri madenciliği Sihirbazı yeni veri kaynak görünümünü temel alan yeni bir araştırma yapısı oluşturmak için kullanmanız gerekir.Bu görevi bir araştırma yapısı oluşturmak için sihirbaz kullanır ve aynı saat temel alan bir ilişkili araştırma modeli oluşturmak Microsoft Neural ağ algoritması.

Neural ağ son derece esnek ve çok bileşimi girdileri ve çıktıları ve analiz edebilirsiniz çünkü en iyi sonuçlar elde etmek için veri işleme çeşitli yollar ile denemeler yapmalısınız.Örneğin, veri biçimini özelleştirmek isteyebilirsiniz binned, veya gruplandırılmış belirli iş gereksinimlerini hedef almak.Bunu yapmak için yeni bir sütun eklemek araştırma yapısı , sayısal verileri farklı bir şekilde gruplandırır ve sonra yeni sütunu kullanan bir model oluşturmak.Bazı Mavi Havacılık yapmak için bu veri madenciliği modelleri kullanır.

Son olarak, hangi Etkenler iş sorunuz için çok büyük bir etkiye sahip neural ağ modeli öğrendiğiniz zaman için ayrı bir modeli oluşturacak tahmin ve Skor.Kullanacağınız Microsoft Logistic regresyon algoritması, neural ağ modeli esas ancak göre bir çözüm bulmak için getirilmiştirbelirli girdileri.

Varsayılan arama merkezi yapısı oluşturma

Varsayılan neural ağ araştırma yapısı ve modeli oluşturmak için

Solution Explorer'da, Business Intelligence Development Studio, sağ Mining yapıları ve Yeni Mining yapısı.
Üzerinde veri Mining Sihirbazı'na Hoş Geldiniz sayfa,'ı İleri.
Üzerinde tanım yöntemi seçin sayfa, emin olun Varolan ilişkisel veri ambarıtabanı veya veri ambarı ambar seçilir ve i İleri.
Üzerinde veri madenciliği yapısı oluşturma sayfa, doğrulayın seçeneğini bir araştırma modeli ile araştırma yapısı oluşturmak seçilir.
Aşağı açılan listesinde seçeneğini tıklatın hangi veri madenciliği tekniği kullanmak istiyorsunuz?, sonra Microsoft Neural ağları.

Neural ağlarda logistic regresyon modelleri tabanlı olduğundan, aynı yapısını yeniden ve yeni bir araştırma modeli ekleyin.
' I İleri.

The Select Data Source View page appears.
Altında kullanılabilir veri kaynak görünümleri, select Çağrı merkezi,'ı tıklatın ve İleri.
Üzerinde Tablo türlerini belirtmek sayfa, select durumda yanındaki onay kutusunu FactCallCenter tablo.' I İleri.
Üzerinde belirt eğitim veri Seç sayfa anahtar yanında sütun FactCallCenterID.
Seçin Predict ve Giriş onay kutuları.

Seçin anahtar, Giriş, ve Predict onay kutularını aşağıdaki gösterildiği gibi tablo:

Tablo/sütun	Anahtar/giriş/tahmin
AutomaticResponses	Giriş
AverageTimePerIssue	Giriş ve tahmin
Calls	Giriş
DateKey	Kullanmayın.
DayOfWeek	Giriş
FactCallCenterID	Anahtar
IssuesRaised	Giriş
LevelOneOperators	Giriş ve tahmin
LevelTwoOperators	Giriş
Orders	Giriş ve tahmin
ServiceGrade	Giriş ve tahmin
Shift	Giriş
TotalOperators	Kullanmayın.
WageType	Giriş

Üzerinde sütunların belirtin İçerik ve veri türü sayfasında, kılavuzdaki sütunları, içerik türleri ve veri türleri aşağıdaki gösterildiği gibi içerdiğini doğrulayın tablove i İleri.

Columns	İçerik türü	Veri Türleri
AutomaticResponses	Sürekli	Uzun
AverageTimePerIssue	Sürekli	Uzun
Calls	Sürekli	Uzun
DayOfWeek	Ayrık	Metin
FactCallCenterID	Anahtar	Uzun
IssuesRaised	Sürekli	Uzun
LevelOneOperators	Sürekli	Uzun
LevelTwoOperators	Sürekli	Uzun
Orders	Sürekli	Uzun
ServiceGrade	Sürekli	Double
Shift	Ayrık	Metin
WageType	Ayrık	Metin

Üzerinde sınama küme oluştur sayfa, seçenek için metin kutusunu temizleyin veri sınama yüzde.' I İleri.
Üzerinde Sihirbazı Tamamlanıyor sayfa için Araştırma yapısı adı, türü Çağrı merkezi.
İçin madenciliği model adı, type Call Center Default nnve i Son.

The Allow drill through box is disabled because you cannot drill through to data with neural network models.
Solution Explorer'da veri adını sağ araştırma yapısı o, yeni oluşturulmuş ve select işlemi.

Discretization anlama

Sayısal öngörülebilir özniteliğine sahip bir neural ağ modeli oluşturduğunuzda, varsayılan olarak, Microsoft Neural ağ algoritması öznitelik sürekli bir numarası gibi davranır.Örneğin, ServiceGrade öznitelik teorik olarak 0.00 (tüm aramalar yanıtlanır) aralıkları için 1,00 (tüm arayanlar Kapat) sayıdır.Bu veri küme dağılımı aşağıdaki değerlere sahiptir:

Hizmet dağıtımı derecelendirme değerleri

Model işlediğinizde beklediğinizden sonucunda, çıkışları farklı şekilde gruplandırılmış olabilir.Örneğin, kümeleme değer grupları bulmak için kullandığı varsayılan model ayıran ServiceGrade gibi bu aralıkları içine: 0.0748051948 - 0.09716216215.Bu gruplandırma matematiksel olarak doğru olsa da, böyle aralıkları kadar iş kullanıcıları için anlamlı olabilir.Sayısal değerler farklı şekilde gruplandırmak için kopya veya birden çok sayısal veri kopyalarını oluşturabilirsiniz sütun ve veri madenciliği algoritma değerleri nasıl işleneceğini belirtin.Örneğin, algoritma beşten fazla gözlerinin değerleri bölmek belirtebilir.

Analysis Services binning veya sayısal veri işleme için yöntemler sağlar.Aşağıdaki tablo sonuçlar arasındaki farklılıklar gösterilmektedir, çıkış öznitelik ServiceGrade üç farklı şekilde işlenir:

Sürekli bir numara değerlendirmesini
Kümeleme olarak gerçekleşen olası en iyi yöntem, değer ayırmak algoritmasının değerlerdeki
Sayıları eşit alanları yöntem binned belirtme

Varsayılan model (sürekli)	Tarafından binnedkümeleme	Eşit alanlar tarafından binned
VALUEDESTEK Eksik0 0.09875120	VALUEDESTEK < 0.074805194834 0.0748051948 - 0.0971621621527 0.09716216215 - 0.1329729729539 0.13297297295 - 0.16749999997510 >= 0.16749999997510	VALUEDESTEK < 0.0726 0.07 - 0.0022 0.09 - 0.1136 >= 0.1236

Bu tablo, değer sütununda sürekli numarasını nasıl işlenmiş gösterir ve Destek sütun satırların sayısını, bu değer, aralık veya değer türü bulunamadı gösterir.Binning seçenekleri hakkında daha fazla bilgi için bkz: Discretization yöntemleri (veri madenciliği).

Not

Siz bu İstatistikler modelinin Marjinal istatistikleri düğüm tüm verileri işlendikten sonra elde edebilirsiniz.Marjinal istatistikleri düğüm hakkında daha fazla bilgi için bkz: Neural ağ modeller için içerik modeli mining (Analysis Services - veri madenciliği).

Alternatively, rather than using the numeric values, you could add a separate derived column that classifies the service grades into predefined target ranges, such as Best (ServiceGrade <= 0.05), Acceptable (0.10 > ServiceGrade > 0.05), and Poor (ServiceGrade >= 0.10).

Bir sütun, bir kopyasını oluşturmak ve Discretization yöntemini değiştirme

Analysis Services veri madenciliği, sayısal veri binned emin şekilde kolayca değiştirebilirsiniz hedef verileri içeren bir kopyasını bir sütun ekleyerek bir araştırma yapısı içinde ve discretization yöntem değiştirme.

Aşağıdaki yordam bir kopyasını hedef öznitelik içeren araştırma sütun açıklar ServiceGrade.Herhangi bir sütun birden çok kopyasını oluşturabilirsiniz bir araştırma yapısı, öngörülebilir öznitelik dahil olmak üzere.

Sayısal değerler kopyalanan gruplandırma sonra özelleştirmek sütun, gruplandırmalar karmaşıklığını azaltmak için.Bu öğretici için eşit alanları discretization yöntem kullanın ve dört demetleri belirtin.Buradan neden gruplandırmalar yöntem oldukça yakın ilgi iş kullanıcılarınız için hedef değerleri kalırlar.

Not

Verileri ilk incelenmesi sırasında Ayrıca çeşitli discretization yöntemleriyle denemeniz veya verileri ilk kümeleme deneyin.

Bir sütunda özelleştirilmiş bir kopyasını oluşturmak içinaraştırma yapısı

Solution Explorer'da, yeni oluşturduğunuz araştırma yapısı çift tıklatın.
Araştırma yapısı, sekmesini bir araştırma yapısı Sütun Ekle.
De sütununu Seç iletişim kutusunda seçin ServiceGrade listesinden kaynak sütun, i Tamam.

Yeni bir sütun araştırma yapısı sütunlar listesine eklenir.Varsayılan olarak, yeni araştırma sütun aynı ada sayısal bir sonek ile varolan bir sütun vardır: for example, ServiceGrade 1.Bu adı değiştirebilirsiniz sütun daha açıklayıcı olması için.

Discretization yöntem de belirtirsiniz.
Sağ ServiceGrade 1 ve Özellikler.
De Özellikler penceresinde, bulun ad özellik ve Call Center Binned nn için adını değiştirin.
Tüm ilgili araştırma modeli sütun adı için aynı değişikliği yapmak istediğinizi soran bir iletişim kutusu görüntülenir.Click No.
De Özellikler penceresinde, bölümünü bulun Veri türü ve gerekirse genişletin.
Özellik değerini değiştirmek Content dan Continuous için Discretized.

Aşağıdaki özellikler kullanılabilir.Aşağıdaki gösterildiği gibi özelliklerin değerlerini değiştirmek tablo:

Özellik

Varsayılan değer

Yeni değer

DiscretizationMethod

Continuous

EqualAreas

DiscretizationBucketCount

Değer yok

4

Not

Varsayılan değer olan DiscretizationBucketCount aslında algoritma otomatik olarak en uygun demetleri. sayısını belirler yani 0,Bu nedenle, bu değerini sıfırlamak isterseniz, özellik , varsayılan olarak 0 yazın.
Veri Mining Tasarımcısı'nda [NULL]'ı Mining modeller sekmesi.

Bir kopyasını, bir araştırma yapısı sütunu eklediğinizde, kullanım bayrağı kopya otomatik olarak fark küme için Ignore.Genellikle, bir araştırma yapısı bir kopyasını bir sütun eklediğinizde, kopyayı özgün sütunu ile birlikte analiz için kullanacağınız değil veya algoritma diğer ilişkiler görünmez hale getirmemelidir iki sütun arasında güçlü bir korelasyon bulacaksınız.

Özellik	Varsayılan değer	Yeni değer
DiscretizationMethod	Continuous	EqualAreas
DiscretizationBucketCount	Değer yok	4

Yeni araştırma modeli için bir araştırma yapısı ekleme

Hedef öznitelik için yeni bir gruplandırma oluşturmuş olduğunuz artık, kullandığı yeni bir araştırma modeli eklemenize gerek ayrık değerli sütun.İşiniz bittiğinde, CallCenter Araştırma yapısı iki veri madenciliği modelleri vardır:

Araştırma modeli, Call Center Default NN, tutamaçları ServiceGrade değerler olarak sürekli bir aralık.
Araştırma modeli, Call Center Binned NN, discretizes ServiceGrade değerlere dört ayrı demetleri.

Yeni alarak bir araştırma modeli eklemek içinayrık değerli sütun

Oluşturulan yeni araştırma yapısı Solution Explorer'da sağ tıklatın ve seçin açık.
' I Mining modeller sekmesi.
' I ilgili araştırma modeli oluşturma.
De Yeni Mining modeli iletişim kutusu için Model adı, type Call Center Binned nn.De algoritma adı Seç aşağı açılan liste Microsoft Neural ağ.
Yeni araştırma modeli içinde bulunan sütunlar listesinde bulun ServiceGradeve kullanımdan değiştirmek Predict için Ignore.
Benzer şekilde, bulun ServiceGrade Binnedve kullanımdan değiştirmek Ignore için Predict.

Normalde farklı öngörülebilir öznitelikleri kullanın veri madenciliği modelleri karşılaştıramazsınız.Bununla birlikte, SQL Server 2008, bir diğer ad için bir araştırma modeli sütun oluşturmaYani, yeniden ServiceGrade Binned içinde sütun araştırma modeli özgün sütun. aynı ada sahip olacak şekildeVerileri farklı discretized rağmen daha sonra doğrudan bu iki modeli doğruluğunu grafikte karşılaştırabilirsiniz.

Bir araştırma modeli bir araştırma yapısı sütun için bir diğer ad eklemek için

De Mining modeller altında sekme yapısı, select ServiceGrade Binned.

Dikkat Özellikler pencere ScalarMiningStructure sütun nesnesinin özelliklerini görüntüler.
Sütun için araştırma modeli altında 'yiServiceGrade Binned NNsütun karşılık gelen hücre ServiceGrade Binned.

Not Bu şimdi Özellikler penceresi MiningModelColumn nesne özelliklerini görüntüler.
Bulun ad özellik, değerini değiştirin ve ServiceGrade.

Bulun Açıklama özellik ve tür geçici bir sütun diğer ad ad adı.

The Properties window should contain the following information:

Özellik	Değer
Açıklama	Geçici bir sütun diğer ad ad adı
No	ServiceGrade Binned
Bayrakları modelleme
Ad	Servis notu
SourceColumn kimliği	Hizmet notu 1
Kullanım	Tahmin

Herhangi bir yeri tıklatın Mining modeli sekmesi.

Kılavuzun yeni geçici bir sütun diğer ad ad adı gösterecek şekilde güncelleştirilir ServiceGrade, sütun kullanımı yanında.Araştırma yapısı ve iki veri madenciliği modelleri içeren kılavuz aşağıdaki gibi görünmelidir:

Yapı	Çağrı Merkezi varsayılan nn	Çağrı merkezi Binned nn
	Microsoft Neural ağ	Microsoft Neural ağ
AutomaticResponses	Giriş	Giriş
AverageTimePerIssue	Tahmin	Tahmin
Aramalar	Giriş	Giriş
DayOfWeek	Giriş	Giriş
FactCallCenterID	Anahtar	Anahtar
IssuesRaised	Giriş	Giriş
LevelOneOperators	Giriş	Giriş
LevelTwoOperators	Giriş	Giriş
Sipariş	Giriş	Giriş
Binned ServceGrade	Yoksay	Tahmin (ServiceGrade)
ServiceGrade	Tahmin	Yoksay
Shift	Giriş	Giriş
Toplam İşletmenleri	Giriş	Giriş
WageType	Giriş	Giriş

Model işleme

Son olarak, oluşturduğunuz modelleri karşılaştırılabilir olmasını sağlamak için tohum parametresi hem varsayılan hem de binned modelleri için küme.Garanti her modeli aynı noktadan veri işleme başlar tohum değerini ayarlama.

Not

Tohum parametresi için sayısal bir değer belirtmezseniz, sql Server Analysis Services modelinin adını temel alarak bir tohum oluşturacaktır.Neural ağ modeli ve logistic regresyon modeli farklı adlara sahip olduğundan gerekir küme bunlar aynı sırada verileri işleme sağlamak için tohum değeri.

Tohum belirtin ve modelleri işlemek için

De Mining modeli sekmesinde, sağ tıklatın sütun adlı modeli için Call Center - LRve Ayarla algoritma parametreleri.
Satır holdout_seed parametresi altında boş hücre tıklatın değerive 1.Click OK.Yapısı ile ilişkili her model için bu adımı yineleyin.

Not

İlgili tüm modeller için aynı tohum kullandığınız sürece tohum seçtiğiniz değer, önemli değildir.
De Mining modeller Seç menüsünden işlem Mining yapısı ve tüm modeller.' I Evet güncelleştirilmiş veri madenciliği projeyi sunucuya dağıtmak için.
De İşlem Mining modeli iletişim kutusunda'ı çalıştırmak.
Tıklatın kapatmak kapatmak için Süreci devam eden iletişim kutusunu tıklatın ve sonra kapatmak yeniden İşlem Mining modeli iletişim kutusu.

Oluşturduğunuz iki ilgili veri madenciliği modelleri artık, verilerdeki ilişkileri keşfetmek için veri inceleyeceksiniz.

Share via