Typy zawartości (wyszukiwania danych)

In Microsoft SQL Server Usługi Analysis Services, you can define the both the physical data type for a column in a mining structure, and a logical content type for the column when used in a model,

Typ danych określa sposób algorytmów przetwarzania danych w tych kolumnach, podczas tworzenia modeli wyszukiwania.Definiowanie typu danych kolumna daje algorytm informacje dotyczące typu danych w kolumnach oraz sposób przetwarzania danych.Każdy typ danych w Usługi Analysis Services obsługuje jeden lub więcej typów zawartości do wyszukiwanie danych.

Typ zawartości opisuje zachowanie zawartości, która zawiera kolumna.Na przykład jeśli zawartość kolumna powtarza się w określonych interwałach, takich jak dni tygodnia, można określić typ zawartości kolumna jako cykliczny.

Niektóre algorytmy wymagają specyficznymi typami danych i określonych typów zawartości możliwe było funkcja poprawnie.Na przykład algorytm Microsoft Naive Bayes nie może używać ciągłej kolumn jako dane wejściowe i nie można przewidzieć ciągłej wartości.Typy zawartości, takich jak sekwencję klawiszy są używane tylko przez określonego algorytmu.Listę algorytmów i typów zawartości, że każdy obsługuje, zobacz Algorytmów wyszukiwania danych (Analysis Services - wyszukiwania danych).

Poniżej opisano typy zawartości, które są używane w wyszukiwanie danych i identyfikuje typy danych, które obsługują każdego typu.

Dyskretne

Dyskretne oznacza, że kolumna zawiera skończoną liczbę wartości nie swoich między wartościami.Na przykład kolumna płci jest kolumną typowego atrybut dyskretnych w danych reprezentuje określoną liczbę kategorii.

Wartości kolumna discrete atrybut nie implikują zamawiania, nawet jeśli wartości liczbowe.Ponadto nawet jeśli wartości używane dla discrete kolumna liczbowe, nie można obliczyć wartości ułamkowych.Kody obszaru telefonu są dobrym przykładem discrete dane liczbowe.

Discrete Typ zawartości jest obsługiwany przez wszystkie wyszukiwanie danych danych typów.

Ciągłe

Ciągłe oznacza, że kolumna zawiera wartości, które reprezentują dane liczbowe na skalę, która umożliwia tymczasowe wartości.W odróżnieniu od discrete kolumna, która reprezentuje dane ograniczone, policzalnych, ciągłej kolumnie reprezentuje pomiarów skalowalne i możliwe, dane zawierają nieskończoną liczbę wartości ułamkowych.Kolumna temperatur jest przykładem kolumny ciągłego atrybut.

Gdy kolumna zawiera dane liczbowe ciągłe i wiesz, jak dane powinny być rozdzielone, potencjalnie może poprawić dokładności analizy określając dystrybucji oczekiwanej wartości.Określanie podział kolumna poziom struktura wyszukiwania.Dlatego ustawienie dotyczy wszystkich modeli, które są oparte na strukturę, aby uzyskać więcej informacji, zobacz Dystrybucje kolumny (wyszukiwania danych).

Continuous Typ zawartości jest obsługiwana przez następujące typy danych: Date, Double, and Long.

Discretized

Discretization to proces wprowadzanie wartości ciągły zestaw danych do pakiety ma ograniczoną liczbę możliwych wartości.Można dyskretyzować tylko dane liczbowe.

W ten sposób discretized typu zawartości wskazuje, że kolumna zawiera wartości, które reprezentują grupy lub pakiety, wartości, które są uzyskiwane z ciągłej kolumnie.Pakiety są traktowane jako wartości zamówione i dyskretne.

Można ręcznie dyskretyzować danych, do zapewnienia uzyskać pakiety ma lub można użyć metody discretization w programie SQL Server Analysis Services.Niektóre algorytmy automatycznego wykonywania discretization.Aby uzyskać więcej informacji, zobacz Jak Zmiana Discretization kolumny w modelu górnictwo.

Continuous Typ zawartości jest obsługiwana przez następujące typy danych: Date, Double, Long, and Text.

Klucz

Klucz typu zawartości oznacza, że kolumna unikatowo identyfikuje wiersz.przypadek tabela zazwyczaj kolumna klucz jest identyfikatorem numerycznym lub tekstowym.Możesz zestaw typu zawartości, aby key Aby wskazać kolumna nie powinny być używane do analizy tylko dla śledzenie rekordów.

Zagnieżdżone tabele mają również kluczy, ale użycie klucz tabela zagnieżdżonej jest nieco inny.Możesz zestaw typu zawartości, aby key w tabela zagnieżdżonej, jeśli atrybut, który chcesz analizować.Wartości w tabela zagnieżdżonej klucz musi być unikatowa dla każdego przypadek, ale mogą istnieć duplikaty przez cały zestaw przypadkach.

Na przykład, jeśli analizowania klientów zakupu produktów jak zestaw typ klucz dla zawartości IDklienta kolumna przypadek tabela i zestaw typ klucz ponownie dla zawartości PurchasedProducts kolumna w tabela zagnieżdżonej.

Ostrzeżenie

Tabele zagnieżdżone są dostępne tylko wtedy, gdy dane z zewnętrznego źródło danych, który został określony jako widok źródło danych usług Analysis.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Date, Double, Long, and Text.

Sekwencja klawiszy

klucz Sekwencji zawartości typu mogą być używane tylko w sekwencji klastrowanie modeli.Gdy użytkownik zestaw typ do zawartości key sequence, oznacza to, że kolumna zawiera wartości, które reprezentuje sekwencję zdarzeń.Wartości zostały zamówione, ale nie muszą być równe odległości.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Double, Long, Text, and Date.

Czas klucza

Klucz czas typ zawartości może być używany tylko w czas modele serii.Podczas ustawiania typu zawartości key time, wskazuje, że wartości są zamawiane i reprezentują czas Skala.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Double, Long, and Date.

Tabela

tabela typu zawartości wskazuje, że kolumna zawiera innej tabela danych z jedną lub więcej kolumn i jeden lub więcej wierszy.Dla dowolnego konkretnego wiersza przypadek tabela ta kolumna może zawierać wiele wartości, powiązanych przypadek rekordu nadrzędnego.Na przykład, jeśli głównym przypadek tabela zawiera listę odbiorców, może mieć kilka kolumn zawierających tabele zagnieżdżone, takich jak ProductsPurchased kolumna, której tabeli zagnieżdżonej listy produktów skupowanych przez tego klienta w przeszłości i hobby kolumna, która zawiera listę interesów odbiorcy.

Typ danych kolumna jest zawsze Table.

Cykliczne

Cykliczne typu zawartości oznacza, że kolumna zawiera wartości, które reprezentują cykliczne uporządkowany zestaw.Na przykład numerowanych dni tygodnia jest cykliczne uporządkowany zestaw, ponieważ jeden numer dnia następuje numer dnia siódmego.

Cykliczne kolumn są uważane za zamówione i discrete względem typu zawartości.

Ten typ zawartości jest obsługiwany przez wszystkie wyszukiwanie danych typy danych w Usługi Analysis Services. Jednak większość algorytmów Traktuj cyklicznie wartości jako dyskretnych wartości i nie należy wykonywać specjalnych przetwarzania.

Zamówione

Zamówione typu zawartości wskazuje również, że kolumna zawiera wartości, które definiują sekwencji lub zamówienia.Jednak w tym typie zawartości wartości używane do porządkowania oznacza wszelkie odległość lub wielkość relacji między wartościami w zestaw.Na przykład jeśli kolumna zamówione atrybut zawiera informacje o poziomach umiejętności w celu rangi od jednego do pięciu, brak informacji wprost w odległości między poziomami umiejętności; poziom umiejętności pięciu niekoniecznie pięć razy lepiej niż jeden poziom umiejętności.

Zamówione atrybut kolumny są uważane za discrete względem typu zawartości.

Ten typ zawartości jest obsługiwany przez wszystkie wyszukiwanie danych typy danych w Usługi Analysis Services. Jednakże, jednak większość algorytmów Traktuj zamówione wartości jako dyskretnych wartości i nie należy wykonywać specjalnych przetwarzania.

Sklasyfikowane

Oprócz powyższych typów zawartości, które są wspólne wykorzystanie z wszystkich modeli dla niektórych typów danych służy niejawnych kolumn do definiowania typów zawartości.Aby uzyskać więcej informacji o kolumnach niejawnych, zobacz Niejawne kolumn (wyszukiwania danych).