Udostępnij za pośrednictwem


Typy zawartości (wyszukiwanie danych)

In Microsoft SQL Server Analysis Services, you can define the both the physical data type for a column in a mining structure, and a logical content type for the column when used in a model,

The data type determines how algorithms process the data in those columns when you create mining models.Określanie typu danych kolumna daje informacji algorytmu o typie danych w kolumnach oraz sposób przetwarzania danych.Każdy typ danych Analysis Services obsługuje jednego lub wielu typów zawartości do wyszukiwanie danych.

The content type describes the behavior of the content that the kolumna contains.Na przykład jeśli zawartości kolumna powtarza się w określonych interwałach, takich jak dni tygodnia, można określić typ zawartości kolumna jako cykliczny.

Niektóre algorytmy wymagają specyficznymi typami danych i określone typy zawartości działać poprawnie.Na przykład algorytm Bayes Naive firmy Microsoft nie może używać ciągłej kolumn jako dane wejściowe i nie można przewidzieć, ciągłej wartości.Niektóre typy zawartości, takie jak sekwencję klawiszy są używane tylko przez określonego algorytmu.Aby uzyskać listę algorytmów i typów zawartości zawierające obsługuje, zobacz Algorytmy wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Poniższa lista zawiera opis typów zawartości, które są wykorzystywane podczas wyszukiwanie danych i identyfikuje typów danych, które obsługują każdego typu.

Discrete

Discrete oznacza, że kolumna zawiera wartości z nie począwszy między wartością skończoną liczbę.Na przykład kolumna płci jest kolumną typowe discrete atrybut, w tym danych reprezentuje dowolną liczbę kategorii.

Wartości kolumna discrete atrybut nie oznacza kolejności, nawet jeśli wartości liczbowe.Ponadto nawet jeśli wartości używane do discrete kolumn numerycznych, Ułamkowe wartości nie może zostać obliczona.Telefon, numery kierunkowe są dobrym przykładem discrete dane liczbowe.

The Discrete content type is supported by all wyszukiwanie danych data types.

Ciągłe

Ciągłe oznacza, że kolumna zawiera wartości, które reprezentują dane numeryczne na skalę, która umożliwia tymczasowe wartości.W odróżnieniu od discrete kolumna, która reprezentuje ograniczone, policzalnych danych, ciągłej kolumnie reprezentuje pomiarów skalowalne i może się zdarzyć, że dane, które mają zawierać nieskończoną liczbę ułamkową z zakresu wartości.Kolumna temperatur jest przykładem kolumny ciągłego atrybut.

Gdy kolumna zawiera ciągłego dane liczbowe, a wiadomo, w jaki sposób należy rozdzielić dane, potencjalnie może zwiększyć dokładność analizy określając dystrybucji oczekiwanych wartości.Należy określić rozkład kolumna poziom struktura wyszukiwania.Dlatego to ustawienie ma zastosowanie do wszystkich modeli, które są oparte na strukturę, aby uzyskać więcej informacji, zobacz Kolumna dystrybucyjnego (wyszukiwanie danych).

The Continuous content type is supported by the following data types: Date, Double, a Long.

Discretized

Discretization polega na wprowadzanie wartości ciągły zestaw danych do pakiety, tak aby były ograniczoną liczbę możliwych wartości.Można dyskretyzować tylko dane liczbowe.

W ten sposób discretized typu zawartości wskazuje, że kolumna zawiera wartości, które reprezentują grup lub pakiety wartości, które są obliczane na podstawie ciągłej kolumnie.Pakiety są traktowane jako wartości zamówionych i discrete.

Można ręcznie dyskretyzować danych, aby zapewnić uzyskanie pakiety, które mają lub można stosować metody discretization w usługach Analysis Services programu SQL Server.Niektóre algorytmy automatycznego wykonywania discretization.Aby uzyskać więcej informacji zobaczJak Zmienianie Discretization kolumna w model wyszukiwania.

The Discretized content type is supported by the following data types: Date, Double, Long, a Text.

Klucz

The klucz content type means that the kolumna uniquely identifies a row.przypadek tabela zazwyczaj kolumna klucz jest identyfikatorem numerycznym lub tekstowym.Użytkownik zestaw typu zawartości do key Aby wskazać, kolumna nie powinny być używane do analizy tylko w przypadku śledzenia rekordów.

Zagnieżdżone tabele mają także klawisze, ale użycie klucz w tabela zagnieżdżonej jest nieco inna.Użytkownik zestaw typu zawartości do key w tabela zagnieżdżonej Jeśli kolumna jest atrybut, który chcesz analizować. Wartości z klucz w tabela zagnieżdżonej muszą być unikatowe w każdym z przypadków, chociaż mogą istnieć duplikaty na cały zestaw spraw.

Na przykład, jeśli analizowania produktów których klienci zakupu, należy ustawić typ zawartości do klucz w celu Identyfikator klienta kolumny przypadek tabela, a zestaw typu zawartości do klucz w celu przeprowadzenia PurchasedProducts kolumna w tabela zagnieżdżonej.

Uwaga

Tabele zagnieżdżone są dostępne tylko wtedy, gdy używane są dane z zewnętrznym źródłem danych zdefiniowanym jako usług analiz widok urządzenie źródłowe danych.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Date, Double, Long, a Text.

klucz Sekwencja

The klucz sequence content type can only be used in sequence klastrowanie models.Gdy użytkownik zestaw typ do zawartości key sequence, oznacza to, że kolumna zawiera wartości, które reprezentuje sekwencję zdarzeń. Wartości są uporządkowane, ale nie muszą być równe odstęp między liniami.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Double, Long, Text, a Date.

Klucz czas

The klucz czas content type can only be used in czas series models.Ustawianie typu zawartości key time, to oznacza, że wartości są uporządkowane reprezentacji skali czas.

Ten typ zawartości jest obsługiwana przez następujące typy danych: Double, Long, a Date.

Table

The tabela content type indicates that the kolumna contains another data tabela, with one or more columns and one or more rows.Dla każdej konkretnego wiersza przypadek tabela ta kolumna może zawierać wiele wartości, wszystkie powiązane z nadrzędnym rekordu przypadek.Na przykład, jeśli głównym przypadek tabela zawiera listę odbiorców, użytkownik może mieć kilka kolumn, które zawierają tabele zagnieżdżone, takie jak ProductsPurchased kolumn, gdzie zagnieżdżona tabela zawiera listę produktów kupowanych przez tego klienta w przeszłości i Hobby kolumna, która wyświetla listę udziałów nabywcy.

Typ danych kolumna jest zawsze Table.

Cykliczne

The cyclical content type means that the kolumna contains values that represent a cyclical uporządkowany zestaw.Na przykład numerowanych dni tygodnia jest cyklicznie zamówione zestaw, ponieważ jeden numer dnia następuje numer dnia 7.

Cykliczne kolumn są uważane za zamówione i discrete w odniesieniu do typu zawartości.

Ten typ zawartości jest obsługiwany przez wszystkie wyszukiwanie danych typy danych w Analysis Services. Większość algorytmy cyklicznie wartości są traktowane jako discrete wartości i nie należy wykonywać specjalnych przetwarzania.

Zamówione

The Ordered content type also indicates that the kolumna contains values that define a sequence or order.Jednak w tym typie zawartości wartości używane do ustalania kolejności nie oznacza odległości ani wielkości relacji między wartościami zestaw.Na przykład jeśli kolumną zamówione atrybut zawiera informacje o poziomach zaawansowania rangi ustawione w kolejności od jednego do pięciu, nie ma żadnych informacji domyślnych ani żadnego innego rodzaju odległości między poziomami umiejętności; poziom umiejętności pięciu nie jest zawsze pięć razy większą niż poziom umiejętności jednego.

Zamówione atrybut kolumny są uważane za discrete w odniesieniu do typu zawartości.

Ten typ zawartości jest obsługiwany przez wszystkie wyszukiwanie danych typy danych w Analysis Services. Jednak jednak większość algorytmy zamówione wartości są traktowane jako discrete wartości i nie należy wykonywać specjalnych przetwarzania.

Sklasyfikowane

Oprócz poprzednich typów zawartości, które są do części wspólnej pracy z wszystkich modeli w przypadku niektórych typów danych służy niejawnych kolumn do definiowania typów zawartości.Aby uzyskać więcej informacji na temat kolumn niejawnych zobacz Niejawne kolumny (wyszukiwanie danych).