Using Unicode Data

Specyfikacja standardu Unicode definiuje jeden schemat kodowania znaków większości powszechnie stosowany w firmach na całym świecie.Wszystkie komputery stale tłumaczenia wzorców bitów danych standardu Unicode na znaki przy użyciu jednej specyfikacji standardu Unicode.Pozwala to uzyskać pewność, że ten sam wzorzec bitowy zawsze jest konwertowany na ten sam znak, na wszystkich komputerach.Dane można swobodnie przenieść z jednej bazy danych lub komputera na inny bez obaw, że odbierający systemu przekształci wzorców bitów na znaki niepoprawnie.

Problem jeden z typów danych, które służy do kodowania każdego znaku 1 bajt jest, że typ danych może reprezentować tylko 256 różnych znaków.Wymusza to wiele specyfikacji kodowania lub stron kodowych dla różnych alfabetów, takie jak alfabetów europejskich, które są stosunkowo małe.Niemożliwe jest także do obsługi takich jak japoński Kanji lub koreański Hangul alfabetów, których tysięcy znaków.

Each Microsoft SQL Server collation has a code page that defines what patterns of bits represent each character in char, varchar, and text values.Poszczególne kolumny i stałych znaków można przypisać inną strona kodowa.Komputery klienckie używają strona kodowa, związane z regionalny operacyjnego do interpretacji wzorców bit znaku.Istnieje wiele różne strony kodowe i niektóre znaki są wyświetlane na niektórych stronach kodowych, ale nie dla innych użytkowników.Niektóre znaki są zdefiniowane, deseń jeden bit na niektórych stronach kod, a wzorzec bitowy różnych na innych stronach kodu.Podczas tworzenia międzynarodowych systemów, które muszą obsługiwać różnych języków, będzie trudno pobrania strony kodowe dla wszystkich komputerów, które spełniają wymagania języka wielu krajów i regionów.Trudno jest również upewnij się, że każdy komputer sprzęgających przy użyciu systemu przy użyciu innej strona kodowa, wykonuje poprawne tłumaczenie.

Specyfikacja standardu Unicode eliminuje ten problem przy użyciu 2 bajtów do kodowania każdego znaku.W jednej specyfikacji, obejmujących najczęściej używanych językach firmy po 2 bajty nie ma wystarczającej ilości różnych wzorów (65 536).Ponieważ wszystkie systemy Unicode ciągle korzystać te same wzory bitów do reprezentowania wszystkich znaków, problem jest nie ze znakami konwersji niepoprawnie po przeniesieniu z jednego systemu do drugiego.Za pomocą typy danych standardu Unicode w całym systemie, można zminimalizować problemy przy konwersji znaków.

W SQL Server, te typy danych obsługuje dane Unicode:

  • nchar

  • nvarchar

  • ntext

    Uwaga

    Prefiks n dla tych typów danych pochodzi ze standardu ISO dla typów danych narodowego (Unicode).

Korzystanie z nchar, nvarchar, a ntext jest taka sama, jak char, varchar, a text, odpowiednio, z wyjątkiem które:

  • Standard Unicode umożliwia obsługę większej liczbie znaków.

  • Więcej miejsca jest potrzebna do przechowywania znaków Unicode.

  • Maksymalny rozmiar nchar kolumny wynosi 4000 znaków, nie 8000 znaki, takie jak char i varchar.

  • Maksymalny rozmiar nvarchar kolumny przy użyciu specyfikatora Maks, wynosi 2 ^ 31-1 bajtów. Aby uzyskać więcej informacji na temat nvarchar(max), zobacz Using Large-Value Data Types.

  • Stałe Unicode są określane wiodących N: Ciąg Unicode N'A ".

  • Wszystkie dane w standardzie Unicode używa zestaw znaków zdefiniowanych przez Unicode standard.Sortowanie w formacie Unicode używana do kolumn Unicode są oparte na atrybutów, takich jak rozróżnianie wielkości liter, czułość akcentu, czułość kana, czułość szerokości i binarny.