Microsoft Office

Przegląd formatów plików w Office 2007 Udostępnij na: Facebook

Opublikowano: 22 lutego 2007

W pakiecie Microsoft Office 2007 wprowadzono nowe formaty plików oparte na języku XML, które cechują się odpornością i opierają się na standardach otwartych. Nowe formaty plików XML umożliwiają szybkie generowanie dokumentów pochodzących z różnych źródeł, przyspieszenie tworzenia dokumentów, eksploracji danych oraz ponowne wykorzystanie zawartości dokumentów. Formaty te upraszczają wymianę danych pomiędzy aplikacjami pakietu Office 2007 oraz korporacyjnymi systemami informatycznymi.

Dokumenty w formacie XML można tworzyć za pomocą dowolnych narzędzi i technologii - nie jest do tego wymagane oprogramowanie Office 2007. W wybranym środowisku użytkownicy mogą zwiększyć wydajność poprzez szybsze i bardziej precyzyjne publikowanie, wyszukiwanie i ponowne wykorzystywanie informacji.

Nowe formaty XML opierają się na standardzie branżowym XML i technologiach ZIP, obsługują pełną integrację z technologią dowolnego dostawcy i są dostępne na zasadach bezpłatnej licencji (typu royalty-free). Specyfikacja formatów plików XML zostanie opublikowana i udostępniona na zasadzie takiej samej bezpłatnej licencji, jak schematy referencyjne Microsoft Office 2003. Specyfikacja jest w otwarty sposób dostępna do powszechnego użytku.

Zawartość strony
 Korzyści z używania nowych formatów XML   Korzyści z używania nowych formatów XML
 Struktura nowych formatów plików XML   Struktura nowych formatów plików XML

Korzyści z używania nowych formatów XML

Nowe formaty plików mają wiele zalet istotnych dla programistów tworzących nowe rozwiązania, specjalistów IT oraz indywidualnych użytkowników. Należą do nich:

  • Efektywność formatu. Dokumenty są automatycznie kompresowane i ich objętość może być mniejsza nawet o 75%.
  • Udoskonalone mechanizmy odzyskiwania informacji. Modułowe przechowywanie danych umożliwia otwarcie pliku nawet wtedy, gdy uszkodzony jest jakiś jego element np. wykres czy tabela.
  • Bezpieczeństwo dokumentów. Wbudowany kod, np. obiekty OLE lub kod VBA (Microsoft Visual Basic for Applications), jest przechowywany w odrębnej sekcji dokumentu i może być z łatwością zidentyfikowany i poddany określonym operacjom. Administratorzy IT mogą zablokować dokumenty zawierające niechciane makra lub formanty, sprawiając, że otwierane dokumenty są bezpieczne dla użytkownika.
  • Łatwiejsza integracja. Programiści mają bezpośredni dostęp do wybranej zawartości pliku takiej, jak wykresy, komentarze czy metadane dokumentu.
  • Przejrzystość i zwiększone bezpieczeństwo informacji. Można bez obaw współużytkować dokumenty, ponieważ dane osobowe oraz poufne informacje firmowe, np. nazwiska, komentarze, rejestry zmian, ścieżki dostępów mogą być bez przeszkód wyszukiwane i usuwane.
  • Kompatybilność. Dzięki instalacji prostej aktualizacji, użytkownicy oprogramowania Microsoft Office 2000, Microsoft Office XP oraz Office 2003 mogą otwierać, edytować i zapisywać dokumenty w jednym z nowych formatów XML.

 Do początku strony Do początku strony

Struktura nowych formatów plików XML

Podstawowa struktura wszystkich formatów w pakiecie Office 2007 składa się z pięciu elementów:

  • Element początkowy. Element składowy znajdujący się najwyżej w hierarchii.
  • Elementy XML. Pliki lub foldery zawierające elementy XML, które tworzą zawartość pliku.
  • Elementy, które nie są oparte na języku XML. Zazwyczaj są to ilustracje lub obiekty OLE.
  • Element relacji. Ten typ elementów zasadniczo wskazuje na powiązania pomiędzy pozostałymi elementami, odwzorowując strukturę dokumentu.
  • Kontener ZIP. Łączy poszczególne elementy w jeden plik.

Element początkowy

Element początkowy – element XML, który jest także elementem relacji i może być uznawany za najważniejszy w hierarchii, gdyż określa typ pliku. I tak np., jeżeli nazwa głównego kontenera brzmi: WordDoc, to rozszerzeniem pliku będzie .docx.

Elementy XML

Kiedy plik sformatowany w XML zostaje zapisany w jednym z programów pakietu Office 2007, zostaje on podzielony na wiele elementów logicznych opisujących cały plik. W pakiecie Office Word 2007, dzielenie pliku na te elementy składowe umożliwia ich odnalezienie i modyfikację poza samą aplikacją pakietu Office.

I tak, łatwiejsze dla programisty jest usunięcie właściwości dokumentu z pliku, ponieważ są one umieszczone w pojedynczym elemencie, który można bez trudu usunąć z kontenera . W wypadku plików typu WordprocessingML (dostępnych jako alternatywny format XML dla pakietu Microsoft Office 2003), usuwanie komentarzy wiązało się z analizą składniową całego pliku w celu odnalezienia i usunięcia elementu XML, odpowiadającego zawartości komentarza. W nowym formacie, dane związane z zawartością są podzielone na elementy. Komentarze, linki, nagłówki, stopki i inne dane znajdują się w odrębnych elementach, które mogą zostać usunięte. Nie ma potrzeby analizowania całego dokumentu Word.

Elementy, które nie są oparte na języku XML

Elementy, które nie są oparte na języku XML są to zasadniczo ilustracje i obiekty OLE. Każdy typ pliku, który używa zawartości binarnej lub nie jest oparty na języku XML, określany jest jako niebędący XML. Element, który nie jest oparty na języku XML, jest plikiem załączonym lub zawartym w dokumencie. Dokumentacja schematu formatu XML programu Office Word 2007 wyjaśnia relacje i hierarchię schematów używanych przez program Word dla plików tego typu.

Element relacji

Element relacji jest elementem opartym na języku XML, który wskazuje na powiązania pomiędzy pozostałymi elementami, odwzorowując strukturę relacji elementów. Elementy relacji znajdują się najwyżej w hierarchii elementów opartych na języku XML. Elementy XML, które zawierają dane i nie wskazują na powiązania pomiędzy pozostałymi elementami, określane są często jako obiekty podstawowe. Zazwyczaj jest to zawartość typu application/xml.

Kontener ZIP

Używanie pakietu ZIP zapewnia następujące korzyści we wszystkich aplikacjach:

  • Otwarty standard. Algorytm kompresji ZIP jest jasno określonym, otwartym standardem.
  • Zmniejszony rozmiar pliku. Pliki są zasadniczo mniejsze niż ich binarne odpowiedniki. Przeciętnie, pliki programu Office Word 2007 są o 75% mniejsze niż ich binarne odpowiedniki, w zależności od liczby zawartych w nich ilustracji.
  • Zwiększona odporność. Pliki są bardziej odporne i mniej wrażliwe na potencjalne błędy. Wcześniejsze formaty plików wymagały, aby cały plik był nienaruszony, by mógł prawidłowo funkcjonować.

Pomimo, że używanie pakietu ZIP wskazuje na plik binarny, interfejs programowania aplikacji (API) zawarty w Microsoft WinFX obsługuje format pakietu w przestrzeni nazw System.IO.Packaging. Umożliwia to programistom tworzenie narzędzi przetwarzających format i pracujących w oparciu o model logiczny (elementy) bez konieczności rozszerzania lub kompresji pakietu.

 Do początku strony Do początku strony

Microsoft Office