Panoramica dei formati di file XML in Office System 2007

Aggiornamento: gennaio 2009

Si applica a: Office Resource Kit

 

Ultima modifica dell'argomento: 2009-01-07

Microsoft Office System 2007 introduce nuovi formati di file XML che sono affidabili e basati su standard aperti. I nuovi formati di file XML consentono di creare rapidamente documenti da diverse fonti, rendendo più rapido il processo di creazione di assembly di documenti, data mining e riutilizzo del contenuto. I formati semplificano lo scambio di dati tra le applicazioni in Office System 2007 e nei sistemi aziendali.

Per creare un documento nei nuovi formati XML, è possibile utilizzare tecnologie e strumenti standard, non è necessario disporre di Office System 2007. Grazie alla maggiore rapidità e accuratezza delle operazioni di pubblicazione, ricerca e riutilizzo delle informazioni nell'ambiente scelto, è possibile ottimizzare la produttività.

I nuovi formati XML si basano su tecnologie ZIP e XML standard del settore, supportano sono pienamente supportati da tutti i provider di tecnologia e sono disponibili con una licenza a titolo gratuito. Le specifiche del formato di file XML verranno pubblicate e rese disponibili con la stessa licenza a titolo gratuito utilizzata per gli schemi di riferimento di Microsoft Office 2003 e possono essere utilizzate senza problemi per usi industriali generici.

Vantaggi dei nuovi formati di file XML

I nuovi formati XML offrono numerosi vantaggi a sviluppatori, professionisti IT e utenti, tra cui:

  • Formato di file compatto. I documenti vengono automaticamente compressi, con una riduzione delle dimensioni fino al 75%.

  • Ottimizzazione del recupero dei file danneggiati. Un'archiviazione dati modulare consente di aprire i file anche se uno dei componenti, ad esempio un grafico o una tabella, è danneggiato.

  • Maggiore sicurezza dei documenti. Il codice incorporato, ad esempio gli oggetti OLE o il codice VBA, viene memorizzato in una sezione distinta del file, in modo che possa essere identificato facilmente per l'elaborazione speciale. Gli amministratori IT possono bloccare i documenti che contengono macro o controlli non desiderati, aumentando la sicurezza dei documenti alla loro apertura per gli utenti.

  • Maggiore facilità di integrazione. Gli sviluppatori possono accedere direttamente a contenuti specifici del file, ad esempio grafici, commenti e metadati di un documento.

  • Trasparenza e maggiore protezione delle informazioni. I documenti possono essere condivisi in modo riservato perché è possibile identificare e rimuovere facilmente le informazioni che consentono l'identificazione personale o le informazioni sensibili per l'azienda, come nomi utente, commenti, revisioni e percorsi dei file.

  • Compatibilità. Installando un semplice aggiornamento, gli utenti di Microsoft Office 2000, Microsoft Office XP e Office 2003 possono aprire, modificare e salvare documenti in uno dei nuovi formati XML.

Struttura dei nuovi formati di file XML

La struttura di base di tutti i formati XML in Office System 2007 include cinque elementi:

  • Parte iniziale. La parte che occupa il posto più elevato nella gerarchia.

  • Parti XML. File o cartelle di XML che comprendono il contenuto del file.

  • Parti non XML. Parti che non sono XML; si tratta in genere di immagini o oggetti OLE.

  • Parte delle relazioni. Tipo di parte che fa riferimento in genere ad altre parti per definire la gerarchia relazionale della struttura delle parti.

  • Pacchetto ZIP. Raggruppa le parti in un unico file.

Parte iniziale

La parte iniziale, una parte XML che è una parte delle relazioni e può essere considerata la parte di livello più alto, determina il tipo di file. Se ad esempio il nome del contenitore principale è WordDoc, l'estensione del nome di file sarà docx.

Parti XML

Quando un file di Office con formattazione XML viene salvato in Office System 2007, il file viene diviso in una serie di parti logiche che descrivono l'intero file. Per Office Word 2007 dividere il file in queste parti consente di eseguire query o di modificare facilmente il file al di fuori dell'applicazione di Office originale.

Per uno sviluppatore, ad esempio, è più semplice rimuovere le proprietà del documento da un file perché le proprietà si trovano in un'unica parte, che è possibile rimuovere dal contenitore del documento eliminandola. Con WordprocessingML (fornito come formato di file XML facoltativo in Microsoft Office 2003), per rimuovere commenti è necessario analizzare l'intero file per trovare e rimuovere l'XML che rappresenta il contenuto del commento. Con il nuovo formato di file, i dati correlati alle caratteristiche sono divisi in parti. Commenti, collegamenti, intestazioni, piè di pagina e altri dati si trovano in parti distinte, che è possibile rimuovere. Non è necessario analizzare l'intero documento di Word.

Parti non XML

Le parti non XML sono in genere immagini e oggetti OLE. Tutti i tipi di file che utilizzano contenuto binario o non utilizzano codice XML sono identificati come non XML. Una parte non XML è in genere un file allegato o incorporato in un documento. La documentazione dello schema del formato XML di Office Word 2007 descrive il rapporto letterale e la gerarchia di schema utilizzati da Word per i file di questo tipo.

Parte delle relazioni

Una parte delle relazioni è una parte XML che fa riferimento ad altre parti e definisce la gerarchia relazionale tra le parti. La maggior parte delle parti XML di livello elevato sono parti delle relazioni. Le parti XML che contengono dati e non fanno riferimento ad altre parti sono definite anche primitive e hanno in genere un contenuto di tipo applicazione/xml.

Pacchetto ZIP

L'utilizzo di un pacchetto ZIP offre i vantaggi seguenti in tutte le applicazioni:

  • Standard aperto. L'algoritmo di compressione ZIP è uno standard aperto ben definito.

  • Dimensioni del file ridotte. Le dimensioni dei file sono in genere inferiori rispetto a quelle di un file binario equivalente. In media, i file di Office Word 2007 sono inferiori del 75% rispetto ai file binari corrispondenti, a seconda del numero di immagini.

  • Maggiore affidabilità. I file sono più affidabili e meno sensibili a possibili errori nel file. Con i file precedenti è necessario che il file sia interamente intatto perché possa funzionare correttamente.

Anche se l'utilizzo di un pacchetto ZIP indica che il file è binario, il set di API di WinFX fornisce supporto nativo per il formato di pacchetto nello spazio dei nomi System.IO.Packaging. Questo consente agli sviluppatori di creare strumenti per l'elaborazione del formato e di utilizzare direttamente il modello logico (le parti) senza dover tenere in considerazione l'espansione o la compressione del pacchetto.

Scaricare il manuale

Questo argomento è incluso nel manuale seguente, che può essere scaricato per una lettura e una stampa più agevoli: