HDFS-Dateiziel

Gilt für:SQL Server SSIS Integration Runtime in Azure Data Factory

Die HDFS-Dateizielkomponente ermöglicht einem SSIS-Paket das Schreiben von Daten in eine HDFS-Datei. Die unterstützten Dateiformate sind Text, Avro und ORC.

Um das HDFS-Dateiziel zu konfigurieren, ziehen Sie die HDFS-Dateiquelle in den Datenfluss-Designer, und doppelklicken Sie auf die Komponente, um den Editor zu öffnen.

HDFS File Destination Editor

Optionen

Konfigurieren Sie die folgenden Optionen auf der Registerkarte Allgemein im Dialogfeld Dateiziel-Editor für Hadoop .

Feld BESCHREIBUNG
Hadoop-Verbindung Geben Sie einen vorhandenen Hadoop-Verbindungs-Manager an, oder erstellen Sie einen neuen. Dieser Verbindungs-Manager gibt an, wo die HDFS-Dateien gehostet werden.
Dateipfad Geben Sie den Namen der HDFS-Datei an.
Dateiformat Geben Sie das Format für die HDFS-Datei an. Die verfügbaren Optionen sind Text, Avro und ORC.
Spaltentrennzeichen Wenn Sie das Textformat auswählen, geben Sie das Spaltentrennzeichen an.
Spaltennamen in der ersten Datenzeile Wenn Sie das Textformat auswählen, geben Sie an, ob die erste Zeile in der Datei Spaltennamen enthält.

Nachdem Sie diese Optionen konfiguriert haben, wählen Sie die Registerkarte Spalten aus, um Quellspalten zu Zielspalten im Datenfluss zuzuordnen.

Voraussetzung für das ORC-Dateiformat

Zur Verwendung des ORC-Dateiformats ist Java erforderlich. Die Architektur (32/64 Bit) des Java-Builds muss mit der der zu verwendenden SSIS-Runtime übereinstimmen. Die folgenden Java-Builds wurden getestet.

Einrichten von OpenJDK für Zulu

  1. Laden Sie das ZIP-Paket für die Installation herunter, und extrahieren Sie es.
  2. Führen Sie über die Eingabeaufforderung sysdm.cpl aus.
  3. Klicken Sie auf der Registerkarte Erweitert auf Umgebungsvariablen.
  4. Klicken Sie im Abschnitt Systemvariablen auf Neu.
  5. Geben Sie JAVA_HOME für den Variablennamen ein.
  6. Klicken Sie auf Verzeichnis durchsuchen, navigieren Sie zum extrahierten Ordner, und wählen Sie den Unterordner jre aus. Wählen Sie anschließend OK aus. Daraufhin wird der Variablenwert automatisch aufgefüllt.
  7. Klicken Sie auf OK, um das Dialogfeld New System Variable (Neue Systemvariable) zu schließen.
  8. Klicken Sie auf OK, um das Dialogfeld Umgebungsvariablen zu schließen.
  9. Klicken Sie auf OK, um das Dialogfeld Systemeigenschaften zu schließen.

Einrichten von Oracle Java SE Runtime Environment

  1. Laden Sie das EXE-Installationsprogramm herunter, und führen Sie es aus.
  2. Führen Sie die Installationsanweisungen aus, um das Setup abzuschließen.

Siehe auch

Hadoop-Verbindungs-Manager
HDFS-Dateiquelle