2016-03-22 8 views
2

Ich bin neu in U-SQL. Ich versuche einige grundlegende Fragen zu beantworten und habe ein Problem mit akuten Akzenten gefunden.USQL AKUTE ACCENT

Wenn meine Daten akute Akzente haben, bekomme ich einen Fehler und ich kann nicht fortfahren. Ich bin Spanisch, also haben die meisten Daten, mit denen ich arbeite, akute Akzente.

Irgendeine Idee? Muss ich ein spezielles Codierungsprotokoll befolgen?

+0

Könnten Sie bitte erklären, welche Probleme Sie erleben? – Alex

+0

// Lesen Sie einige Daten @searchlog = EXTRACT Clave \t float, \t \t Estudio \t string, \t \t Turno \t string, \t \t Fecha \t Datum- und \t \t Plataforma \t string, \t \t Agente \t Zeichenkette, \t Proveedor \t Zeichenkette, \t \t Servicio \t string, \t \t Periodo \t float, \t \t Ola \t string, \t \t Mes \t string, \t \t Horario \t string, \t \t Steuerung \t string, \t \t Tipologia \t string, \t \t Llamad eine \t string, \t \t Rechazado \t string, \t \t Bimestre \t string, \t \t Supervisor-\t Zeichenfolge von @ "/ Samples/pruebaDatosAdicionales.txt" USING Extractors.Text(); Ok, wenn ich einfügen: // Fügen Sie es in eine zuvor erstellte Tabelle INSERT INTO [Informes]. [Dbo].[DatasAdicionales] SELECT * VON @searchlog; –

+0

Und die Daten, die ich einfügen habe Akzente, bekomme ich diesen Fehler: Fehler VertexFailedFast. Scheitelpunktfehler hat einen schnellen Jobabbruch ausgelöst. Vertex failed: SV1_Extract_Partition [0] mit Fehler: Vertex user code error. BESCHREIBUNG Vertex konnte nicht mit einem fehler schnell Fehler Lösung DETAILS Vertex SV1_Extract_Partition [0] .v1 {6DE61CE6-453A-48CB-830F-036920D864B4} ist fehlgeschlagen Fehler: Vertex Benutzercode Fehler Exitcode = CsExitCode_StillActive Errorsnippet = Bei der Verarbeitung der Anzeige ist ein Fehler aufgetreten. –

Antwort

2

Sie werden höchstwahrscheinlich in ein Codierungsproblem geraten.

Überprüfen Sie, in welcher Kodierung die Datei enthalten ist, von der Sie extrahieren (Sie können z. B. notepad ++ verwenden).

Zum Beispiel, wenn die Datei in einer ANSI-Codierung vorliegt, müssen Sie die Datei in UTF-8 konvertieren, bevor Sie sie in den Data Lake hochladen.

Die derzeit unterstützten Codierungen sind ASCII (ohne Akzentzeichen), UTF-8 und Unicode (UTF-16) LE und BE. Wir haben Unterstützung für ANSI-Codeseiten in unserem Backlog. Wenn Sie die Code-Seite dem folgenden uservoice-Element https://feedback.azure.com/forums/327234-data-lake/suggestions/13077555-add-ansi-code-page-support-for-built-in-extractors zur Verfügung stellen und abstimmen können, würde uns dies bei der Priorisierung des Backlog-Features helfen.

+1

Olé! Ich habe die Kodierung meines Txt in meinem Fall geändert, von ANSI zu UTF-8 und es funktioniert einwandfrei! Danke und Entschuldigung für mein Englisch. –

+0

Gut zu hören! bitte markiere meine Antwort, damit andere Leute sie finden :) –