1

Ich habe einige gespeicherte Dateien in Google Cloud Storage, und ich laufe die folgenden von Google Cloud Datalab des Notebook:Google BigQuery: "Ungültige Quellformat CSV", wenn Daten von Datalab Laden

path = r'data/path/to/csv/orders_1234' 
orders_path = os.path.join(bucket_path, path) 
print(orders_path) 
dest = 'project_name:dataset_name.orders' 
%bigquery load -m append -f csv -d '\t' -S $orders_path -D $dest 

Aber ich habe Fehler Ungültiges Quellformat CSV bei Ausführung dieses Codes. Weißt du, was ich hier falsch gemacht habe?

Vielen Dank!

Antwort

1

Bitte versuchen Sie folgendes working example aus dem datalab sample notebooks Repository.

import datalab.bigquery as bq 
import datalab.storage as storage 
import pandas as pd 
from StringIO import StringIO 

# Create the schema, conveniently using a DataFrame example. 
%storage read --object gs://cloud-datalab-samples/cars.csv --variable cars 
df = pd.read_csv(StringIO(cars)) 
schema = bq.Schema.from_dataframe(df) 

# Create the dataset 
bq.Dataset('sample').create() 

# Create the table 
sample_table = bq.Table('sample.cars').create(schema = schema, overwrite = True) 

# Load csv file from GCS to Google BigQuery 
sample_table.load('gs://cloud-datalab-samples/cars.csv', mode='append', 
        source_format = 'csv', csv_options=bq.CSVOptions(skip_leading_rows = 1)) 

Bitte beachten Sie: Wenn Sie eine ältere Version von datalab ausgeführt werden, müssen Sie import gcp.bigquery as bq verwenden, anstatt import datalab.bigquery as bq

Sie können eventuell zusätzliche Fehlermeldung Informationen über den Jobverlauf Seite in der sehen BigQuery console.

+0

Vielen Dank. Wie aktualisiere ich Datalab, damit ich die neueste Version davon verwenden kann? – jaycode

+0

Wenn Sie Datalab über https://datalab.cloud.google.com/ bereitgestellt haben, besuchen Sie die Datalab GitHub-Issues-Seite (https://github.com/GoogleCloudPlatform/datalab/issues), und senden Sie ein Problem, um eine neue Version von Datalab zu erhalten Datalab veröffentlicht. Wenn Sie Datalab lokal oder auf GCE installiert haben, erstellen Sie einfach das Datalab-Image neu, um die neueste Version zu erhalten. Weitere Informationen finden Sie auf der Seite Datalab Erste Schritte (https://github.com/GoogleCloudPlatform/datalab/wiki/Getting-Started). Bitte markieren Sie diese Antwort als akzeptiert, wenn sie Ihr Problem gelöst hat. –

+0

Ist es möglich, eine gezippte CSV mit dem obigen Ladebefehl zu laden? Ich habe die Dokumentation überprüft, kann aber nichts sinnvolles finden. Ich schaue nicht auf die Streaming-Option, da dies ein Batch-Prozess ist. –