Wir haben eine Datenbank von ~ 70.000 Zeilen und ~ 7 Funktionen, für die wir versuchen, eine SVM-basierte Vorhersage zu machen. Der Dienst lief 4-5 Stunden vor dem Anhalten (ohne Ergebnisse). Wie skalieren wir die Anzahl der CPUs, die die Berechnung durchführen, so hoch oder runter, dass diese in Minuten statt Stunden läuft?Wie können wir die verfügbaren CPUs für SVMs in Google Cloud DataLabs erhöhen?
0
A
Antwort
3
Dies hängt sehr davon ab, wie Sie dies tun.
Erstens, Python ist single-threaded und so werfen CPUs auf das Problem keinen Unterschied machen, es sei denn, Sie tun dies in einer Weise, die sie ausnutzen können.
Zweitens wird die verwaltete VM, auf der Ihre Datalab-Instanz ausgeführt wird, zum Zeitpunkt der Erstellung für eine bestimmte Anzahl von Kernen, Arbeitsspeicher usw. konfiguriert. Diese wird nicht dynamisch skaliert. Sie müssen zum Zeitpunkt der Bereitstellung eine leistungsfähigere Instanz erstellen. Siehe die Dokumentation hier: https://cloud.google.com/datalab/getting-started#custom_cloud_datalab_deployment