2015-03-03 12 views
5

Ich versuche, Jobs an SGE einzureichen. Es hat für mich in der Vergangenheit genauso funktioniert. Jetzt sind alle Jobs im Status qw festgefahren.SGE: Jobs stecken in QW-Status

"qstat -g c" Ausgabe:

> CLUSTER QUEUE CQLOAD USED AVAIL TOTAL 
> all.q   0.38  0 160 1920 
> gpu6.q   -NA-  0  0  4  
> par6.q   0.38 750 135 1800  
> seq6.q   0.41 103 170 416 
> smp3.q   1.01  0  0  96 

"qstat" Ausgabe sieht aus wie immer.

Googling gab mir nur Hinweise für Leute mit Root-Zugriff, die ich nicht habe. Vorschläge jemand?

Danke.

Bearbeiten: Jobs wurden über "qsub -q seq6.q Skriptname" oder alternativ smp3.q oder par6.q. gesendet.

„qstat -j jobid“ gibt nichts Besonderes, soweit ich sehen kann:

job_number:     2821318 
exec_file:     job_scripts/2821318 
submission_time:   Wed Mar 4 12:07:15 2015 
owner:      username 
uid:      31519 
group:      dch 
gid:      1150 
sge_o_home:     /home/hudson/pg/username 
sge_o_log_name:    username 
sge_o_path:     /gpfs/hamilton6/apps/intel_comp_2014/composer_xe_2013_sp1.2.144/bin/intel64:/usr/local/bin:/bin:/usr/bin:/usr/lpp/mmfs/bin:/usr/local/Cluster-Apps/sge/6.1u6/bin/lx24-amd64:/panfs/panasas1.hpc.dur.ac.uk/apps/nag/fll6a21dpl/scripts 
sge_o_shell:    /bin/tcsh 
sge_o_workdir:    /panfs/panasas1.hpc.dur.ac.uk/username/path 
sge_o_host:     hamilton1 
account:     sge 
mail_list:     [email protected] 
notify:      FALSE 
job_name:     scriptname 
jobshare:     0 
hard_queue_list:   seq6.q 
env_list:     
script_file:    scriptname 
scheduling info:   (Collecting of scheduler job information is turned off) 
+2

Irgendwelche Erkenntnisse beim Aufruf von "qstat -j "? –

+0

Vereinbart mit Finch_Powers. Bitte bearbeiten Sie den Beitrag mit dem Befehl qsub und den verwendeten Optionen. Es ist schwierig, dies bei so wenig Informationen zu lösen. – Vince

+0

Ich kann nur daran denken, dass Ihre Priorität auf den Punkt des Wartens herabgestuft wird, was keinen Sinn macht, da Slots verfügbar sind. Ich würde mit Ihrem Systemadministrator sprechen, um Ihnen zu helfen. – Vince

Antwort

1

ich heute das gleiche Problem gehabt haben. Wir betreiben Univa Grid Engine für einen Kunden. Ich habe einige Komplexe für die Ausführung von Jobs konfiguriert, die viel Speicher (h_stack = 64M, memory_free = 4G, virtual_free = 4G) auf dem Masterhost anfordern. Nach dieser Konfiguration hängen Jobs in der Warteschlange. Diese Konfiguration entspricht vielen Jahren mit 3G auf allen unseren Ausführungshosts. Ich werde diese neue Konfiguration (4G) nächste Tage testen. Alle Server haben genug Speicher! Ingo