Die aktuelle TORQUE-Konfiguration

 

default (routing queue)
set queue default route_destinations = testq
set queue default route_destinations += smallq
set queue default route_destinations += bigq

Erläuterung: Wenn im Batch-Job keine Queue-Auswahl getroffen wird, aber eine Walltime-Angabe steht, entscheidet die Walltime darüber, in welche Queue der Job "geroutet" wird. Fehlen beide Angaben, gilt eine Walltime von 2 Stunden, so dass der Job in der Queue "testq" landet.

testq (execution queue)
set queue testq Priority = 150
set queue testq resources_max.walltime = 02:00:00
set queue testq resources_default.nice = 19
set queue testq resources_available.ncpus = 192

Erläuterung: Alle 192 Cores (160 Cores der 20 HPC-Knoten plus 32 Cores des ZIVSMP-Systems) können für Testjobs 2 Stunden lang angefordert werden.

bigq (execution queue)
set queue bigq Priority = 30
set queue bigq resources_max.walltime = 160:00:00
set queue bigq resources_default.nice = 19
set queue bigq resources_available.ncpus = 96
set queue bigq max_user_run = 2

Erläuterung: Insgesamt 96 Cores können mit Langzeitjobs von 160 Stunden belegt werden. Von jedem Nutzer kann maximal ein Job gleichzeitig in dieser Queue laufen.

smallq (execution queue)
set queue smallq Priority = 60
set queue smallq resources_max.walltime = 48:00:00
set queue smallq resources_default.nice = 19
set queue smallq resources_available.ncpus = 160
set queue smallq max_user_run = 2

Erläuterung: Insgesamt 160 Cores können mit 48-Stunden-Jobs belegt werden. Pro Nutzer laufen maximal 2 Jobs gleichzeitig in dieser Queue.

Außerdem gelten folgende serverseitige Voreinstellungen:

set server max_user_run = 4
set server default_queue = default
set server resources_default.nice = 19
set server resources_default.nodes = 1
set server resources_default.walltime = 02:00:00
set server submit_hosts = zivsmp001

Erläuterung: Von jedem Nutzer können maximal 4 Jobs gleichzeitig laufen. Die nice-Angabe ist eigentlich überflüssig, da ohnehin systemseitig alle Prozesse der Nutzergruppe u0clstr mit einem Nice-Wert von 19 gestartet werden. Ohne Angabe der Knoten- bzw. Core-Anzahl erhält der Job genau einen Core.

Stand: 16.2.2009