Cluster: FAQ

THema: Zugang

Thema: Rechnungen

Warum muss ich meine eigenen Jobskripte erstellen und SLURM-Optionen lernen, kann man das nicht automatisieren?

Auch wenn man den Prozess des Schreibens von Jobskripten und Einstellen von Jobs noch mehr vereinfachen oder automatisieren könnte, haben wir uns entschieden, dies in den meisten Fällen nicht zu unterstützen. Das liegt daran, dass Sie sich die begrenzten Ressourcen des Clusters mit allen anderen Nutzern teilen und wir Sie dazu bringen möchten, sich ein Grundverständnis anzueignen und sich über Ihre Ressourcennutzung Gedanken zu machen.

Nutzer X kommt vor mir dran, obwohl mein Job läger in der Warteschlange steht!

Der von SLURM verwendete Algorithmus zur Priorisierung hat vier Hauptkriterien:

  • Fair Share: wenn ein Nutzer in kurzer Zeit viele Ressourcen (d.h. viel CPU-Zeit) verbraucht, sinkt die Priorität für folgende Jobs. Dieses Kriterium ist mit Abstand am stärksten gewichtet.
  • Alter: je länger ein Job in der Warteschlange steht, desto höher die Priorität
  • Jobgröße: große Jobs werden leicht bevorzugt, um die längere Wartezeit zu kompensieren
  • Backfilling: nachdem die Jobs nach den obigen drei Kriterien sortiert sind, füllt SLURM eventuelle Lücken mit kleineren Jobs, die somit früher drankommen.

Sie können sich die Prioritäten mit dem Befehl sprio anzeigen lassen. 

Hilfe, mein Job ist abgebrochen!

Dies kann viele verschiedene Ursachen haben. Zuallererst sollten Sie im SLURM-Logfile nach Fehlermeldungen sehen (vor allem am Schluss des Logfiles). Wenn Ihr Job mit der Meldung “not enough memory” abgebrochen ist, haben Sie eventuell in den SLURM-Einstellungen zu wenig RAM angefordert (Option --mem), mehr dazu hier.

Wenn Sie den Fehler nicht erkennen können, schicken Sie das Logfile und das Jobskript mit einer Beschreibung des Problems an hpc-support@uni-siegen.de

Thema: Software

Welche Software ist auf dem Cluster installiert?

Unter dem Schlagwort #Cluster-Anwendungssoftware finden Sie eine Übersicht der installierten Software und unter #Cluster-Programmiersprachen eine Übersicht der installierten Compiler und Interpreter. Wenn Sie bereits Clusterzugang haben, können Sie sich mit module avail die installierten Module anzeigen lassen (Achtung: eventuell darf eine Software nicht von allen Uni-Angehörigen oder nur gegen Gebühr genutzt werden, in diesem Fall erhalten Sie eine Warnung beim Laden des Moduls). 

Können Sie bitte Software Y updaten?

Wir entscheiden von Fall zu Fall, ob wir Software updaten. Um den Wartungsaufwand überschaubar zu halten, sowie um Kompatibilität und Sicherheit zu gewährleisten, installieren wir Software nur aus bestimmten Quellen (wie z.B. dem Software-Repository des Betriebssystemherstellers), in denen nicht immer die neuesten Versionen verfügbar sind. 

Thema: Dateien

Hilfe, mein Workspace ist abgelaufen!

In den ersten 10 Tagen nach dem Ablaufen Ihres Workspaces können Sie ihn selbst wiederherstellen, wie Sie das tun ist hier beschrieben.

Wurde Ihr Problem nicht beantwortet? Wenden Sie sich an unseren Support.