THema: Zugang
Wie beantrage ich Clusternutzung?
Als Mitarbeiter oder Student der Universität Siegen kannst du auf der Seite Zugang erhalten, weiteres erfahren.
Muss ich für die Clusternutzung Geld zahlen?
Nein, alle Angehörigen der Uni Siegen (Studierende wie Mitarbeiter) können den Cluster nutzen, ohne dass sie Geld bezahlen müssen. Eventuell müssen Sie sich für die Nutzung bestimmter Software z.B. Abaqus an den Lizenzgebühren beteiligen, in diesen Fällen wird Ihnen beim Laden des Moduls eine Warnung angezeigt.
Mein Lehrstuhl ist Teil einer Industriekooperation, kann ich Ihre Systeme nutzen?
Nein, industriefinanzierte Projekte dürfen unsere Rechenressourcen leider nicht nutzen.
Verfügt das ZIMT über GPU-Knoten?
Ja, der OMNI-Cluster verfügt über 10 Knoten mit insgesamt 24 GPUs vom Typ nVidia Tesla V100, mehr dazu hier.
Thema: Rechnungen
Warum muss ich meine eigenen Jobskripte erstellen und SLURM-Optionen lernen, kann man das nicht automatisieren?
Auch wenn man den Prozess des Schreibens von Jobskripten und Einstellen von Jobs noch mehr vereinfachen oder automatisieren könnte, haben wir uns entschieden, dies in den meisten Fällen nicht zu unterstützen. Das liegt daran, dass Sie sich die begrenzten Ressourcen des Clusters mit allen anderen Nutzern teilen und wir Sie dazu bringen möchten, sich ein Grundverständnis anzueignen und sich über Ihre Ressourcennutzung Gedanken zu machen.
Ich habe eine dringende Deadline, können Sie meine Priorität erhöhen?
Nein. Die Kapazität des Clusters ist begrenzt, und der Scheduler SLURM stellt Jobs nach einem Fair-Share-/Backfilling-Algorithmus ein, der für alle die geringste Wartezeit gewährleistet. Es ist unsere erklärte Politik, nicht in dieses System einzugreifen.
Nutzer X kommt vor mir dran, obwohl mein Job läger in der Warteschlange steht!
Der von SLURM verwendete Algorithmus zur Priorisierung hat vier Hauptkriterien:
- Fair Share: wenn ein Nutzer in kurzer Zeit viele Ressourcen (d.h. viel CPU-Zeit) verbraucht, sinkt die Priorität für folgende Jobs. Dieses Kriterium ist mit Abstand am stärksten gewichtet.
- Alter: je länger ein Job in der Warteschlange steht, desto höher die Priorität
- Jobgröße: große Jobs werden leicht bevorzugt, um die längere Wartezeit zu kompensieren
- Backfilling: nachdem die Jobs nach den obigen drei Kriterien sortiert sind, füllt SLURM eventuelle Lücken mit kleineren Jobs, die somit früher drankommen.
Sie können sich die Prioritäten mit dem Befehl sprio
anzeigen lassen.
Kann ich Rechenzeit reservieren?
Für reguläre Rechenjobs nicht. In Ausnahmefällen richten wir Reservierungen für bestimmte Lehrveranstaltungen ein, damit die Teilnehmer während der Lehrveranstaltung ihre Jobs direkt laufen lassen können. Bitte kontaktieren Sie uns, wenn Sie daran Interesse haben.
Hilfe, mein Job ist abgebrochen!
Dies kann viele verschiedene Ursachen haben. Zuallererst sollten Sie im SLURM-Logfile nach Fehlermeldungen sehen (vor allem am Schluss des Logfiles). Wenn Ihr Job mit der Meldung “not enough memory” abgebrochen ist, haben Sie eventuell in den SLURM-Einstellungen zu wenig RAM angefordert (Option --mem
), mehr dazu hier.
Wenn Sie den Fehler nicht erkennen können, schicken Sie das Logfile und das Jobskript mit einer Beschreibung des Problems an hpc-support@uni-siegen.de.
Thema: Software
Welche Software ist auf dem Cluster installiert?
Unter dem Schlagwort #Cluster-Anwendungssoftware finden Sie eine Übersicht der installierten Software und unter #Cluster-Programmiersprachen eine Übersicht der installierten Compiler und Interpreter. Wenn Sie bereits Clusterzugang haben, können Sie sich mit module avail
die installierten Module anzeigen lassen (Achtung: eventuell darf eine Software nicht von allen Uni-Angehörigen oder nur gegen Gebühr genutzt werden, in diesem Fall erhalten Sie eine Warnung beim Laden des Moduls).
Können Sie bitte Software X installieren?
Wir entscheiden von Fall zu Fall, ob wir etwas installieren. Kommen Sie am besten in unsere Sprechstunde oder kontaktieren Sie uns per Email.
Können Sie bitte Software Y updaten?
Wir entscheiden von Fall zu Fall, ob wir Software updaten. Um den Wartungsaufwand überschaubar zu halten, sowie um Kompatibilität und Sicherheit zu gewährleisten, installieren wir Software nur aus bestimmten Quellen (wie z.B. dem Software-Repository des Betriebssystemherstellers), in denen nicht immer die neuesten Versionen verfügbar sind.
Thema: Dateien
Hilfe, ich habe aus Versehen Dateien aus meinem Home-Verzeichnis gelöscht!
Es werden automatisch tägliche Snapshots Ihres Home-Verzeichnisses erstellt. Wenn Sie nicht zu lange warten (höchstens 30 Tage), können Sie die Dateien selbst wiederherstellen. Wie Sie das tun können, ist hier beschrieben.
Hilfe, mein Workspace ist abgelaufen!
In den ersten 10 Tagen nach dem Ablaufen Ihres Workspaces können Sie ihn selbst wiederherstellen, wie Sie das tun ist hier beschrieben.
Wurde Ihr Problem nicht beantwortet? Wenden Sie sich an unseren Support.