15 авг. 2012 г.

Работа с PBS заданиями

Чаще всего работа с планированием и запуском задач связана с программой Torque. Torque управляет загрузкой вычислительных комплексов, состоящих из определенного количества вычислительных узлов, работающих под операционной системой семейства Unix.
Итак, чтобы поставить задачу на счет, нужно поставить ее в очередь. Для этого необходим скрипт (файл) в котором будут прописаны параметры задания (время счета, файл запуска, ресурсы и т.п.)

Пример файла приведен ниже (/home/user/job.pbs):

#!/bin/sh
#
#Команды, задающие основные параметры задания
#
#PBS -N JobName                             # Имя задачи
#PBS -l nodes=1:ppn=32                    # Количество узлов и процессоров
#PBS -l walltime=00:10:00                  # Время выполнения задание часы:минуты:секунды
#PBS -M yourmail@mail.ru                 # Адрес почты для уведомлений
#PBS -m abe                                       # Отправлять почту при любой ситуации

date                                                 # Отобразить время запуска
cd /home/alex/test/QE                      # Полный путь к запускаемому файлу расчета
#
# mpiexec -np nodes*cpus /full/path/to/program/prog > input_file    
# Пример строки запуска программы prog на nodes*cpus ядрах
#
# Пример запуска программы quantum espresso на 32 ядрах
mpiexec /share/soft/espresso-4.1.3/bin/pw.x > input
#
date                                                 # Время окончания

Запустить задание в очередь осуществляется командой

qsub job.pbs

После постановки задачи в очередь будет выдан порядковый номер задачи

122.tisnum-head1.cluster

Проверить статус своей задачи в очереди можно командой 

qstat

После чего появится приблизительно следующее

Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
122.tisnum-head1           siesta           alex                   0 R batch

Здесь написано, что задача с номером 122, с именем siesta, запустил которую пользователь alex запущена R в очереди batch.
Ниже приведен список всех возможных статусов задачи

C           -          complete; Задание успешно завершило свою работу
E           -          exit; Прерывание работы задания
H           -          hold; Задание заблокировано
Q           -          queued; Задание поставлено в очередь и готово для выполнения
R           -          running; Задание выполняется
T            -         waiting; Задание ожидает, пока подойдет очередь для его выполнения
S           -          suspended; Пауза в работе задания

Если задание необходимо удалить из очереди по каким любо причинам, то нужно выполнить команду

qdel num

где num - порядковый номер Вашего задания

Комментариев нет:

Отправить комментарий