Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
Última revisiónAmbos lados, revisión siguiente
es:centro:servizos:hpc:envio_trabajo [2016/02/12 13:36] – [Enviar los trabajos al sistema de colas] fernando.guillenes:centro:servizos:hpc:envio_trabajo [2017/06/16 14:22] jorge.suarez
Línea 1: Línea 1:
-[[ es:centro:servizos:hpc#instrucciones_de_uso_del_cluster| >> Volver a la página principal del cluster ]]+====== Envío y gestión de los trabajos ======
  
-====== Envío y gestión de los trabajos ====== 
-<note tip> 
-Para todos los comandos mencionados en esta página existe la correspondiente página del MAN. 
-</note> 
 ===== Enviar los trabajos al sistema de colas ===== ===== Enviar los trabajos al sistema de colas =====
 -------------- --------------
Línea 14: Línea 10:
  
 ===== Consultar el estado del trabajo, las colas o los nodos ===== ===== Consultar el estado del trabajo, las colas o los nodos =====
 +---------------
 ==== Información de las colas ==== ==== Información de las colas ====
 El comando ''qstat'' permite consultar el estado de las colas,  El comando ''qstat'' permite consultar el estado de las colas, 
Línea 125: Línea 121:
 |      |   >256      Trabajo terminado por una señal UNIX, restarle 256 nos da el número de la señal.  | |      |   >256      Trabajo terminado por una señal UNIX, restarle 256 nos da el número de la señal.  |
  
 +<code bash>
 +ct$ checkjob 999999.ctcomp2                # Información sobre un trabajo específico
 +
 +checking job 999999
 +
 +State: Running
 +Creds:  user:nombre_usuario  group:citius  class:np32  qos:DEFAULT
 +WallTime: 00:25:46 of 12:00:00
 +SubmitTime: Tue Feb 16 10:40:31
 +  (Time Queued  Total: 00:00:01  Eligible: 00:00:01)
 +
 +StartTime: Tue Feb 16 10:40:32
 +Total Tasks: 32
 +
 +Req[0]  TaskCount: 32  Partition: DEFAULT
 +Network: [NONE]  Memory >= 0  Disk >= 0  Swap >= 0
 +Opsys: [NONE]  Arch: [NONE]  Features: [active][intel][xeonl]
 +Allocated Nodes:
 +[inode15:32]
 +
 +
 +IWD: [NONE]  Executable:  [NONE]
 +Bypass: 0  StartCount: 1
 +PartitionMask: [ALL]
 +Flags:       RESTARTABLE
 +
 +Reservation '137092' (-00:25:32 -> 11:34:28  Duration: 12:00:00)
 +PE:  32.00  StartPriority:  21
 +</code>
  
 <code bash> <code bash>
Línea 149: Línea 174:
  
 ==== Información de los nodos ==== ==== Información de los nodos ====
-El comando ''pnbsnodes'' da información sobre los nodos.+Para obtener una vista global del estado del cluster se puede utilizar el comando ''nodes-usage''
 +<code bash> 
 +$ nodes-usage 
 ++----------------------------------+-------------------+ 
 +| USAGE                            | NODE              | 
 ++----------------------------------+-------------------+ 
 +| ################################ | node1 (64/64)     | 
 +| ################################ | node2 (64/64)     | 
 +|                                  | node3 (0/64)      | 
 +| ################################ | node4 (64/64)     | 
 +|                                  | node5 (0/64)      | 
 +| ################################ | node6 (64/64)     | 
 +|                                  | node7 (0/64)      | 
 +|                                  | inode11 (0/32)    | 
 +|                                  | inode12 (0/??   | 
 +|                                  | inode13 (0/32)    | 
 +|                                  | inode14 (0/32)    | 
 +|                                  | inode15 (0/??   | 
 +|                                  | inode16 (0/32)    | 
 +|                                  | inode17 (0/??   | 
 +|                                  | inode18 (0/??   | 
 +| ##                               | inode19 (2/32)    | 
 +| ############################     | inode20 (28/32)   | 
 ++----------------------------------+-------------------+ 
 +| ##############                   | TOTAL (286/640)   | 
 ++----------------------------------+-------------------+ 
 +</code> 
 + 
 +Para obtener información sobre los usuarios que se encuentran en cada nodo, se puede utilizar el comando ''node-users <nodo>'': 
 + 
 +<code bash> 
 +$ node-users node1 
 +Tracing node jobs................................................................... 
 +jorge.suarez natalia.fernandez 
 +</code> 
 + 
 +Para obtener información más detallada sobre los nodos, se puede utilizar el comando ''pnbsnodes'': 
 <code bash> <code bash>
 ct$ pbsnodes  #Información detallada de todos los nodos ct$ pbsnodes  #Información detallada de todos los nodos
Línea 197: Línea 259:
  
 ===== Eliminar un trabajo de la cola ===== ===== Eliminar un trabajo de la cola =====
- +------------- 
-El comando ''qdel'' permite al usuario eliminar un trabajo de la cola PBS, antes de que sea emitido a los nodos computacionales para su ejecución. Este comando necesita como argumento el identificador que PBS le asigna cuando se registra un nuevo trabajo, y que se puede consultar con ''qstat''.+El comando ''qdel'' permite al usuario eliminar un trabajo. Funciona enviándole primero una señal TERM y luego una KILL. Este comando necesita como argumento el identificador que PBS le asigna cuando se registra un nuevo trabajo, y que se puede consultar con ''qstat''.
  
 <code> <code>