Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
es:centro:servizos:hpc:envio_trabajo [2016/02/17 10:24] – [Eliminar un trabajo de la cola] fernando.guillenes:centro:servizos:hpc:envio_trabajo [2017/10/09 11:13] (actual) – [Table] diego.cougil
Línea 1: Línea 1:
-[[ es:centro:servizos:hpc#instrucciones_de_uso_del_cluster| >> Volver a la página principal del cluster ]] 
- 
 ====== Envío y gestión de los trabajos ====== ====== Envío y gestión de los trabajos ======
-<note tip> +
-Para todos los comandos mencionados en esta página existe la correspondiente página del MAN. +
-</note>+
 ===== Enviar los trabajos al sistema de colas ===== ===== Enviar los trabajos al sistema de colas =====
 -------------- --------------
Línea 110: Línea 106:
 </code> </code>
 Una característica interesante de los trabajos finalizados es el EXIT_STATUS que se mostraría cuando el JOB_STATE es C.  Una característica interesante de los trabajos finalizados es el EXIT_STATUS que se mostraría cuando el JOB_STATE es C. 
-^  Codigo interno  ^  Valor de EXIT_STATUS  ^  Significado  +^  Código interno       ^  Valor de EXIT_STATUS  ^  Significado                                                                       
-|  JOB_EXEC_OVERLIMIT   |  -10       +|  JOB_EXEC_OVERLIMIT   |  -10                                                                                                      
-|  JOB_EXEC_STDOUTFAIL   |  -9       +|  JOB_EXEC_STDOUTFAIL  |  -9                                                                                                       
-|  JOB_EXEC_CMDFAIL   |  -8   |  Exec() of user command failed  +|  JOB_EXEC_CMDFAIL     |  -8                    |  Exec() of user command failed                                                     
-|  JOB_EXEC_BADRESRT   |  -7   |  Job restart failed  +|  JOB_EXEC_BADRESRT    |  -7                    |  Job restart failed                                                                
-|  JOB_EXEC_INITRMG   |  -6   |  Job aborted on MOM init, chkpt, ok migrate  +|  JOB_EXEC_INITRMG     |  -6                    |  Job aborted on MOM init, chkpt, ok migrate                                        
-|  JOB_EXEC_INITRST   |  -5   |  Job aborted on MOM init, chkpt, no migrate  +|  JOB_EXEC_INITRST     |  -5                    |  Job aborted on MOM init, chkpt, no migrate                                        
-|  JOB_EXEC_INITABT   |  -4   |  Job aborted on MOM initialization  +|  JOB_EXEC_INITABT     |  -4                    |  Job aborted on MOM initialization                                                 
-|  JOB_EXEC_RETRY   |  -3   |  Job execution failed, do retry  +|  JOB_EXEC_RETRY       |  -3                    |  Job execution failed, do retry                                                    
-|  JOB_EXEC_FAIL2   |  -2   |  Job execution failed, after files, no retry  +|  JOB_EXEC_FAIL2       |  -2                    |  Job execution failed, after files, no retry                                       
-|  JOB_EXEC_FAIL1   |  -1   |  Job execution failed, before files, no retry  +|  JOB_EXEC_FAIL1       |  -1                    |  Job execution failed, before files, no retry                                      
-|  JOB_EXEC_OK                       |  Job execution successful  +|  JOB_EXEC_OK                               |  Job execution successful                                                          
-       1-256      Exit status of the top-level shell    +                       1-256                  Exit status of the top-level shell                                                
-       >256      Trabajo terminado por una señal UNIX, restarle 256 nos da el número de la señal.  |+                       >256                   Trabajo terminado por una señal UNIX, restarle 256 nos da el número de la señal.  |
  
 <code bash> <code bash>
Línea 178: Línea 174:
  
 ==== Información de los nodos ==== ==== Información de los nodos ====
-El comando ''pnbsnodes'' da información sobre los nodos.+Para obtener una vista global del estado del cluster se puede utilizar el comando ''nodes-usage''
 +<code bash> 
 +$ nodes-usage 
 ++----------------------------------+-------------------+ 
 +| USAGE                            | NODE              | 
 ++----------------------------------+-------------------+ 
 +| ################################ | node1 (64/64)     | 
 +| ################################ | node2 (64/64)     | 
 +|                                  | node3 (0/64)      | 
 +| ################################ | node4 (64/64)     | 
 +|                                  | node5 (0/64)      | 
 +| ################################ | node6 (64/64)     | 
 +|                                  | node7 (0/64)      | 
 +|                                  | inode11 (0/32)    | 
 +|                                  | inode12 (0/??   | 
 +|                                  | inode13 (0/32)    | 
 +|                                  | inode14 (0/32)    | 
 +|                                  | inode15 (0/??   | 
 +|                                  | inode16 (0/32)    | 
 +|                                  | inode17 (0/??   | 
 +|                                  | inode18 (0/??   | 
 +| ##                               | inode19 (2/32)    | 
 +| ############################     | inode20 (28/32)   | 
 ++----------------------------------+-------------------+ 
 +| ##############                   | TOTAL (286/640)   | 
 ++----------------------------------+-------------------+ 
 +</code> 
 + 
 +Para obtener información sobre los usuarios que se encuentran en cada nodo, se puede utilizar el comando ''node-users <nodo>'': 
 + 
 +<code bash> 
 +$ node-users node1 
 +Tracing node jobs................................................................... 
 +jorge.suarez natalia.fernandez 
 +</code> 
 + 
 +Para obtener información más detallada sobre los nodos, se puede utilizar el comando ''pnbsnodes'': 
 <code bash> <code bash>
 ct$ pbsnodes  #Información detallada de todos los nodos ct$ pbsnodes  #Información detallada de todos los nodos