Liberando Espacio De HDFS
Este es un rapidito de como liberar espacio en Hadoop, ya que se llena por los app-logs de yarn.
Si os encontrais vuestro HDFS lleno tal que asi
1 | <<< CORP >>> hdfs@hdp-dw-1-nn-1:/home/nicolast$ hadoop fs -du -h /app-logs/hive/* |
Es que teneis un monton de logs de los contenedores de Yarn ocupado espacio.
Normalmente, el JobHistory Server hace de esta funcion, pero a veces no lo hace o lo necesitais para ya.
Tenemos dos opciones:
A. Lo eliminados y lo dejamos para que el fs.trash.interval se haga cargo de el (normalmente puesto a 360 minutos)
B. Nos lo cargamos directamente sin pasar por la casilla de salida.
Opcion A
Ejecutamos esto, que elimina todo y lo manda a la carpeta trash del usuario
1 | hadoop fs -rm -r /app-logs/[folder]/\* |
trash at: hdfs://hdp-dw-1-nn-1.domain.tld:8020/user/hdfs/.Trash/Current/app-logs/hive/logs-ifile/application_1523519779208_0292
1 |
|
hadoop fs -rm -r -skipTrash /app-logs/[folder]/*
Deleted /apps-logs/*
Si quereis mas info de HDFS:
##### [Apache HDFS space reclamation][34f3fd92]
---
[34f3fd92]: http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#File_Deletes_and_Undeletes "Apache HDFS Space Reclamation"