Como ver y editar los metadatos en Ubuntu
Más allá del contenido, los archivos que creamos o vemos en nuestro ordenador contienen información conocida como metadatos. En este post veremos cómo ver y editar metadatos en Ubuntu.
La función de los metadatos es describir, organizar y dar contexto a u n archivo para que sea más fácil de entender, buscar, clasificar y analizar.
Para qué sirven los metadatos
Funciones de los metadatos
- Búsqueda: El explorador de archivos utiliza los metadatos para mostrarlo de acuerdo al orden alfabético, tipo de archivo, fecha de creación o modificación.
- Organización: Los metadatos facilitan el ordenamiento de gran cantidad de información.
- Comprensión: Ayudan a que sistemas automáticos como modelos de Inteligencia Artificial, buscadores o bibliotecas entiendan mejor el contenido
Tipos de metadatos
Podemos dividirlos en tres clases:
- Descriptivos: Datos que identifican al documento como Título, autor, descripción y palabras claves.
- Estructurales: Como está distribuido el documento, Títulos, subtitulos, capítulos, formato.
- Administrativos: Permisos, fecha de creación, tamaño, formato.
Cómo ver y editar los metadatos en Ubuntu
Existen varias herramientas gráficas para editar los metadatos, pero en este post solo vamos a concentrarnos en las que usan la terminal.
Los documentos en formatos PDF tienen los siguientes formatos:
- Título.
- Autor.
- Tema.
- Palabras clave.
- Fecha de creación
- Fecha de modificación.
- Motor de generación.
- Software utilizado para la creación.
- Protecciones y permisos.
Existe otro formato llamado XMP que incluye además esta información:
- Información de derechos de autor.
- Miniaturas.
- Idiomas del documento.
- Etiquetas personalizadas.
Hay dos comandos útiles para ver los metadatos en Ubuntu:
Pdfinfo
Se instala con:
sudo apt install poppler-utils
Uso:
pdfinfo nombre_archivo.pdf
Exiftool
Con esta herramienta podemos ver los metadatos en formato XMP.
Se instala con:
sudo apt install libimage-exiftool-perl
Uso
exiftool nombre_archivo.pdf
Para editar un metadato usamos el comando
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
En nuestro ejemplo, si queremos traducir el título:
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
Podemos borrar todos los metadatos con:
exiftool -all= nombre_archivo.pdf
Por si nos arrepentimos del borrado, el comando crea una copia del archivo PDF al que le agrega la aclaración de original al nombre.
Docx
El formato nativo de Word incluye metadatos del documento y metadatos de la aplicación.
Los metadatos del documento son:
- Título.
- Autor.
- Última persona que lo modificó.
- Número de revisiones.
- Fecha de creación.
- Fecha de última modificación.T
- Tema.
- Palabra clave.
- Categoría.
- Categoría
- Estado (Borrador, final.
Metadatos de la aplicación
- Plantilla
- Software utilizado.
- Total de páginas.
- Número de palabras.
- Número de caracteres.
- Cantidad de líneas.
- Cantidad de párrafos.
- Configuración de escalado.
- Organización.
- Nombre del responsable del equipo.
Exiftool
El comando Exiftool también sirve para ver los metadatos de un documento de Word.
Uso
exiftool nombre_archivo.docx
Otra forma de ver los metadatos es cambiando la extención de archivos al formato zip. Por razones de seguridad vamos a hacerlo con una copia.
cp nombre_archivo.docx copia_archivo.zip
Descomprimimos el archivo y abrimos la carpeta que necesitamos
unzip copia_archivo.zip -d docxinfo
Leemos los datos de los archivos
cat docxinfo/docProps/core.xml
Para los metadatos del documento
cat docxinfo/docProps/apdp.xml
Para los metadatos de la aplicación
cat docxinfo/docProps/app.xml
Tanto usando exiftool como manualmente podemos edital los metadatos. De nuevo, el procedimiento con exiftool es igual a que como hicimos en el caso de los pdf.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Podemos hacer lo mismo manualmente de la siguiente manera:
Hacemos una copia de seguridad
cp nombre_archivo.docx copia_archivo.zip
Descomprimimos en una carpeta llamada metadatos.
unzip copia_archivo.zip -d metadatos
Vamos a la carpeta
cd metadatos
Abrimos el editor
para los metadatos del documento
nano docProps/core.xml
nano docProps/apdp.xml para los metadatos de la aplicación
Volvemos a empaquetar el archivo como docx
zip -r ../nombre_archivo2.docx *
El comando crea el nuevo documento por afuera del directorio metadatos.

