Ubunlog Diego Germán González  

Como ver y editar los metadatos en Ubuntu

Ver y editar metadatos a Linux

Más allá del contenido, los archivos que creamos o vemos en nuestro ordenador contienen información conocida como metadatos. En este post veremos cómo ver y editar metadatos en Ubuntu.

La función de los metadatos es describir, organizar y dar contexto a u n archivo para que sea más fácil de entender, buscar, clasificar y analizar.

Para qué sirven los metadatos

Funciones de los metadatos

  • Búsqueda: El explorador de archivos utiliza los metadatos para mostrarlo de acuerdo al orden alfabético, tipo de archivo, fecha de creación o modificación.
  • Organización: Los metadatos facilitan el ordenamiento de gran cantidad de información.
  • Comprensión:  Ayudan a que sistemas automáticos como modelos de Inteligencia Artificial, buscadores o bibliotecas entiendan mejor el contenido

Tipos de metadatos

Podemos dividirlos en tres clases:

  • Descriptivos: Datos que identifican al documento como Título, autor, descripción y palabras claves.
  • Estructurales: Como está distribuido el documento, Títulos, subtitulos, capítulos, formato.
  • Administrativos: Permisos, fecha de creación, tamaño, formato.

Cómo ver y editar los metadatos en Ubuntu

Existen varias herramientas gráficas para editar los metadatos, pero en este post solo vamos a concentrarnos en las que usan la terminal.

PDF

Los documentos en formatos PDF tienen los siguientes formatos:

  • Título.
  • Autor.
  • Tema.
  • Palabras clave.
  • Fecha de creación
  • Fecha de modificación.
  • Motor de generación.
  • Software utilizado para la creación.
  • Protecciones y permisos.

Existe otro formato llamado XMP que incluye además esta información:

  • Información de derechos de autor.
  • Miniaturas.
  • Idiomas del documento.
  • Etiquetas personalizadas.

Hay dos comandos útiles para ver los metadatos en Ubuntu:

Pdfinfo

Se instala con:

sudo apt install poppler-utils

Uso:

pdfinfo nombre_archivo.pdf

Metadatos de un PDF

Ejemplo del comando PDFINFO

Exiftool

Con esta herramienta podemos ver los metadatos en formato XMP.

Se instala con:

sudo apt install libimage-exiftool-perl

Uso

exiftool nombre_archivo.pdf

Ejemplo de metadatos en formato XMP

Ejemplo de uso del programa Exiftool

Para editar un metadato usamos el comando
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
En nuestro ejemplo, si queremos traducir el título:

exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf

Metadato de título cambiado con Exiftool

El comando Exiftool puede cambiar metadatos

Podemos borrar todos los metadatos con:

exiftool -all= nombre_archivo.pdf

Por si nos arrepentimos del borrado, el comando crea una copia del archivo PDF al que le agrega la aclaración de original al nombre.

Docx

El formato nativo de Word incluye metadatos del documento y metadatos de la aplicación.

Los metadatos del documento son:

  • Título.
  • Autor.
  • Última persona que lo modificó.
  • Número de revisiones.
  • Fecha de creación.
  • Fecha de última modificación.T
  • Tema.
  • Palabra clave.
  • Categoría.
  • Categoría
  • Estado (Borrador, final.

Metadatos de la aplicación

  • Plantilla
  • Software utilizado.
  • Total de páginas.
  • Número de palabras.
  • Número de caracteres.
  • Cantidad de líneas.
  • Cantidad de párrafos.
  • Configuración de escalado.
  • Organización.
  • Nombre del responsable del equipo.

Exiftool

El comando Exiftool también sirve para ver  los metadatos de un documento de Word.

Uso

exiftool nombre_archivo.docx

Ver metadatos de un documento de Word

El comando exiftool también sirve para ver metadats de un documento de Word.

Otra forma de ver los metadatos es cambiando la extención de archivos al formato zip. Por razones de seguridad vamos a hacerlo con una copia.

cp nombre_archivo.docx copia_archivo.zip

Descomprimimos el archivo y abrimos la carpeta que necesitamos

unzip copia_archivo.zip -d docxinfo

Leemos los datos de los archivos

cat docxinfo/docProps/core.xml

Para los metadatos del documento

cat docxinfo/docProps/apdp.xml

Para los metadatos de la aplicación

cat docxinfo/docProps/app.xml

Tanto usando exiftool como manualmente podemos edital los metadatos. De nuevo, el procedimiento con exiftool es igual a que como hicimos en el caso de los pdf.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Podemos hacer lo mismo manualmente de la siguiente manera:

Hacemos una copia de seguridad

cp nombre_archivo.docx copia_archivo.zip

Descomprimimos en una carpeta llamada metadatos.

unzip copia_archivo.zip -d metadatos

Vamos a la carpeta

cd metadatos

Abrimos el editor

nano docProps/core.xml
para los metadatos del documento

nano docProps/apdp.xml para los metadatos de la aplicación
Volvemos a empaquetar el archivo como docx

zip -r ../nombre_archivo2.docx *
El comando crea el nuevo documento por afuera del directorio metadatos.

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.