Convertir archivos HTML a PDF en Linux
El formato HTML es un formato que permite crear la estructura de una página web, para posteriormente aplicarle estilos y animaciones.
HTMLDOC es un programa software libre capaz de convertir estos archivos HTML a PDF de forma totalmente gratuita. La última versión disponible es la 1.9.7, y nos permite además convertir una página web HTML a PDF.
Instalar HTMLDOC
Para instalar HTMLDOC, tenemos que ir a la terminal y instalarlo de la siguiente forma:
sudo apt-get install htmldoc
Una vez instalado, ya podremos convertir los archivos HTML a PDF. Para ello, abrimos el programa, donde nos aparecerá la siguiente interfaz:
Para convertir un archivo, tenemos que ir a la primera pestaña Input. Ahí, seleccionamos en Document Type «Web Page», y posteriormente tenemos que darle a «Add Files» o «Add URL» para cargar un archivo HTML.
Podemos establecer una imagen de logo y título en caso de querer añadirlo de forma adicional. En la siguiente pestaña Output tendremos que seleccionar la ruta de salida del fichero que vamos a generar, por ejemplo «test.pdf».
En la pestaña «Page» podemos establecer los márgenes y tamaños, pero podemos dejarlo como viene por defecto.
La pestaña «Fonts» es más importante ya que permite seleccionar el tamaño de letra, y muy importante, tendremos que elegir el Character Set «UTF-8» para que detecte los caracteres especiales como los acentos o ñ.
Una vez configuradas todas las opciones, podemos hacer click en Generate para que genere el archivo PDF en la ruta que marcamos en Output.
Es importante destacar que este programa no procesa estilos CSS, por lo que si por ejemplo queremos tratar un archivo HTML con etiquetas style, tan sólo se generará el HTML e ignorará estos estilos.