Linux Adictos Diego Germán González  

Conversión entre formatos de libros electrónicos usando Calibre

 

Procesamiento heurístico en Calibre

La opción de procesamiento heurístico permite encontrar e identificar partes de un texto para posteriormente asignarles un estilo.

En la tercera parte de esta serie (Los enlaces a los otros dos artículos están al final del post) vamos a hablar de una de las características más interesantes de Calibre. La conversión entre formatos de libros electrónicos.

Cada uno de los formatos tiene sus ventajas y desventajas y los lectores de libros electrónicos tanto en su versión de hardware y software tienen un soporte desigual para ellos.

Algo para tener en cuenta es que si bien en el pasado Calibre tenía complementos que permitían eliminar la protección anticopia en los libros de Kindle, eso no funciona con los nuevos formatos.

Conversión entre formatos de libros electrónicos

Aquí tenemos las siguientes opciones:

  • Convertir cada libro por separado.
  • Convertir varios libros de una vez previa elección de las opciones.
  • Crear un catálogo de los libros de la biblioteca en alguno de estos formatos; AZW3, BIB, CSV, EPUB, MOBI o XML. El catálogo se puede agregar a la biblioteca o exportar a un dispositivo conectado.

Opciones manuales para el proceso de conversión

No siempre la conversión entre formatos de forma automática funciona adecuadamente y puede ser necesario hacer ajustes manuales o incluso recurrir al editor de libros electrónicos que se instala con Calibre. Los desarrolladores recomiendan primero convertir los otros formatos a EPUB o AZW3, hacer las modificaciones necesarias y después volver a convertir a otros formatos.

Entre las modificaciones que podemos realizar están:

  • Establecer metadatos: No es muy diferente a las opciones que vimos en el artículo anterior. Podemos modificar la portada y completar la información sobre título, autor, editorial, etiquetas y reseña.
  • Tipografía: Calibre, a menos que se le indique lo contrario, modifica el tamaño de la tipografía para que exista coherencia entre los diferentes tipos de texto. A partir del tamaño de texto base (El tamaño de texto que más se usa en el libro) se calculan los demás. Se trata de una opción que podemos modificar. La clave de texto es la que marca de que tamaño serán los títulos, subtítulos, encabezados y superíndices en relación con el texto principal. De nuevo, es una opción que podemos modificar.  La altura mínima de línea es la separación vertical mínima calculada entre líneas dependiendo del tamaño de letras mientras que el item Altura de línea controla la separación entre varias líneas de texto.  Es posible incorporar los tipos de letras del documento de origen al documento de destino siempre que el formato admita la posibilidad y, para reducir espacio en el archivo de destino determinar que solo se importe los caracteres que realmente utiliza el documento.
  • Texto: En las pestañas siguientes podemos establecer una codificación para el texto de entrada en caso que el archivo original no lo tenga establecido., modificar el justificado y cambiar las comillas rectas. guiones y puntos suspensivos por lo que en el manual de usuario se denominan «variantes tipográficamente correctas».
  • Distribución del texto: En este apartado podemos eliminar la separación entre párrafos y establecer una sangría al principio de cada uno. Otra opción es la de insertar los espacios. También, se puede extraer el texto de las tablas para presentarlos en forma lineal.

Las tres últimas pestañas son para quienes saben diseño web ya que permiten una modificación mayor del archivo de destino escribiendo código HTML y CSS. También es posible escribir reglas que modifiquen parte de código existente.

Una opción interesante es lo que se conoce como procesado heurístico. Calibre hace conjeturas sobre diferentes partes de un libro a las que en el texto original no se le asignó una etiqueta (Por ejemplo, el título de un encabezado) y le asigna la etiqueta correspondiente en el archivo de destino.

Algunas opciones del procesado heurístico son:

  1. Unir líneas: Corrige la separación inadecuada de una línea basándose en la puntuación.
  2. Detectar y marcar cabeceras de capítulo y títulos de secciones no identificados. Calibre les asigna las etiquetas <h2> y <h3> respectivamente.
  3. Borrar líneas en blanco entre párrafos: A menos que haya más de una consecutiva, las líneas en blanco se eliminan modificando el código HTML.  Si hay más de una consecutiva se considera como un cambio de escena y se considerará como un único párrafo.
  4. Cambiar el formato de texto a cursivas en palabras que habitualmente se escriben de esta forma.

En el próximo artículo continuaremos con las potentes características de calibre

Artículos anteriores

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.