How-to: cómo eliminar archivos duplicados en Linux
Cuando trabajamos con sistemas heterogéneos con archivos compartidos entre máquinas Windows y Unix, es posible que algunos sistemas operativos generen gran cantidad de ficheros que no son necesarios o prácticos en un sistema *nix como por ejemplo los famosos Thumbs.db entre otros, que son usados para indexar contenido multimedia en estos sistemas. En cambio, en nuestra distro pueden resultar molestos y lo que es peor, ocupan espacio de almacenamiento que podríamos estar aprovechando para otros fines.
Si además de esto tenemos ficheros o archivos duplicados ya sean por que hayamos hecho copias sin darnos cuenta o por cualquier otra razón, la cantidad de espacio de almacenamiento en nuestro disco duro ocupada innecesariamente puede ser bastante elevada. Yo he llegado a despejar algunos gigas solo eliminando este tipo de ficheros duplicados. Además, suelen ser muy molestos cuando hacemos backups periódicos, ya que engordan el tamaño de la copia de seguridad y aumentan el tiempo y espacio necesario…
Ya conocerás programas para liberar espacio de nuestro disco duro como BleachBit, que es capaz de eliminar los Thumbs.db que he citado anteriormente, cache, cookies, y otros ficheros innecesarios que se pueden estar acumulando en nuestro sistema por el uso diario que hacemos. Pero no puede eliminar archivos duplicados, no obstante es posible hacerlo con los turcos que te damos a continuación:
¿Cómo eliminar duplicados desde la consola?
Como suele ser habitual, para eliminar archivos duplicados existen dos formas de hacerlo, una es mediante comandos desde el terminal como, algo que aporta flexibilidad y potencia sin hacer uso de herramientas gráficas. Y si te decides a realizar el trabajo desde la consola, una de las mejores herramientas para eliminar duplicados que te puedo presentar es fdupes. Es una tool bastante común y está presente en la mayoría de repositorios de las distros conocidas, por tanto para su instalación bastará con usar el gestor de paquetes (apt-get, dnf, yum,…) que usemos en cada caso.
Una vez instalada, para que nos detecte todos los archivos duplicados inspeccionando su fecha de creación, contenido y nombre de los ficheros. Imagina que deseas buscar contenido duplicado en tu directorio /home, pues simplemente debes ejecutar lo siguiente:
fdupes /home
Si quieres usar una búsqueda recursiva, es decir, que encuentre también duplicados en los subdirectorios de éste, debes emplear la opción -r. Con la opción -S puedes también ver el espacio utilizado por estos duplicados. Por ejemplo:
fdupes -rS /home
Una vez detectados, si los queremos eliminar todos, solo usamos la opción -d, que te permitirá eliminar los que quieras:
fdupes -d /home
Para más información puedes usar man fdupes, ya que existen más opciones y posibilidades.
¿Cómo eliminar duplicados con herramientas gráficas?
En cambio, muchas personas no quieren hacer uso de la consola, y más concretamente los que provienen desde entornos más puramente gráficos como Microsft Windows y MacOS, posiblemente estén un poco perdidos al inicio. Para todos ellos la solución es usar una herrmaienta gráfica que permita localizar y eliminar los duplicados de una forma intuitiva, y existe, se llama FSlint.
Al igual que ocurre con fdupes, FSlint estará disponible en la mayoría de los repositorios de las distros más conocidas porque es una herramienta bastante popular, y por supuesto en las Apps Stores que suelen encontrarse en muchas distros, por lo que su instalación tampoco implica misterio alguno, simpelmente descargar e instalar desde la App Store o instalarla desde la consola usando el gestor de paquetes que uses en cada caso. Una vez instalada podrás comenzar a utilizarla.
Su GUI es bastante sencilla como puedes ver en la imagen que he puesto. Su uso es bien sencillo, pero para mayor facilidad te describiré los pasos de cómo se usa:
- En el Dash de búsqueda, arriba, podrás añadir o eliminar directorios de tu sistema con los botones que tienes a la derecha. En el centro verás los que ya tienes agregados. Así que será necesario que agregues todas las rutas donde deseas encontrar duplicados o si quieres que analice el sistema completo añadir root /. Si te fijas, en el lateral derecho hay una pestaña que debes marcar si la búsqueda quieres que se haga de forma recursiva, es decir, que no solo busque dentro de ese directorio sino también en los subdirectorios que encuentre.
- En la zona central tenemos el menú de resultados, con varias opciones en la columan izquierda para seleccionar lo que quieremos ver, como binarios. duplicados, enlaces incorrectos, etc., opciones que también encontrábamos en fdupes. El espacio blanco se rellenará con los resultados encontrados cuando hagas clic en el botón Búsqueda.
- Por último, puedes seleccionar los ficheros encontrados solos o en grupo con el botón seleccionar para luego ejercer una acción sobre uno o sobre un grupo de ellos con los botones Guardar para que no elimine nada o Borrar para que sean eliminados los duplicados.
Ciertamente es una herramienta muy potente y sencilla… Solo me queda comentar la pestaña Parámetros de búsqueda avanzada, que si la pulsas verás un nuevo menú donde seleccionar otros parámetros o filtros para excluir ciertos ficheros de las búsquedas o aplicar reglas concretas para buscar ficheros concretos.
No olvides dejar tus comentarios con las dudas, sugerencias, etc. Espero que te haya servido de ayuda este tutorial…
El artículo How-to: cómo eliminar archivos duplicados en Linux ha sido originalmente publicado en Linux Adictos.