Linux Kernel 4.0.x crea problemas de corrupción en sistemas ext4

filesystem-linuxTal como comentan varios usuarios en Phoronix, y en los foros de algunas de las distros más populares de Linux, las ultimas versiones del linux kernel (de 4.0.2 en adelante) estarían creando problemas de corrupción y perdida de datos, en usuarios de sistemas de archivos ext4.

El problema parece afectar unicamente a usuarios que utilizan RAID (Redundant Array of Independent Disks), es decir un conjunto de discos duros o SSD que actúan como si fueran una sola unidad lógica, y se ha detectado en algunos usuarios de distros tan diferentes como Arch, Gentoo o Debian, lo que sugiere que que es un problema exclusivo del kernel, y que afectaría a la mayoría de distribuciones que ejecuten dicha versión.

En este punto no se sabe exactamente que es lo que desencadena dicho error, y si algunos parches aplicados recientemente en el kernel 4.0.3 los habría solucionado.

En todo caso parece un fallo grave, ya que no estamos hablando de versiones de prueba del kernel, sino de la última versión estable que ejecutan distros rolling relase como openSUSE Tumbleweed, Arch Linux, KaOS o Gentoo por citar solo unas pocas; y de ext4 un sistemas de archivos que aunque últimamente está siendo desbancando en muchas distribuciones por btfrs o xfs, todavía sigue siendo el más usado en GNU/Linux.

Seguramente se acabará solucionando en no demasiado tiempo, pero ya que estamos vamos a ver como podemos saber que kernel y sistema de archivos gastamos desde la terminal, un dato supongo que a algún recién llegado a Linux le podría interesar:

Lo del kernel es tan facil como ejecutar

uname -a

y para el sistema de archivos una opción sencilla, sin necesidad de trabajar como root podría ser:

df -T

Como podéis observar en la captura que abre el post, en mi caso también utilizo ext4 y una de las últimas versiones del kernel (habiendo pasado antes por todas las anteriores) pero he decir que no tenido ningún problema, así que el fallo como dicen varios usuarios posiblemente esté limitado a aquellos (tampoco todos espero…) que tienen configurados sus discos duros en RAID.

Vía | Phoronix

30 thoughts on “Linux Kernel 4.0.x crea problemas de corrupción en sistemas ext4”

  1. D'Artagnan says:

    Pues comento y aunque sea fuera de contexto ¿ que tal tus impresiones con el nuevo kernel en la Tumbleweed?. ¿Que te ha parecido?

    1. tannhausser says:

      Si te digo la verdad ni mejor ni peor en cuanto a rendimiento que las series anteriores a 4.x.

      He notado una mejora importante en la velocidad con el escritorio KDE pero se lo atribuyo a la última versión de Plasma 5.3.

      También de un tiempo a esta parte veo que systemd tiene cada vez más peso en el sistema, a veces con unos consumos exagerados de CPU que me sorprenden (supongo que debido a journactl)

      Me da la impresión de que como systemd siga acaparando partes del sistema, sus versiones nuevas van a ser más importantes para el rendimiento del mismo que el propio kernel.

    2. tannhausser says:

      @D’Artagnan casi se me olvida…una cosa en la que si he notado mejora y es atribuible casi con seguridad al kernel nuevo, es lo de copiar archivos a memorias flash (fat 32). Ahora va mucho mejor y no demora tanto

  2. yqnx7 says:

    La versión más reciente del núcleo Linux es 4.0.4, en mi caso uso Tumbleweed con btrs y xfs.

    1. tannhausser says:

      4.0.4 (not found) 😉

      Si, tienes razón esa versión salio el fin de semana pasado.

      Esa combinación de btfrs para la raiz y xfs para la /home que tienes tu es la que viene por defecto desde openSUSE 13.2

      pero en mi caso no me iba muy bien con btrfs (me ralentizaba el inicio y maldita la falta que me hacen las snapshots aparte de ocupar espacio) en la raiz y cambíé a ext4.

      Y XFS en la /home aunque me atraía más, al final como ya tenía ext4 con un montón de datos, pues pasé de formatear y quedó así.

  3. Mariano Rajoy says:

    Que tema de ventanas usas ?

    1. tannhausser says:

      El de breeze que viene por defecto con Plasma 5

  4. Solrak Rainbowarrior says:

    Hola,
    tenía el kernel 3.19.4 en opensuse 13.2. He decidido actualizar y ya no tengo el kernel 3.19.4 en el sistema, como podría volver tenerlo?? Por qué ahora se borran los viejos kernels??? y sólo se conservan dos??

    Saludos

    1. tannhausser says:

      Si vas a Yast > Gestor de software y pones “kernel” te apareceran diferentes versiones, simplemente elige la que te interese y el sistema se encargara de solucionar las dependencias.

      En cuanto al numero de entradas que se conservan del kernel en el arranque, eso también debería poderse configurar en Yast, sería cosa de buscar un poco por los menús 🙂

      Saludos!

      1. Solrak Rainbowarrior says:

        Gracias, arriba y abajo 😀

  5. Solrak Rainbowarrior says:

    Y… cómo comprobar la corrupción del disco? he leído algo pero me gustaría oír algo de ti..

    1. tannhausser says:

      con fsck seguido del nombre de la partición (como pusiste en tu último comentario) deberían aparecerte los posibles errores.

      También existe una herramienta llamada e2fsck que es específica para este tipo de archivos ext, pero por suerte no he tenido que utilizarla nunca así que no te podría comentar demasiado al respecto

  6. Jámin Fernandez (@JaminSamuel) says:

    Ah estas alturas e la vida ya es recomendable usar XFS tanto en la raiz como en la particion /home o datos?

    1. tannhausser says:

      Teniendo en cuenta que Red Hat lo utiliza por defecto en su última versión no veo porque no!

      Tiene una ventaja (tiene varias pero en realidad esta es la más facil de explicar 🙂 ) como es la del soporte de archivos o unidades de mayor tamaño, algo que a nivel empresarial, servidores, RAIDs, etc puede ser importante.

      De todas maneras todos los sistemas de archivos en algún momento han tenido algún fallo similar a este que comentamos y en muchos tests he visto que ext4 sigue obteniendo buenos resultados, por ej este reciente de phoronix:

      http://www.phoronix.com/scan.php?page=article&item=linux-3.19-ssd-fs&num=1

  7. anonimo says:

    $ uname -a
    Linux pc-anonimo 4.0.4-gentoo #1 SMP PREEMPT Mon May 18 12:00:55 XXX 2015 x86_64 AMD FX(tm)-8350 Eight-Core Processor AuthenticAMD GNU/Linux

    Aqui estoy usando raid1 con mdadm desde siempre, pase por el 4.0.0 4.0.1 4.0.2 4.0.3 y este 4.0.4 y cero problemas, tengo dos discos normales (no SSD) de 1T en rad1 y 4 particiones todas en raid1

    /dev/md0 boot ext4
    /dev/md1 swap swap
    /dev/md2 raiz ext4
    /dev/md3 home ext4

    $ cat /proc/mdstat
    Personalities : [linear] [raid1]
    md1 : active raid1 sda2[1] sdb2[0]
    4194240 blocks [2/2] [UU]

    md2 : active raid1 sda3[1] sdb3[0]
    52428736 blocks [2/2] [UU]

    md3 : active raid1 sda4[1] sdb4[0]
    920007296 blocks [2/2] [UU]

    md0 : active raid1 sdb1[0] sda1[1]
    131008 blocks [2/2] [UU

    Pueda que no tenga problemas porque uso las opciones de montajes mas seguras que creo que hay para ext4…aunque un poco mas lentas
    en /etc/fstab

    /dev/md0 /boot ext4 noatime,noauto,barrier=1,data=ordered 0 2
    /dev/md1 none swap swap 0 0
    /dev/md2 / ext4 noatime,barrier=1,data=ordered 0 1
    /dev/md3 /home ext4 noatime,barrier=1,data=ordered 0 2

    Me parece que por lo que leo los que tienen problemas son los que usan raid0 y abusan de las caches de discos….mala combinación desde luego.

    1. tannhausser says:

      Parece que ya han encontrado la causa del problema y que tu intuición era la correcta, tiene que ver con la opción “discard” en RAID

      https://lkml.org/lkml/2015/5/21/167

  8. Solrak Rainbowarrior says:

    #X@linux:~> sudo fsck /dev/sda1
    root’s password:
    fsck de util-linux 2.25.1

    qué significa??

    Saludos y gracias

    1. tannhausser says:

      simplemente te dice a la versión de util-linux que pertenece. Si te aparece de forma “espontánea” seguido de algún tipo de mensaje te diría que hay algún tipo de error en esa partición.

      1. Solrak Rainbowarrior says:

        Entiendo que estoy libre de errores 😀
        Gracias

      2. Solrak Rainbowarrior says:

        fsck no sirve para particiones cifradas o montadas, por eso no me sale ningún mensaje, tengo el disco ssd con la raiz sin cifrar y la home cifrada, y trim activado.

  9. nonamed says:

    aquí un enlace al bug en debian, pa quien interese

    https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=785672

    saludos

  10. Mariano PP says:

    Alguién dijo corrupción?

  11. Swicher says:

    Una aclaración sobre Gentoo, la versión estable mas reciente del kernel es la 3.18.12 aunque siempre se puede optar por instalar la ultima versión marcada como inestable (o una intermedia), ya sea del kernel de Gentoo o de otro tipo (como el kernel “vanilla” o el que tiene los parches de Con Kolivas, etc).

  12. JuanPe Rodríguez says:

    Ostras veo esto y no me lo creo! ayer instale Gentoo con kernel 4.0.4 por la mañana con btrfs para / y la /home xfs y todo perfecto, pues apago el pc para desayunar y me encuentro que no me entra en el sistema, arranco con live-usb para hacer chroot y no me deja, miro la partición y me dice corrupta… me cague en todo, reinstale otra vez y ahora estoy cagadito por si se vuelve a corromper. Voy hacer un BACKUP urgente ya.

  13. Yoyo says:

    Si crea problemas de corrupción en sistemas ext4 será en los sistemas de PPSOE que de por sí ya están bien corruptos.

    1. tannhausser says:

      Kernel 4.0.x “Mariano” Edition, le llaman ya a esta versión xD

      1. ubgonzo says:

        El nuevo partido llamado “Kernel 4.1-rc5” soluciona dicho problema de corrupción del PPSOExt4, mas info aquí: http://www.phoronix.com/scan.php?page=news_item&px=Linux-Git-RAID0-EXT4-Fix

  14. s_48k says:

    Por lo visto hay un módulo en systemd que al verificar la paridad y el checksum de ciertos archivos altera la tabla de particiones provocando la corrupción del sistema de archivos, al acceder a particiones NTFS y FAT32 con automontaje el error aparece mas frecuentemente.

  15. snapuxrge says:

    Hola yo tengo un problema en OpenSuse 13.2 no me deja entrar en la partición /home me pone que esta corrupta y fue así de repente apague el Pc al rato volví a encenderlo y me salió ese mensaje de error ya no se que hacer para recuperar mis datos, con un live cd de Ubuntu x ejemplo no me lee la partición xfs y se me bloquea la sesión de live cd Ubuntu… Alguna solución? Gracias de antemano

Deja un comentario