Linux Kernel 4.0.x crea problemas de corrupción en sistemas ext4

por | 20 mayo, 2015

filesystem-linuxTal como comentan varios usuarios en Phoronix, y en los foros de algunas de las distros más populares de Linux, las ultimas versiones del linux kernel (de 4.0.2 en adelante) estarían creando problemas de corrupción y perdida de datos, en usuarios de sistemas de archivos ext4.

El problema parece afectar unicamente a usuarios que utilizan RAID (Redundant Array of Independent Disks), es decir un conjunto de discos duros o SSD que actúan como si fueran una sola unidad lógica, y se ha detectado en algunos usuarios de distros tan diferentes como Arch, Gentoo o Debian, lo que sugiere que que es un problema exclusivo del kernel, y que afectaría a la mayoría de distribuciones que ejecuten dicha versión.

En este punto no se sabe exactamente que es lo que desencadena dicho error, y si algunos parches aplicados recientemente en el kernel 4.0.3 los habría solucionado.

En todo caso parece un fallo grave, ya que no estamos hablando de versiones de prueba del kernel, sino de la última versión estable que ejecutan distros rolling relase como openSUSE Tumbleweed, Arch Linux, KaOS o Gentoo por citar solo unas pocas; y de ext4 un sistemas de archivos que aunque últimamente está siendo desbancando en muchas distribuciones por btfrs o xfs, todavía sigue siendo el más usado en GNU/Linux.

Seguramente se acabará solucionando en no demasiado tiempo, pero ya que estamos vamos a ver como podemos saber que kernel y sistema de archivos gastamos desde la terminal, un dato supongo que a algún recién llegado a Linux le podría interesar:

Lo del kernel es tan facil como ejecutar

uname -a

y para el sistema de archivos una opción sencilla, sin necesidad de trabajar como root podría ser:

df -T

Como podéis observar en la captura que abre el post, en mi caso también utilizo ext4 y una de las últimas versiones del kernel (habiendo pasado antes por todas las anteriores) pero he decir que no tenido ningún problema, así que el fallo como dicen varios usuarios posiblemente esté limitado a aquellos (tampoco todos espero…) que tienen configurados sus discos duros en RAID.

Vía | Phoronix

30 pensamientos en “Linux Kernel 4.0.x crea problemas de corrupción en sistemas ext4

  1. D'Artagnan

    Pues comento y aunque sea fuera de contexto ¿ que tal tus impresiones con el nuevo kernel en la Tumbleweed?. ¿Que te ha parecido?

    Responder
    1. tannhausser Autor

      Si te digo la verdad ni mejor ni peor en cuanto a rendimiento que las series anteriores a 4.x.

      He notado una mejora importante en la velocidad con el escritorio KDE pero se lo atribuyo a la última versión de Plasma 5.3.

      También de un tiempo a esta parte veo que systemd tiene cada vez más peso en el sistema, a veces con unos consumos exagerados de CPU que me sorprenden (supongo que debido a journactl)

      Me da la impresión de que como systemd siga acaparando partes del sistema, sus versiones nuevas van a ser más importantes para el rendimiento del mismo que el propio kernel.

      Responder
    2. tannhausser Autor

      @D’Artagnan casi se me olvida…una cosa en la que si he notado mejora y es atribuible casi con seguridad al kernel nuevo, es lo de copiar archivos a memorias flash (fat 32). Ahora va mucho mejor y no demora tanto

      Responder
    1. tannhausser Autor

      4.0.4 (not found) 😉

      Si, tienes razón esa versión salio el fin de semana pasado.

      Esa combinación de btfrs para la raiz y xfs para la /home que tienes tu es la que viene por defecto desde openSUSE 13.2

      pero en mi caso no me iba muy bien con btrfs (me ralentizaba el inicio y maldita la falta que me hacen las snapshots aparte de ocupar espacio) en la raiz y cambíé a ext4.

      Y XFS en la /home aunque me atraía más, al final como ya tenía ext4 con un montón de datos, pues pasé de formatear y quedó así.

      Responder
  2. Solrak Rainbowarrior

    Hola,
    tenía el kernel 3.19.4 en opensuse 13.2. He decidido actualizar y ya no tengo el kernel 3.19.4 en el sistema, como podría volver tenerlo?? Por qué ahora se borran los viejos kernels??? y sólo se conservan dos??

    Saludos

    Responder
    1. tannhausser Autor

      Si vas a Yast > Gestor de software y pones «kernel» te apareceran diferentes versiones, simplemente elige la que te interese y el sistema se encargara de solucionar las dependencias.

      En cuanto al numero de entradas que se conservan del kernel en el arranque, eso también debería poderse configurar en Yast, sería cosa de buscar un poco por los menús 🙂

      Saludos!

      Responder
    1. tannhausser Autor

      con fsck seguido del nombre de la partición (como pusiste en tu último comentario) deberían aparecerte los posibles errores.

      También existe una herramienta llamada e2fsck que es específica para este tipo de archivos ext, pero por suerte no he tenido que utilizarla nunca así que no te podría comentar demasiado al respecto

      Responder
    1. tannhausser Autor

      Teniendo en cuenta que Red Hat lo utiliza por defecto en su última versión no veo porque no!

      Tiene una ventaja (tiene varias pero en realidad esta es la más facil de explicar 🙂 ) como es la del soporte de archivos o unidades de mayor tamaño, algo que a nivel empresarial, servidores, RAIDs, etc puede ser importante.

      De todas maneras todos los sistemas de archivos en algún momento han tenido algún fallo similar a este que comentamos y en muchos tests he visto que ext4 sigue obteniendo buenos resultados, por ej este reciente de phoronix:

      http://www.phoronix.com/scan.php?page=article&item=linux-3.19-ssd-fs&num=1

      Responder
  3. anonimo

    $ uname -a
    Linux pc-anonimo 4.0.4-gentoo #1 SMP PREEMPT Mon May 18 12:00:55 XXX 2015 x86_64 AMD FX(tm)-8350 Eight-Core Processor AuthenticAMD GNU/Linux

    Aqui estoy usando raid1 con mdadm desde siempre, pase por el 4.0.0 4.0.1 4.0.2 4.0.3 y este 4.0.4 y cero problemas, tengo dos discos normales (no SSD) de 1T en rad1 y 4 particiones todas en raid1

    /dev/md0 boot ext4
    /dev/md1 swap swap
    /dev/md2 raiz ext4
    /dev/md3 home ext4

    $ cat /proc/mdstat
    Personalities : [linear] [raid1]
    md1 : active raid1 sda2[1] sdb2[0]
    4194240 blocks [2/2] [UU]

    md2 : active raid1 sda3[1] sdb3[0]
    52428736 blocks [2/2] [UU]

    md3 : active raid1 sda4[1] sdb4[0]
    920007296 blocks [2/2] [UU]

    md0 : active raid1 sdb1[0] sda1[1]
    131008 blocks [2/2] [UU

    Pueda que no tenga problemas porque uso las opciones de montajes mas seguras que creo que hay para ext4…aunque un poco mas lentas
    en /etc/fstab

    /dev/md0 /boot ext4 noatime,noauto,barrier=1,data=ordered 0 2
    /dev/md1 none swap swap 0 0
    /dev/md2 / ext4 noatime,barrier=1,data=ordered 0 1
    /dev/md3 /home ext4 noatime,barrier=1,data=ordered 0 2

    Me parece que por lo que leo los que tienen problemas son los que usan raid0 y abusan de las caches de discos….mala combinación desde luego.

    Responder
    1. tannhausser Autor

      simplemente te dice a la versión de util-linux que pertenece. Si te aparece de forma «espontánea» seguido de algún tipo de mensaje te diría que hay algún tipo de error en esa partición.

      Responder
      1. Solrak Rainbowarrior

        fsck no sirve para particiones cifradas o montadas, por eso no me sale ningún mensaje, tengo el disco ssd con la raiz sin cifrar y la home cifrada, y trim activado.

        Responder
  4. JuanPe Rodríguez

    Ostras veo esto y no me lo creo! ayer instale Gentoo con kernel 4.0.4 por la mañana con btrfs para / y la /home xfs y todo perfecto, pues apago el pc para desayunar y me encuentro que no me entra en el sistema, arranco con live-usb para hacer chroot y no me deja, miro la partición y me dice corrupta… me cague en todo, reinstale otra vez y ahora estoy cagadito por si se vuelve a corromper. Voy hacer un BACKUP urgente ya.

    Responder
  5. Yoyo

    Si crea problemas de corrupción en sistemas ext4 será en los sistemas de PPSOE que de por sí ya están bien corruptos.

    Responder
    1. tannhausser Autor

      Kernel 4.0.x «Mariano» Edition, le llaman ya a esta versión xD

      Responder
  6. s_48k

    Por lo visto hay un módulo en systemd que al verificar la paridad y el checksum de ciertos archivos altera la tabla de particiones provocando la corrupción del sistema de archivos, al acceder a particiones NTFS y FAT32 con automontaje el error aparece mas frecuentemente.

    Responder
  7. snapuxrge

    Hola yo tengo un problema en OpenSuse 13.2 no me deja entrar en la partición /home me pone que esta corrupta y fue así de repente apague el Pc al rato volví a encenderlo y me salió ese mensaje de error ya no se que hacer para recuperar mis datos, con un live cd de Ubuntu x ejemplo no me lee la partición xfs y se me bloquea la sesión de live cd Ubuntu… Alguna solución? Gracias de antemano

    Responder

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.