BandaAncha

  • 🔍 en 📰 artículos ⏎
  • 🔍 en 💬 foros ⏎
  • 🔍 en 👇 este 💬 foro ⏎
  • 🔍 en 👇 este 💬 tema ⏎
Regístrate Regístrate Identifícate Identifícate

Pantallazo azul aleatorio en Windows 10 con whea_uncorrectable_error

Jaunt
-1

Desde hace ya bastante tiempo (hablo de mínimo 2 años), sufro pantallazos azules en Windows 10 con el código de error whea_uncorrectable_error. Según me he podido documentar, esto significa que ha habido un error crítico referido a un problema de hardware en el PC, sea RAM, micro, fuente, disco duro, etc.

Hasta ahora no me había preocupado mucho, pues como decía esto ocurría de Pascuas a Ramos. Sin embargo, últimamente se han vuelto más habituales, casi a diario.

Me ha ocurrido tanto echando una partida como, teniendo apenas el navegador abierto, dejar el equipo encendido mientras me iba a hacer algo y, a la vuelta, descubrir que se había reiniciado.

Información que puedo aportar:

  • Test de memoria, todo ok.
  • Chequeo de discos, todo ok.
  • Drivers actualizados.
  • Windows Update al día.
  • Chequeo de integridad del sistema, todo ok.
  • Ningún hardware nuevo instalado.
  • Prueba desconectando todo tipo de hubs USB u otros dispositivos USB, el error sigue dándose.
  • Prueba de estrés, gráfica y micro, todo ok.

Situaciones que no me planteo:

  • Reinstalar Windows 10.
  • Actualizar a Windows 11.

¿Conocéis alguna forma de identificar (logs, soft, etc.) qué componente puede estar provocando el error, más allá del críptico whea-uncorrectable_error?

Jaunt

Pues mira, gracias @lhacc.

Tanto que he mirado y no me había dado cuenta del factor informativo del parámetro.

Salvo que me digas si se puede consultar en el visor de sucesos, tendré que esperar al próximo pantallazo antes de poder decirte.

🗨️ 8
lhacc

En teoría, debería aparecer en el visor de eventos (clic derecho al botón Inicio), sección registros de windows → sistema

🗨️ 7
Jaunt

Tras revisar el minidump con WinDBG, he obtenido esto:

MODULE_NAME: AuthenticAMD

IMAGE_NAME: AuthenticAMD.sys

STACK_COMMAND: .cxr; .ecxr ; kb

FAILURE_BUCKET_ID: 0x124_16_AuthenticAMD__UNKNOWN_IMAGE_AuthenticAMD.sys

OS_VERSION: 10.0.19041.1

BUILDLAB_STR: vb_release

OSPLATFORM_TYPE: x64

OSNAME: Windows 10

FAILURE_ID_HASH: {590f0c83-3219-aceb-da4c-6b8bc7c00f79}

Followup: MachineOwner

Mi gráfica es NVidia, entonces… ¿será algo del micro, que es un AMD Ryzen 7 2700X?

🗨️ 6
lhacc
lhacc
🗨️ 5
Jaunt
Jaunt
🗨️ 4
lhacc
lhacc
🗨️ 3
Jaunt
Jaunt
🗨️ 2
lhacc
lhacc
🗨️ 1
Jaunt
Jaunt
Oihalitz

Que procesador tienes? Velocidad de memoria ram?

EmuAGR
1

Los WHEAs salen porque tienes un FCLK (Fabric Clock) demasiado alto (Edit: O muy poco voltaje de SoC para una frecuencia dada). Probablemente hayas subido la RAM demasiados MHz y como va sincronizada con el FCLK pues el memtest no te da error porque la memoria va fina pero la CPU sí está corrigiendo errores en el bus.

imagen
Soy experto en WHEAs desde la serie Ryzen 5000…
imagen
Haciendo overclock a la RAM (64GB 3800 MHz).

PD: Lo de actualizar la BIOS a la última versión es una mala recomendación con placas AMD (ojo @lhacc ), te has arriesgado a dejar sin compatibilidad toda la serie 2000 y que el PC no te arrancase con el 2700X. Hay que leerse muy bien las notas de todas las versiones de las BIOS.

imagen
Caso de una placa Asrock donde posteriores versiones limitan el soporte de CPUs anteriores.
🗨️ 9
Jaunt

Gracias, @EmuAGR.

Admito mi culpa por exceso de confianza, ¡esto de que Asus lance actualizaciones que no sean compatibles "para atrás", me parece aterrador!

Pero ya puestos, ¿qué opinas? ¿Hacer un downgrade hasta la última versión "compatible" con mi micro o "si funciona, no lo toques"?

CPU:

image

Memoria:

image

SPD:

image

¡Gracias!

🗨️ 3
lhacc

No, ese problema que él comenta es para algunas placas, la tuya no está afectada (si lo estuviera, no habría arrancado más tras actualizar)

EmuAGR

Yo no tocaría la BIOS, si ha arrancado pues fetén. Si no has tocado la RAM (la tienes a 2400MHz) probaría a instalar el ZenTimings y postear una captura aquí, lo mismo tienes un desfase entre FCLK y MCLK/UCLK.

Micron son buenos chips, lo mismo subiendo a 3000-3200 MHz (y 1.3-1.35V) ganas estabilidad. Ya que veo que esas memorias tienen un perfil XMP, probaría activándolo en la BIOS, es bastante sencillo. Si deja de arrancar la tendrías que resetear, eso sí.

Black Hole
1

El primer resultado de Google sobre ese mensaje de error: "The WHEA_UNCORRECTABLE_ERROR often relates to incorrect or faulty voltages set during the overlock process, making your operating system unstable. The easiest way to cross this off the list is to reset your system BIOS and remove the effects of any overclocking. You need to enter your system BIOS or UEFI menu."

Así que me sorprende enormemente que digas que llevas 2 años preguntándote sobre el origen del probrema. ¿Tienes subido de vueltas al PC o no? 🤨
Es que tienes la memoria funcionando a 2400 cuando es una memoria de 3200. No parece estar activado el perfil XMP.

lhacc
-1

Joder, es lo que tiene vivir en tierra Intel, no te pasan tonterías de estas. La primera vez que veo que una actualización de la BIOS te deja sin compatibilidad para un procesador.

🗨️ 4
EmuAGR
1

Es lo que tiene que AMD haya soportado 4 generaciones en los mismos chipsets. Hay un montón de variantes de microcódigo y algunas placas se han quedado sin espacio. Normalmente empiezan quitando soporte de CPUs cutres como los Athlon antiguos o las APUs como la 2000G o 2400G por obsoletas, o un 1600…

🗨️ 1
lhacc

También es verdad, en Intel la placa te vale para una generación y da gracias.

Black Hole

Tiene una explicación sencilla, no es plan de Intel vs AMD en este caso. AMD diseñó sus nuevos micros para un chipset posterior. Los fabricantes de placas observaron que podrían llevar soporte para la nueva gama de micros a los chipsets anteriores, e igualmente soportar micros anteriores en el nuevo chipset, pero se dieron cuenta que no les cabía el código para gestionar ambos y que el usuario debía elegir qué familia soportar en casos donde la UEFI no tenía el suficiente tamaño físico (no es cosa del fabricante, sino del modelo de placa). Conforme han ido pasando los años, la disponibilidad de la gama 2000 ha disminuido drásticamente, pues casi todo el mundo migró a micros de las gamas 4000 y 5000. Ya la gama 7000 actual cambia de zócalo (AM5) y memoria (DDR5) con lo que necesitas nueva placa.

🗨️ 1
Weikis

No, lo contrario AMD propuso desde los inicios que las placas bases durasen bastante en longevidad. Los OEM al final son los primeros en hacerte querer comprar otra placa. Los OEM cutres pusieron memorias pequeñas y con el tiempo se llenaron y tuvieron que hacer espacio.

Un ejemplo de placa que soporta todos es la asrock x370 Taichi que ademas se le dio soporte PCI-e 4.0 en una beta.

Intel gen y media y limitar a los oem. Ejemplo de ello es que modificando la bios puedes meter cofee lakes en placas para skylake

Jaunt

Como decía el viejo Jack, vayamos por partes:

@EmuARG aquí tienes los valores que da ZenTimings:

image

Black Hole, el PC no tiene overclocking. Consideré, en su momento, que el equipo era lo suficiente potente para mis necesidades y decidí no forzar la máquina. Y no lo he tocado desde entonces.

También, como los errores ocurrían tan rara veces, no le presté mayor atención, hasta que ahora la cosa cambió.

Si os parece importante (que entiendo que sí), miro a ver cómo activar el perfil XMP en esta BIOS y vuelco de nuevo los valores que me dé ZenTimings.

P.D: casualidad o no, desde el update de la BIOS no ha vuelto a dar el WHEA…

🗨️ 6
EmuAGR

Activa el perfil XMP y nos pones los valores comparados, sí. Si es estable vas a ganar un montón de rendimiento.

🗨️ 5
Jaunt
1

Nada, ha sido activar el DOCP (AMD) y empezar a sufrir reinicios.

He lanzado el test de memoria y decir que había problemas de hardware e interrumpirse a medio análisis.

Vuelvo a dejarlo inactivo, a 2400MHz, que al menos parece estable.

🗨️ 4
EmuAGR

Gracias por probar, lástima que no soporte 3200.

Hay una cosa que también puedes hacer y es activar el XMP pero luego bajar la velocidad a 3000 o 2800 en vez de 3200. Si quieres dedicarte un rato le puedes sacar rendimiento gratis a esa CPU.

🗨️ 3
Jaunt
Jaunt
🗨️ 2
EmuAGR
EmuAGR
1
🗨️ 1
Jaunt
Jaunt
Inacho

Hola

Has probado a ejecutar un : SFC /SCANNOW … desde PowerShell ó CMD como administrador ???

Quizás solo sea un problema de software y no de hardware

Un saludo.

🗨️ 1
Jaunt

Gracias, @Inacho, pero todo apunta a que era problema del firmware de la BIOS y voltajes de la RAM.

Seguimos trasteando :)