problemas

Mi nuevo peligro de incendio, parte II

Mi nuevo peligro de incendio, parte II

En el episodio anterior de “Mi nuevo peligro de incendio”, fuimos de compras, pusimos las compras dentro de una caja de madera, agregamos unos discos duros, conectamos y encendimos todo y no anduvo.

Al parecer otras personas en internet tuvieron exactamente el mismo síntoma con exactamente la misma placa: al conectar mas de un disco por canal, todo se cae a pedazos:

RMA para vos y RMA para vos también

En ambos casos la solución fue la misma: quejarse con el vendedor, que reconoció la falla y les mando una placa de remplazo. El tema es que… remplazar la placa es prácticamente inviable en mi caso porque:

  • Tendría que mandar la placa a otro país
  • La placa fue comprada hace meses, solo que recién ahora pude probarla con mas de un disco por puerto.
  • Incluso si lograse que el vendedor me mande una de remplazo, probablemente Aduanas quiera cobrarme el remplazo y la verdad no tengo ganas de averiguar ni de discutir.

Por lo tanto mis opciones son:

  • Hacerla andar.
  • Comprar otra.

Dado que tratar de hacerla andar es gratis, opté primero por esa vía.

Flash-me up

Lo primero que se me ocurrió fue tratar de flashear la misma versión de firmware que tiene la controladora que esta funcionando sin problemas (LSI SAS9211-8i, lo mismo pero con puertos internos en lugar de externos). Esto es porque al bootear el PC que oficia de homeserver, solo veo esa controladora en la BIOS de LSI, cuando debería de ver ambas.

Dado a que soy propenso a mandarme cagadas, me niego a realizar cualquier operación de flasheo en la misma maquina que tiene la controladora que funciona, lo ultimo que preciso son 2 placas rotas. Así que revolví entre las sobras de hardware y rearme el viejo server:

i5-3570k al rescate!

Luego de armar la maquina con sobras, instalar Windows (por lo general siempre hacen el utilitario de flasheo para Windows, no tanto para otros sistemas) y bajarme el instalador junto a los firmwares de la pagina de Broadcom (si, LSI fue vendida demasiadas veces) me puse a flashear la controladora… sin mucha suerte.

Algo es algo?

Lo único que conseguí fue cargar la ROM, y ahora si muestra el utilitario de configuración en el arranque de la maquina, pero por algún motivo este se cuelga al conectarle una cantidad cualquiera de discos. Hmmm….

Resulta que tras probar y probar se me ocurrió intentar borrar toda la flash, pero por algún motivo que desconozco me decía que esa operación “no estaba soportada en esta plataforma”.

Ok, no te gusta Windows? Probemos Linux.

Trate de correr los utilitarios de LSI en un Live CD de Ubuntu, pero tampoco pude borrar la flash, esta vez con un error distinto (el cual no recuerdo y del cual no tome nota porque estaba ansioso).

La tercera es la vencida la tercera y punto

Doblemente derrotado, empece a buscar en internet a ver si alguien tenia alguna magia para poder borrar la flash entera y poder flashear esto como corresponde. Y, el que busca encuentra dicen… (a veces).

Encontré este post en el blog Techmattr: “Updated: SAS HBA crossflashing or flashing to IT mode, Dell Perc H200 and H310

Resulta que ese post tiene todo lo que precisaba saber. De hecho, tiene mas de lo que precisaba para solucionar el problema, ya que el habla de flashear ciertas controladoras Dell Perc para que se comporten como LSI.

Siguiendo las instrucciones de ese post, al principio tampoco pude borrar la flash hasta que encontré una sección sobre maquinas UEFI. Resulta que se puede utilizar el sas2flash desde un shell EFI (es necesario tener el ejecutable sas2flash.efi), desde el cual finalmente pude vaciar la flash entera y flashear el firmware correctamente.

This was a triumph

Como bonus, no me moleste en cargar la BIOS en esta controladora así me ahorro los 10-15 segundos extra que le agrega al proceso de boot, dado que nunca pienso bootear desde discos que se encuentren en la caja externa.

Importante: Si alguien por casualidad se encuentra con este problema y decide borrar la flash entera, que tome nota de la SAS Address ya que tras borrar la flash hay que restablecerla manualmente usando sas2flash.

Otra vez

Terminada toda esta porquería, pruebo por ultima vez para ver si tengo que sentarme a esperar un mes a que llegue un remplazo de USA o si puedo empezar a romper usar mis discos. Dejo que Windows (si Windows, es provisorio) arranque, conecto todo, prendo la fuente de la caja… y…

Yo los conozco son ocho los monos

Como debería de haber sido desde un principio, aparecieron los ocho discos de 2TB. Como no se bien que hacer ahora para probar que funcionen, puse a Windows a hacer maldades, también conocido como un “spanned volume” que es una maldad en si.

Hipótesis

No estoy 100% seguro, pero mi sospecha esta en que había algún problema en la NVDATA/NVFLASH (o como sea que se llame). No tengo mucha evidencia al respecto, ni estoy familiarizado lo suficiente con estos dispositivos, pero dado a que el error aparecía al agregar múltiples discos, y que me fallaba al intentar acceder a la configuración una vez cargada la BIOS en la controladora, me hace sospechar que NVDATA contenía información incompatible con las versiones de firmware que tenia la placa de fabrica y en sus posteriores flasheos. Sumado a esto, leyendo en internet, la mayoría de estas placas son usadas o refurbished, muchas de ellas estuvieron anteriormente en maquinas e incluso eran rebrandings de otros OEM como por ejemplo HP e IBM. Posiblemente el vendedor flashea todas estas controladoras para que se comporten como una LSI y prueba con un disco por canal, asumiendo que si eso funciona, entonces la placa entera funciona. Pero bueno, es tan solo una hipótesis y no muy relevante ahora que se como vaciar correctamente la flash en caso de volver a tener este problema con una nueva controladora en un futuro.

LSI SAS9207-8e

Conclusión?

En los próximos días sabre si la controladora funciona como corresponde, ademas de si los discos están aceptable-mente sanos. Caso contrario, supongo que habrá una parte III, pero espero que no porque ya hice demasiado post para lo que va del año.

Capaz que para compensar, no posteo nada hasta el 2030.

Back on track

Back on track

En los pasados días, no hubo home-server. Eso era de esperar, ya que durante el fin de semana iba a pegar un upgrade, pero como siempre, la informática te pone palos hasta en ruedas que no sabías que tenías. Paso a comentar…

Ante las inminentes necesidades ganas de pegar un “upgrade” a un hardware un poco mas decente, decidí pasarme de mi viejo “desktop” (i5 3ra gen.) a algo mas cheto (i7 6ta gen.) y aprovechar el viejo desktop para mejorar mi homeserver. Las specs. son:

  • Server viejo: Intel Core 2 Duo E7500, 3GB DDR2 RAM, 2x Discos duros SATA de 2TB, placa de red gigabit, etcetera…
  • Desktop viejo: Intel Core i5-3750K (sabe), 32GB DDR3 RAM, 1x SSD Samsung PRO 850 250GB, 1x Disco duro SATA de 1TB, XFX HD7770, placa gigabit y otros chiches.
  • Desktop nuevo: Intel Core i7-6700K (opa opa), 32GB DDR4 RAM, mismo SSD y disco mas un SSD Mushkin de 240GB tirado por ahí, mismo video, etc…

Si ves las specs. y entiendes un poco de lo que quieren decir, esto me dejaría con una maquina capaz de virtualizar alguna que otra cosa vs. el viejo home-server. Ahora bien, el plan era sencillo:

  1. Armar maquina con las cosas nuevas.
  2. Armar home-server con las cosas del desktop viejo.
  3. Migrar las cosas del home-server viejo al nuevo.
  4. Apagar server viejo, dejarlo archivado ahí juntando polvo.

Que inocente soy. Justo en la mitad del fin de semana, uno de los discos duros del server viejo cantó flor. Para serles sinceros, ese disco ya venia anunciando su muerte hace rato, así que la culpa es mía. Igual, de todos los momentos en los cuales podría fallar, justo me agarró en el menos cómodo.

Lección aprendida, esta vez se viene el RAID con fuerza y el server nuevo ahora corre en:

  • 2x SSD Kingston de los baratos de 120GB en RAID 1 (espejo). Considerando que los SSD hoy en día son mas confiables (ojo con esto, leer este articulo y su paper asociado antes de andar repitiendo fruta como yó) que los discos duros normales, esto sea probablemente un exceso, pero, a quien le importa? Acá van el Debian y alguna cosa más que todavía no sé (el disco de alguna VM, quien sabe…)
  • 4x Discos Duros de 2TB en RAID 5. Dos de ellos son nuevos, uno de ellos cualquier día canta flor (fue tomado del server viejo) y otro de ellos está viejo pero sano. Esto es bueno, por lo general en un RAID querés que los discos te fallen en tiempos distintos, por lo cual no es muy inteligente tener una misma partida de discos iguales comprados al mismo tiempo en el mismo RAID (en realidad eso está abierto a discusión, pero la estadística parece favorecer esta teoría, te debo un link). Acá va el groso de las cosas.

Obviamente esta vez tenía respaldos de todo lo importante. El blog se vé que no lo consideré importante y por ende no hay respaldo. Ahora me voy a hacer un post-it que diga “el blog es importante”. (O podría configurar los respaldos, que se yo…). Por suerte, la caché de Google me permitió recuperar todo.

Pero por lo menos, ahora puedo correr VMs en el home server. Y si no sabés lo que quiere decir eso, creeme que es algo bueno.