sas2308

Mi nuevo peligro de incendio, parte II

Mi nuevo peligro de incendio, parte II

En el episodio anterior de “Mi nuevo peligro de incendio”, fuimos de compras, pusimos las compras dentro de una caja de madera, agregamos unos discos duros, conectamos y encendimos todo y no anduvo.

Al parecer otras personas en internet tuvieron exactamente el mismo síntoma con exactamente la misma placa: al conectar mas de un disco por canal, todo se cae a pedazos:

RMA para vos y RMA para vos también

En ambos casos la solución fue la misma: quejarse con el vendedor, que reconoció la falla y les mando una placa de remplazo. El tema es que… remplazar la placa es prácticamente inviable en mi caso porque:

  • Tendría que mandar la placa a otro país
  • La placa fue comprada hace meses, solo que recién ahora pude probarla con mas de un disco por puerto.
  • Incluso si lograse que el vendedor me mande una de remplazo, probablemente Aduanas quiera cobrarme el remplazo y la verdad no tengo ganas de averiguar ni de discutir.

Por lo tanto mis opciones son:

  • Hacerla andar.
  • Comprar otra.

Dado que tratar de hacerla andar es gratis, opté primero por esa vía.

Flash-me up

Lo primero que se me ocurrió fue tratar de flashear la misma versión de firmware que tiene la controladora que esta funcionando sin problemas (LSI SAS9211-8i, lo mismo pero con puertos internos en lugar de externos). Esto es porque al bootear el PC que oficia de homeserver, solo veo esa controladora en la BIOS de LSI, cuando debería de ver ambas.

Dado a que soy propenso a mandarme cagadas, me niego a realizar cualquier operación de flasheo en la misma maquina que tiene la controladora que funciona, lo ultimo que preciso son 2 placas rotas. Así que revolví entre las sobras de hardware y rearme el viejo server:

i5-3570k al rescate!

Luego de armar la maquina con sobras, instalar Windows (por lo general siempre hacen el utilitario de flasheo para Windows, no tanto para otros sistemas) y bajarme el instalador junto a los firmwares de la pagina de Broadcom (si, LSI fue vendida demasiadas veces) me puse a flashear la controladora… sin mucha suerte.

Algo es algo?

Lo único que conseguí fue cargar la ROM, y ahora si muestra el utilitario de configuración en el arranque de la maquina, pero por algún motivo este se cuelga al conectarle una cantidad cualquiera de discos. Hmmm….

Resulta que tras probar y probar se me ocurrió intentar borrar toda la flash, pero por algún motivo que desconozco me decía que esa operación “no estaba soportada en esta plataforma”.

Ok, no te gusta Windows? Probemos Linux.

Trate de correr los utilitarios de LSI en un Live CD de Ubuntu, pero tampoco pude borrar la flash, esta vez con un error distinto (el cual no recuerdo y del cual no tome nota porque estaba ansioso).

La tercera es la vencida la tercera y punto

Doblemente derrotado, empece a buscar en internet a ver si alguien tenia alguna magia para poder borrar la flash entera y poder flashear esto como corresponde. Y, el que busca encuentra dicen… (a veces).

Encontré este post en el blog Techmattr: “Updated: SAS HBA crossflashing or flashing to IT mode, Dell Perc H200 and H310

Resulta que ese post tiene todo lo que precisaba saber. De hecho, tiene mas de lo que precisaba para solucionar el problema, ya que el habla de flashear ciertas controladoras Dell Perc para que se comporten como LSI.

Siguiendo las instrucciones de ese post, al principio tampoco pude borrar la flash hasta que encontré una sección sobre maquinas UEFI. Resulta que se puede utilizar el sas2flash desde un shell EFI (es necesario tener el ejecutable sas2flash.efi), desde el cual finalmente pude vaciar la flash entera y flashear el firmware correctamente.

This was a triumph

Como bonus, no me moleste en cargar la BIOS en esta controladora así me ahorro los 10-15 segundos extra que le agrega al proceso de boot, dado que nunca pienso bootear desde discos que se encuentren en la caja externa.

Importante: Si alguien por casualidad se encuentra con este problema y decide borrar la flash entera, que tome nota de la SAS Address ya que tras borrar la flash hay que restablecerla manualmente usando sas2flash.

Otra vez

Terminada toda esta porquería, pruebo por ultima vez para ver si tengo que sentarme a esperar un mes a que llegue un remplazo de USA o si puedo empezar a romper usar mis discos. Dejo que Windows (si Windows, es provisorio) arranque, conecto todo, prendo la fuente de la caja… y…

Yo los conozco son ocho los monos

Como debería de haber sido desde un principio, aparecieron los ocho discos de 2TB. Como no se bien que hacer ahora para probar que funcionen, puse a Windows a hacer maldades, también conocido como un “spanned volume” que es una maldad en si.

Hipótesis

No estoy 100% seguro, pero mi sospecha esta en que había algún problema en la NVDATA/NVFLASH (o como sea que se llame). No tengo mucha evidencia al respecto, ni estoy familiarizado lo suficiente con estos dispositivos, pero dado a que el error aparecía al agregar múltiples discos, y que me fallaba al intentar acceder a la configuración una vez cargada la BIOS en la controladora, me hace sospechar que NVDATA contenía información incompatible con las versiones de firmware que tenia la placa de fabrica y en sus posteriores flasheos. Sumado a esto, leyendo en internet, la mayoría de estas placas son usadas o refurbished, muchas de ellas estuvieron anteriormente en maquinas e incluso eran rebrandings de otros OEM como por ejemplo HP e IBM. Posiblemente el vendedor flashea todas estas controladoras para que se comporten como una LSI y prueba con un disco por canal, asumiendo que si eso funciona, entonces la placa entera funciona. Pero bueno, es tan solo una hipótesis y no muy relevante ahora que se como vaciar correctamente la flash en caso de volver a tener este problema con una nueva controladora en un futuro.

LSI SAS9207-8e

Conclusión?

En los próximos días sabre si la controladora funciona como corresponde, ademas de si los discos están aceptable-mente sanos. Caso contrario, supongo que habrá una parte III, pero espero que no porque ya hice demasiado post para lo que va del año.

Capaz que para compensar, no posteo nada hasta el 2030.

Mi nuevo peligro de incendio, parte I

Mi nuevo peligro de incendio, parte I

Erase una vez un pool ZFS que se estaba quedando sin espacio. Hubieron intentos de borrar porquerías pero la realidad es que eso solo sirvió para comprar tiempo.

storage 6.9T 5.4T 1.6T 78% /storage

Resulta que al momento todavía quedan unos 1.6TB libres, que debería darme para un buen rato, pero no esta bueno llenar el pool al tope de su capacidad. Con respecto a ZFS, de vez en cuando vas a ver gente que cita la regla de no mas de 80% de utilización. La razón casi siempre mencionada es desempeño, pero también existen preocupaciones en un eventual escenario de reconstrucción del array pool.

Decidí que la mejor opción en mi caso es agregar mas discos y crear un segundo pool, moviendo ciertas cosas menos importantes a este nuevo pool.

Dame mas

Al igual que con el pool actual, voy a utilizar RAID-Z2 (paridad doble) y no RAID-Z1 (paridad simple) ya que considero pasando los 5 discos, en capacidades de 2TB en adelante, el riesgo de una segunda falla durante la reconstrucción del array pool es bastante real. Si te quedan dudas, Wendell de Level1Techs lo explica en un momento en un video de media hora sobre RAID, ZFS y cosas.

Teniendo en mira agregar 8 discos de 2TB cada uno, tengo que resolver donde ponerlos ya que en el servidor solo queda lugar para 1 disco. La cagada de vivir en Uruguay [1], es que prácticamente no hay oferta (ni demanda) de gabinetes ya sea nuevos o usados que puedan servir para estos propósitos. Lo único viable es comprar una torre de PC con suficientes bahías de discos pero eso ocuparía un montón de espacio innecesario ya que no pienso armar otro PC.

Estimado de la capacidad del nuevo pool, idéntico al ya existente. Usando la calculadora de WintelGuy.com

La alternativa seria, traer jaulas (o “cages”) para discos de USA o algún otro lado, las placas y cables necesarios para conectar todo y finalmente armar una caja de la manera mas simple posible simplemente para no tener una aglomeración de cosas frágiles sueltas por ahí.

Lista de componentes

Resulta que los componentes mas importantes en todo esto (a excepción de los discos duros) hay que traerlos de afuera (en este caso use Amazon vía courier) dado que en Uruguay no se consigue nada de esto, para variar:

Total de todo lo que uno esta obligado a traer de afuera porque no se consigue en Uruguay (gracias estado retrogrado que protege la producción nacional de controladoras de disco PCI-E): USD 193. No incluye envío dentro de USA a la casilla del courier ni el envío del courier a Uruguay.

A todo esto hay que sumarle que preciso también una fuente capaz soportar 8 discos duros. Use una Corsair CX 500 que tenia en una caja, la cual creo que ya no se consigue en la vuelta pero algo similar seria una Cooler Master Elite V3 500W (USD 45, Thot Computacion) o una EVGA 500W 80 Plus (USD 71, Banifox). Y si, siempre puedo ir por la fuente genérica de 13 dólares, pero tené en cuenta que esto va a estar funcionando 24×7, anda saber durante cuantos años.

Finalmente, quedan los materiales para armar la caja. Lamentablemente no conserve boletas de los tornillos, tuercas y tablas que use, pero te podrás imaginar que todo esto fue lo mas barato de todo, por un amplio margen.

Primer intento

Obviamente como buen blogger no tengo documentado casi nada del proceso de armar la caja, aunque para tu consuelo, no es para nada complicado. Hubieron dos intentos, en el primero conseguí un par de tablas de MDF por poco y nada y las corte mas o menos a medida y trate de armar todo, de manera medio experimental viendo que encaja y que no y haciendo agujeros a medida que resultase necesario.

Segundo intento

Resulta que entre que termine la caja y compre los discos paso un buen tiempo, dado que todavía no encontré la manera de que me paguen por hacer nada (aun…). Días antes de pasar a levantar los discos duros, anduve buscando requeches de tabla para armar otra cosa y justo vi tablas MDF de la mitad de espesor y se me dio por comprar un par de tablas de mas y ver si podía armarlo un poco mas prolijo ya que a mi criterio quedo una terrajada barbara como se puede apreciar en las fotos de arriba.

Resulta que armado con tablas mas finas quedo mas prolijo y ademas resuelve un problema que no pensé la primera vez: el grosor de los cables Mini SAS externos no los hace muy maleables, por lo cual conectarlos al adaptador pasivo era bastante caótico.

It’s alive!

Puesta en marcha

Una vez conectado a la controladora y con el power encendido vamos a ver que aparece en el server:

Oops!

Bueno, al parecer algo no le gusto al driver, lo cual es raro dado que antes de que llegaran los discos probé todo con dos discos (un disco por puerto Mini SAS).

Tras probar de conectar y desconectar todo, probar con otros pares de cables, de hacer power-cycle, de cambiar la controladora de red de slot PCI-Express sigo sin poder dar con la tecla. Aunque me di cuenta de dos cosas que no había notado hasta el momento:

  • La placa es una LSI Logic SAS9207-8e,. pero Linux la ve como una LSI SAS2308...
  • La placa no aparece en el utilitario de LSI cuando la maquina bootea, solo la controladora con las interfaces internas (LSI Logic 9211-8i)..

Edit: investigando como resolver el problema, aprendí que SAS9207-8e es el nombre de la placa mientras que SAS2308 es el nombre de la controladora. El primero es la placa entera, el segundo es el chip encargado de manejar los discos y otras cosas…

Esto me da a creer que hay algo raro con la placa, lamentablemente me gano el cansancio así que otro día pruebo a ver que sucede con esta placa y en el peor de los casos tendré que comprar otra.

I’ll be back
[1] Sigue siendo el mejor país.

Podes leer la continuación de este dolor de cabeza en “Mi nuevo peligro de incendio, parte II