Flashcards: 364.1 - Ha De Hardware Y Recursos

34 tarjetas de repaso. Usa el sistema de repeticion espaciada para memorizar.

P: ¿Que tipo de memoria puede detectar y corregir automaticamente errores de un solo bit?

R: b) ECC. La memoria ECC (Error-Correcting Code) detecta y corrige automaticamente errores de un bit, y detecta errores de dos bits. Es esencial en servidores para garantizar la integridad de los datos.


P: ¿Que dispositivo del sistema representa el watchdog timer en Linux?

R: b) /dev/watchdog. El watchdog timer se accede a traves de /dev/watchdog. Las aplicaciones deben escribir periodicamente en este dispositivo para mantener el sistema vivo. Si dejan de escribir, el watchdog reinicia el sistema.


P: ¿Que modulo del kernel proporciona un watchdog por software?

R: c) softdog. softdog es el modulo de watchdog por software del kernel Linux. No requiere hardware especifico, a diferencia de iTCO_wdt (Intel), hpwdt (HP) o ipmi_watchdog (IPMI).


P: ¿En que archivo de NUT se define el modo de operacion (standalone, netserver, netclient)?

R: b) /etc/nut/nut.conf. El archivo /etc/nut/nut.conf define el modo de operacion con la directiva MODE=. Los valores posibles son: standalone, netserver, netclient y none.


P: ¿Que modo de NUT permite compartir la informacion del UPS con otros servidores por red?

R: b) netserver. El modo netserver configura NUT para que el UPS conectado localmente sea accesible por otros servidores (clientes) a traves de la red. Los clientes usan el modo netclient.


P: ¿Que comando de ipmitool reinicia un servidor remoto?

R: b) ipmitool -I lanplus -H IP -U user -P pass power cycle. power cycle apaga y enciende el servidor remotamente via IPMI. Las opciones de ipmitool power son: status, on, off, cycle y reset.


P: ¿En que archivo de NUT se configuran el driver y puerto del UPS?

R: b) /etc/nut/ups.conf. El archivo /etc/nut/ups.conf define cada UPS con su nombre, driver (ej: usbhid-ups), puerto y descripcion.


P: ¿Que comando muestra los sensores de hardware (temperatura, voltaje, ventiladores) via IPMI?

R: c) ipmitool sensor list. ipmitool sensor list muestra todos los sensores del servidor incluyendo temperatura, voltaje, velocidad de ventiladores y su estado. sdr list muestra informacion similar desde el Sensor Data Repository.


P: ¿Que parametro de systemd configura el watchdog del sistema?

R: b) RuntimeWatchdogSec=. RuntimeWatchdogSec= en /etc/systemd/system.conf configura el timeout del watchdog de systemd. Si systemd no responde dentro de este tiempo, el watchdog reinicia el sistema.


P: ¿Que funcion tiene el BMC (Baseboard Management Controller) en un servidor?

R: b) Permitir gestion remota del hardware independiente del SO. El BMC es un controlador independiente que permite gestionar el servidor remotamente (encender, apagar, consola, sensores) incluso cuando el sistema operativo no esta funcionando o el servidor esta apagado.


P: ¿Que directiva en /etc/nut/upsmon.conf especifica el comando que se ejecutara para apagar el sistema cuando la bateria del UPS esta baja?

R: b) SHUTDOWNCMD. La directiva SHUTDOWNCMD en upsmon.conf define el comando de apagado que se ejecuta cuando el UPS reporta bateria baja. El valor tipico es "/sbin/shutdown -h +0" para un apagado inmediato.


P: ¿Que significan las siglas CE y UE en el contexto de la memoria ECC?

R: b) Corrected Error y Uncorrected Error. CE (Corrected Error) son errores de un bit que la memoria ECC corrige automaticamente. UE (Uncorrected Error) son errores de multiples bits que no pueden corregirse y son criticos. Se monitorizan en /sys/devices/system/edac/mc/.


P: ¿Que configuracion de fuentes de alimentacion redundantes se conoce como N+1?

R: b) N fuentes activas mas una adicional de reserva compartiendo la carga. La configuracion N+1 significa que hay N fuentes necesarias para alimentar el servidor mas una adicional de reserva. Todas las fuentes comparten la carga. Si una falla, las restantes absorben la carga sin interrupcion.


P: ¿Que funcion cumple el caracter “V” cuando se escribe en /dev/watchdog?

R: b) Realiza un “magic close” que desactiva el watchdog al cerrar el dispositivo. Escribir “V” (magic close character) en /dev/watchdog antes de cerrar el descriptor de archivo permite desactivar el watchdog limpiamente. Sin este caracter magico, cerrar /dev/watchdog provocaria que el watchdog reinicie el sistema al expirar el timeout.


P: ¿Que comando de ipmitool activa una sesion de consola serial remota (Serial over LAN)?

R: b) ipmitool -I lanplus -H IP -U user -P pass sol activate. SOL (Serial over LAN) permite acceder a la consola serial del servidor remotamente a traves de la red mediante IPMI. Es util para diagnosticar problemas de arranque o cuando el SO no responde.


P: ¿En que archivo de NUT se configuran los usuarios y sus permisos para acceder al daemon upsd?

R: c) /etc/nut/upsd.users. El archivo /etc/nut/upsd.users define los usuarios que pueden conectarse al daemon upsd, sus contraseñas, acciones permitidas (SET, FSD) y su rol de monitorizacion (master o slave).


P: ¿Que parametro de upsmon.conf define el tiempo en segundos antes de considerar que un UPS esta muerto?

R: c) DEADTIME. DEADTIME especifica el numero de segundos sin respuesta del UPS antes de que upsmon lo considere como muerto (inaccesible). El valor predeterminado es 15 segundos. Si se alcanza, se disparan las acciones de emergencia.


P: ¿Que modulo de watchdog esta diseñado para chipsets Intel?

R: b) iTCO_wdt. iTCO_wdt (Intel TCO Watchdog Timer) es el modulo de watchdog de hardware para chipsets Intel. TCO (Total Cost of Ownership) es un subsistema de los chipsets Intel que incluye un timer de watchdog. Es mas fiable que el watchdog por software (softdog).


P: ¿Que comando de ipmitool muestra el registro de eventos del sistema (System Event Log)?

R: c) ipmitool sel list. ipmitool sel list muestra el System Event Log (SEL) que contiene eventos de hardware como errores de temperatura, fallos de discos, errores de memoria, etc. Para limpiar el log se usa ipmitool sel clear.


P: ¿Que directiva de ShutdownWatchdogSec en /etc/systemd/system.conf controla?

R: b) El timeout del watchdog durante el proceso de apagado del sistema. ShutdownWatchdogSec define cuanto tiempo se permite para el proceso de apagado antes de que el watchdog fuerce un reinicio. Esto evita que un apagado colgado deje el sistema inaccesible indefinidamente.


P: Escribe el comando para ver el estado de los sensores de hardware del servidor usando ipmitool localmente.

R: ipmitool sensor list. ipmitool sensor list muestra todos los sensores del servidor incluyendo temperaturas, voltajes y velocidades de ventiladores. Cada sensor muestra su valor actual, umbrales y estado.


P: Escribe el comando para consultar el estado de un UPS llamado “mi_ups” conectado localmente usando NUT.

R: upsc mi_ups@localhost. upsc (UPS Client) consulta las variables del UPS incluyendo estado de la bateria, carga, voltaje de entrada/salida y tiempo restante estimado. Se especifica el nombre del UPS y el host donde corre upsd.


P: Escribe el comando para forzar un apagado de emergencia (Forced ShutDown) desde upsmon de NUT.

R: upsmon -c fsd. upsmon -c fsd envia la señal de Forced ShutDown al daemon upsmon, que inicia el proceso de apagado ordenado del sistema. Los servidores slave se apagan primero, seguidos del master que finalmente ordena al UPS cortar la alimentacion.


P: Escribe el comando para ver los errores de memoria ECC corregidos del controlador de memoria mc0 en Linux.

R: cat /sys/devices/system/edac/mc/mc0/ce_count. El archivo ce_count en sysfs muestra el numero de errores corregidos (Corrected Errors) del controlador de memoria mc0. ue_count muestra los errores no corregidos. EDAC (Error Detection and Correction) es el subsistema del kernel para monitorizar errores de memoria.


P: Escribe el comando para configurar la direccion IP 192.168.1.200 en el canal LAN 1 del BMC usando ipmitool.

R: ipmitool lan set 1 ipaddr 192.168.1.200. ipmitool lan set permite configurar los parametros de red del BMC. El canal 1 es el canal LAN por defecto. Tambien se puede configurar la mascara de red (netmask) y la puerta de enlace (defgw ipaddr).


P: Tip de examen: ECC es esencial en servidores. Los errores corregidos (CE) son normales en peque…

R: ECC es esencial en servidores. Los errores corregidos (CE) son normales en pequeñas cantidades. Los errores no corregidos (UE) son criticos.


P: Tip de examen: El watchdog es fundamental para SBD en clusters Pacemaker. Si el nodo no puede h…

R: El watchdog es fundamental para SBD en clusters Pacemaker. Si el nodo no puede hacer fencing de si mismo, el watchdog lo reinicia forzosamente.


P: Tip de examen: Conoce los archivos nut.conf, ups.conf, upsmon.conf y upsd.users. El mod…

R: Conoce los archivos nut.conf, ups.conf, upsmon.conf y upsd.users. El modo netserver permite compartir el UPS con otros servidores.


P: Tip de examen: IPMI se usa como dispositivo de fencing (fence_ipmilan) en clusters Pacemaker…

R: IPMI se usa como dispositivo de fencing (fence_ipmilan) en clusters Pacemaker. ipmitool es la herramienta principal para interactuar con el BMC.


P: Que hace el comando standalone?

R: UPS conectado localmente, sin compartir


P: Que hace el comando netserver?

R: UPS local, comparte con otros via red


P: Que es/son Watchdog Timers?

R: Un watchdog timer es un temporizador de hardware o software que reinicia el sistema si detecta que no responde.


P: Que es/son IPMI/BMC?

R: IPMI (Intelligent Platform Management Interface) y BMC (Baseboard Management Controller) permiten la gestion remota del hardware del servidor, incluso cuando esta apagado.


P: Que es/son Trampas del examen?

R: > Errores comunes y distinciones criticas que LPI suele evaluar en este subtema: