Alta disponibilitat

Xavier Trilla

27 de Gener de 2026 15:16
Actualització

En Clouding hem creat una plataforma d'Alta Disponibilitat per als teus projectes. El nostre objectiu és oferir-te sempre la major disponibilitat en el servei i per això utilitzem múltiples estratègies.

Monitoratge

El nostre sistema de monitoratge és un dels sistemes principals de Clouding. Tenim configurats desenes de milers de monitors, que controlen constantment l'estat de tots els equips i infraestructura.

Això ens permet anticipar-nos a qualsevol problema abans que afecti el servei i monitorar molt de prop tot el rendiment de la plataforma.

Seria extremadament llarg detallar tots els tipus de monitors que utilitzem, però alguns exemples que poden ajudar-te a fer-te una idea del nivell de monitoratge serien:

Sistema elèctric
- Consum elèctric per armari
- Estat i consum de les 2 preses elèctriques de cada armari (A i B)
- Estat i consum de les 2 fonts d'alimentació de cada equip
Xarxa
- Estat de tots els ports de xarxa (En Switches i Equips)
- Errors CRC en ports de Switch i targetes de xarxa
- Nivell de càrrega de cada port de xarxa
- Càrrega de cada proveïdor d'accés a internet
- Temps de resposta de cada proveïdor des de diferents punts internacionals
CPU
- Nivell de càrrega de cada Core físic
- Interrupcions de maquinari per segon en cada Core físic
- Temps d'espera en cada Core físic
- Canvis de context per Core per segon
Memòria
- Percentatge d'ús de memòria de tots els equips
- Estat de fragmentació de memòria de tots els equips
- Errors de single bit corregits pel sistema ECC
- Nivell de swap utilitzat (Ha de ser sempre 0)
- Estat de balanceig NUMA
Disc
- Temps de resposta de disc
- Percentatge de càrrega d'accés a disc
- Capacitat utilitzada per disc
- Nivell de wearing de discos d'estat sòlid
- Errors de sector en disc rotacionals (en cas de detectar-se un error es reemplaça el disc preventivament)
Temperatura
- Múltiples sensors de temperatura per equip (CPU, Discos, Chipset, etc.)
- Revolucions per Minut de cada ventilador

Aquests i altres monitors reporten contínuament als tècnics de guàrdia de Clouding, que són els encarregats de mantenir la plataforma sempre funcionant i amb el millor rendiment. El nostre sistema de monitoratge reporta per E-Mail, SMS i fins i tot trucades telefòniques per assegurar-nos que un avís important no es perdi mai entren alertes de menor importància o urgència.

Hypervisors i discs separats

Aquesta és potser la principal característica de la nostra plataforma. A Clouding tenim separat l'emmagatzematge dels servidors cloud, dels equips en què s'executen.

El gran avantatge d'aquest sistema, davant utilitzar un RAID local tradicional, és que en cas d'una fallada de hardware en un hypervisor, els servidors cloud allotjats en el mateix, poden tornar-se a iniciar immediatament en un altre hypervisor diferent.

Això fa que puguem recuperar un error de maquinari en un hypervisor en minuts, en lloc de diverses hores com passaria utilitzant un RAID local.

Triple Rèplica

Encara que tinguem discos i hypervisors separats, això no serviria de res si no disposéssim d'una infraestructura d'emmagatzematge capaç d'assegurar que les dades sempre estaran disponibles.
En Clouding utilitzem un clúster d'emmagatzematge en alta disponibilitat, capaç de garantir que les teves dades sempre estaran disponibles.
Pots veure tota la informació sobre el nostre sistema de Triple Rèplica aquí.

Plataforma 100% redundada

Per oferir-te la més alta disponibilitat, és molt important que una fallada en qualsevol part de la plataforma no pugui afectar el servei. És per això, que tots els sistemes que conformen la plataforma de Clouding estan redundats.

Gràcies a la redundància, encara que tinguin lloc errors en algun sistema no afectaran el servei que et prestem.

Pots veure tota la informació sobre la redundància de la nostra plataforma aquí.

Articles en aquesta secció

Monitoratge

Hypervisors i discs separats

Triple Rèplica

Plataforma 100% redundada

Articles relacionats