En Clouding hem creat una plataforma d'Alta Disponibilitat per als teus projectes. El nostre objectiu és oferir-te sempre la major disponibilitat en el servei i per això utilitzem múltiples estratègies.
Monitorització
El nostre sistema de monitorització és un dels sistemes principals de clouding. Tenim configurats desenes de milers de monitors, que controlen constantment l'estat de tots els equips i infraestructura.
Això ens permet anticipar-nos a qualsevol problema abans que afecti el servei i monitoritzar molt de prop tot el rendiment de la plataforma.
Seria extremadament llarg detallar tots els tipus de monitors que utilitzem, però alguns exemples que poden ajudar-te a fer-te una idea de el nivell de monitorització serien:
- Sistema elèctric
- Consum elèctric per armari
- Estat i consum de les 2 preses elèctriques de cada armari (A i B)
- Estat i consum de les 2 fonts d'alimentació de cada equip
- Xarxa
- Estat de tots els ports de xarxa (En Switches i Equips)
- Errors CRC en ports de Switch i targetes de xarxa
- Nivell de càrrega de cada port de xarxa
- Càrrega de cada proveïdor d'accés a internet
- Temps de resposta de cada proveïdor des de diferents punts internacionals
- CPU
- Nivell de càrrega de cada Core físic
- Interrupcions de maquinari per segon en cada Core físic
- Temps d'espera en cada Core físic
- Canvis de context per Core per segon
- Memòria
- Percentatge d'ús de memòria de tots els equips
- Estat de fragmentació de memòria de tots els equips
- Errors de single bit corregits pel sistema ECC
- Nivell de swap utilitzat (Ha de ser sempre 0)
- Estat de balanceig NUMA
- Disc
- Temps de resposta de disc
- Percentatge de càrrega d'accés a disc
- Capacitat utilitzada per disc
- Nivell de wearing de discos d'estat sòlid
- Errors de sector en disc rotacionals (en cas de detectar-se un error es reemplaça el disc preventivament)
- Temperatura
- Múltiples sensors de temperatura per equip (CPU, Discos, Chipset, etc.)
- Revolucions per Minut de cada ventilador
Aquests i altres monitors reporten contínuament als tècnics de guàrdia de clouding, que són els encarregats de mantenir la plataforma sempre funcionant i amb el millor rendiment. El nostre sistema de monitorització reporta per E-Mail, SMS i fins i tot trucades telefòniques per assegurar-nos que un avís important mai es traspapela entre alertes de menor importància o urgència.
Hypervisores i discs separats
Aquesta és potser la principal característica de la nostra plataforma. En clouding tenim separat l'emmagatzematge dels servidors Cloud, dels equips en què s'executen.
El gran avantatge d'aquest sistema, davant utilitzar un RAID local tradicional, és que en el cas d'una fallada de hardware en un Hypervisor, els servidors Cloud allotjats en el mateix, poden tornar-se a iniciar immediatament en un altre Hypervisor diferent.
Això fa que puguem recuperar un error de maquinari en un hypervisor en minuts, en lloc de en diverses hores com ocorreria utilitzant un RAID local.
Triple Rèplica
Encara que tinguem discos i hypervisores separats, això no serviria de res si no disposéssim d'una infraestructura d'emmagatzematge capaç d'assegurar que les dades sempre estaran disponibles.
En clouding utilitzem un clúster d'emmagatzematge en alta disponibilitat, capaç de garantir que les teves dades sempre estaran disponibles.
Pots veure tota la informació sobre el nostre sistema de Triple Rèplica aquí.
Plataforma 100% redundada
Per oferir-te la més alta disponibilitat, és molt important que una fallada en qualsevol part de la mateixa no pugui afectar el servei. És per això, que tots els sistemes que conformen la plataforma de clouding estan redundats.
Gràcies a la redundància, encara que tinguin lloc errors en algun sistema no afectaran el servei que et prestem.
Pots veure tota la informació sobre la redundància de la nostra plataforma aquí.