- Usa AWS Health Dashboard ed EventBridge per eventi affidabili e in tempo reale.
- Controlla lo stato di rinnovo dell'ACM e le notifiche precedenti alla scadenza.
- Controlla i controlli di EC2 e i parametri di CloudWatch per attivare allarmi e recupero.
- Tieni presente la naturalezza regionale dell'AWS e convalida la regione per la diagnosi.

Quando hai bisogno verificar el estado de AWS, non basta con mirar si un servicio “funciona o no”. La chiave è combinata con il pannello di saluto, avvisi in tempo reale e verifiche specifiche delle tue risorse per capire cosa succede e come ti affligge. Se lavori con carichi critici, anticipare gli incidenti o rilevare il degrado delle prestazioni può spaventarti di più di un susto.
In questa guida troverai tutto ciò che è necessario per controllare lo stato di AWS in forma effettiva: da AWS Health Dashboard e l'integrazione con EventBridge, fino alla verifica dello stato di rinnovamento dei certificati in ACM e alle verifiche di salubrità delle istanze EC2 (compresi i parametri di CloudWatch e le opzioni di recupero). Inoltre, troverai consigli pratici se la console non ti carica o un servizio sembra caído nella tua regione.
AWS Health Dashboard: il tuo punto di partenza per lo stato dei servizi
Il dashboard AWS Health mostra informazioni su interruzioni del servizio, eventi in corso e manutenzione pianificata. È un servizio integrato nel tuo account, non richiede configurazione e puoi accedere se sei autenticato. Il risultato è molto utile quando non si trova una risorsa concreta (ad esempio, un'istanza di EC2 che è semplicemente in manutenzione).
Ricorda un dettaglio importante: i servizi di AWS sono regionali. Se consulti il pannello di saluto, assicurati di selezionare la regione corretta dal selettore corrispondente; altrimenti non puoi vedere eventi rilevanti per le tue risorse.
Da settembre 2023, quando si apre un evento pubblico di AWS Health, l'URL del navigatore viene aggiornato con un collegamento profondo a questo evento. Quando condividi questo collegamento o apri l'apertura, accederai alla vista dell'elenco degli eventi con la finestra emergente dell'evento già caricato, che faciliterà il seguito e la collaborazione con il tuo team.
Si un día la consola no te carga o devuelve errores del tipo 404, conviene ir por partes. La prima cosa da fare è rivedere AWS Health Dashboard per verificare se c'è un evento attivo che interessa il servizio che intendi utilizzare. Successivamente, puoi provare a pulire la cache e i cookie del navigatore, cambiare un altro navigatore e verificare con il tuo amministratore che non hai bloccato i domini di Amazon (ad esempio, aws.amazon.com).
Inserisci eventi di salute: EventBridge frente a RSS
Anche se esiste un feed RSS con eventi di salute, il suo formato può cambiare con il tempo, perché basare il programma su di esso non è più affidabile. Eliminare il consumo diretto dell'RSS potrebbe lasciare fuori il gioco se si adatta lo schema o il contenuto.
La raccomandazione è chiara: integra AWS Health con Amazon EventBridge. In questo modo riceverai eventi in forma coerente, con un formato stabile e un elenco per eseguire le destinazioni come Lambda, cole, notifiche o tabelle interne. Este enfoque ti permette di automatizzare le risposte, registrare incidenti e generare allarmi senza dipendere da formati fragili.
In altre parole, si quieres robustez y trazabilidad, EventBridge è la strada giusta per monitorare gli eventi di AWS Health. Da qui, puoi arricchire le informazioni, associarla a servizi, team o SLA interni e attivare caldo quando qualcosa si verifica.
ACM: come verificare lo stato di ristrutturazione dei tuoi certificati
Con AWS Certificate Manager (ACM) puoi sapere se i tuoi certificati vengono rinnovati correttamente. Un certificato è idoneo per il rinnovamento automatico se è associato a un altro servizio AWS (come Elastic Load Balancing o CloudFront) o se viene esportato dalla tua emissione o ultimo rinnovamento. Questa idoneità è fondamentale affinché ACM gestisca le ristrutturazioni senza dover intervenire.
Quando si avvia un processo di ristrutturazione, ACM mostra un campo chiamato Stato di rinnovo nei dettagli del certificato. Puoi consultare questo stato dalla console, dall'API, dall'AWS CLI o anche attraverso AWS Health Dashboard. Se usi la consola, vedrai uno dei vari valori possibili per questo stato; de forma simile si riflette nel pannello di saluto.
Negli ambienti automatizzati risulta molto utile estrarre l'API di ACM. Con l'azione DescribeCertificate si ottengono i dettagli di un certificato, incluso lo stato di ristrutturazione. Per Java (o altre lingue) puoi basarti sull'SDK di AWS e consultare periodicamente questo campo per anticipare cadute o rilevare blocchi di convalida.
Se preferisci la linea di comando, l'AWS CLI sviluppa lo stato di ristrutturazioneUn esempio semplice sarebbe:
aws acm describe-certificate --certificate-arn arn:aws:acm:REGION:ACCOUNT:certificate/CERTIFICATE_ID
Nella risposta JSON, digita nel campo Stato di Rinnovo. Se non appare, significa che ACM oggi non ha avviato il processo di ristrutturazione gestito per questo certificato. È un dettaglio che è scomparso, ma ti viene indicato chiaramente in quale punto sei del ciclo.
ACM intende rinnovare automaticamente un certificato 60 giorni prima della scadenza. Se per qualche motivo non puoi farlo (ad esempio, un problema con la convalida del dominio), troverai avvisi su AWS Health Dashboard con allegato: 45, 30, 15, 7, 3 e 1 giorni prima della caduta. Questi eventi non richiedono configurazioni aggiuntive e están disponibles para qualquier utente autenticado en tu cuenta, in modo che l'apparecchiatura possa reagire a tempo.
Cuando la consola no abre o devuelve errores: pasos rápidos
Si te topas con un 404 o la consola no carga, empieza verificando il AWS Health Dashboard e la regione delle tue risorse. Un evento pubblico o una manutenzione regionale possono spiegare perché non c'è alcuna consolazione o servizio.
Si no hay eventos relevantes, svuota la cache e i cookie del tuo browser, prova con un altro navigatore e, se sei in una rossa azienda, chiedi al tuo team di TI di verificare che non ci siano blocchi nei domini dell'Amazzonia o nei sottodomini critici.
Procura conferma anche che il problema non è una risorsa concreta nel tuo conto. Ad esempio, un'istanza EC2 può essere mantenuta per la manutenzione o influenzata da un evento; il pannello di saluto mostrerà queste informazioni e ti orienterà sulla finestra e sull'impatto.
Verifica dello stato di istanze EC2: assegni e parametri
Amazon EC2 eseguito verifiche automatiche in ciascuna istanza di esecuzione per rilevare problemi hardware e problemi software che potrebbero impedire alle tue applicazioni di funzionare normalmente. Questo controllo viene realizzato ogni minuto e produsse un risultato che indica se tutto è buono o se è peggiorato.
Cuando todas las verificaciones se superan, el estado global se marca como OK. Se una o varias fallan, el estado pasa a compromesso (deteriorato). Queste verifiche sono integrate nel servizio, non è possibile disattivarlo o eliminarlo, e ti verranno forniti segnali temporanei sui problemi che ti verranno forniti.
A ogni tipo di verifica è associata una metrica su Amazon CloudWatch. Quando si perde un assegno, la metrica corrispondente aumenta. Esto te permite crear allarmi que salten al detector errores de estado, ya sea en una instancia concreta oa escala de flota.
Más aún, puedes apoyarte en allarmi e azioni di CloudWatch per automatizzare le risposte. Ad esempio, configurare un allarme da avvisare quando gli assegni caduti in un'istanza specifica o abilitare la recupero automatico quando il deterioramento è dovuto a un problema presente nell'host.
Se è necessaria una resilienza avanzata, non ci sono limiti agli allarmi. Combina parametri di stato con Auto Scaling per sostituire le istanze deteriorate e mantieni la tua capacità salutare senza intervento manuale, soprattutto in piccoli carichi di traffico o carichi di lavoro sensibili alla latenza.
Comprobazioni dello stato del sistema
Queste verifiche sono monitorate l'infrastruttura di AWS sottostante dove corre la tua istanza. Quando si verifica un errore, è necessario l'intervento di AWS o le azioni eseguite dall'istanza su un altro host per correggere il problema.
Nei casi riparati da EBS, una soluzione efficace è trattenere e avviare l'istanza. Questa azione, nella maggior parte degli scenari, trasferisce l'istanza su un nuovo host e può risolvere il fallimento della piattaforma. Se si lavora con istanze recuperate dall'archivio di istanze (solo Linux), è possibile terminare e sostituire l'istanza, tenendo presente che i volumi dell'archivio istanze sono effimeri e los datos si perfora al detener.
Quando falla una comprobazione del sistema, aumenta la metrica StatusCheckFailed_System. È il segnale ideale per attivare allarmi, avviare procedure di emergenza o, nel caso, aprire un caso di supporto se persiste l'impatto.
Hai un matiz con Bare Metal: se si riavvia dal sistema operativo, la verifica dello stato del sistema può segnalare un errore di forma temporale. Quando l'istanza appare disponibile, lo stato dovrebbe essere approvato, peccato che non tocchi nulla in più.
Comprobaciones de statodo de la instancia
Estas verificaciones analizan la connettività di rete e il software della propria istanza. EC2 effettua la convalida inviando solleciti ARP all'interfaccia di rete (NIC) per confermare che la risposta è come dovuta.
Quando falla una verifica dell'istanza, suele requerir tu intervención directa: riavviare l'istanza, rivedere la configurazione di rete (ad esempio, le regole di iptables o un firewall che taglia traffico), analizzare i log del sistema o verificare che l'agente di rete stia rispondendo.
Al producirse un fallo, viene incrementata la metrica StatusCheckFailed_Instance. Questa metrica è perfetta per eliminare allarmi ed eseguire runbook di diagnostica: dalla copia dei log forzare un riavvio controllato se viene rilevato che il servizio non è stato rimosso.
Anche se con il controllo del sistema, su Bare Metal un ripristino dal SO può provocare uno stato di errore temporale nella verifica dell'istanza. Quando l'istanza termina il ciclo di organizzazione, la verifica dovrebbe tornare a OK senza alcuna complicazione.
Comprobazioni dello stato di EBS aggiunto
Queste verifiche sono riviste se lo sono I volumi di Amazon EBS aggiunti all'istanza sono accessibili e completano E/S. La metrica che riflette gli errori è questa StatusCheckFailed_AttachedEBS, di tipo binario, che indica l'impatto quando uno o più volumi non possono eseguire operazioni di E/S.
Un fallo aquí apunta a problemi legati al calcolo o all'infrastruttura EBS. Puoi sperare che AWS mitighi l'incidente o attivi: sostituire i volumi interessati, trattenere e avviare l'istanza per spostare il nuovo host o anche riparare il reparto di IOPS se rileva contenitori di bottiglia prolungati.
Per carichi di lavoro resilienti, prova questa metrica per crear alarmas en CloudWatch. Secondo la tua architettura, puoi eliminare la commutazione per errore in un'istanza secondaria o in un'altra zona di disponibilità al rilevamento dell'impatto sostenuto, riducendo il tempo fuori servizio.
Se il tuo carico di lavoro non è fatto da E/S a nessun volume aggiunto, ma la verifica indica un deterioramento, trattenere e avviare l'istanza può risolvere i problemi dell'host che influiscono sull'accessibilità del volume. Si integra con i parametri di EBS su CloudWatch per rilevare i volumi che si ritrovano sotto l'aspettativa e sostituirli preventivamente se toccati.
Nelle flotte amministrate da Auto Scaling, configura la politica per rilevare errori nel controllo di EBS aggiunto e sostituire l'istanza interessata. Così, si mantiene la salute del gruppo senza intervento manuale ed si evitano deterioramenti prolungati.
Allarmi e automatizzazione con CloudWatch e Auto Scaling
Con tutte le metriche precedenti, CloudWatch si converte nel tuo sistema nervoso. Definisci ombre, crea allarmi e orquesta azioni: notifiche, esecuzione di funzioni Lambda o recupero di istanze quando si cumplan ciertas condiciones.
Se è necessaria la continuità del negocio, piensa en términos de automatización y reemplazo: Auto Scaling può ritirare istanze con controlli deteriorati e lanciare nuovi, mentre gli allarmi coordinano le risposte e ti avvisano dai canali adeguati (correo, Slack, PagerDuty, quello che usi).
La combinazione di parametri di stato, log, tracce ed eventi di AWS Health tramite EventBridge ti dà una visione olistica. Quindi saprai se il problema riguarda la tua applicazione, l'istanza, il volume di EBS o la piattaforma sottostante e agirai con precisione chirurgica.
Buone pratiche per verificare lo stato di AWS con cabeza
Centraliza la observabilidad: utilizza AWS Health Dashboard per il contesto della piattaforma e CloudWatch per i parametri operativi. Questo doppio approccio evita di perdere dettagli importanti di ogni capo.
Para certificados, no lo dejes al azar. Automatizza la revisione di RenewalStatus in ACM e reagisce alle notifiche del pannello di salute a 45, 30, 15, 7, 3 e 1 giorni di caduta. Si algo falla, tendrás margen de sobra.
En EC2, attiva alarmas sobre StatusCheckFailed_System, StatusCheckFailed_Instance y StatusCheckFailed_AttachedEBS. Azioni associate: recupero, ripristino, commutazione per errore o sostituzione tramite Auto Scaling, secondo il tuo SLA.
Y si la consola se empeña en no cargar, recuerda la receta: verifica gli eventi su Health Dashboard nella regione corretta, pulisci cache/cookie, cambia navigatore e conferma con TI che non si blocca il dominio di AWS.
Risorse e informazioni correlate
Per ampliare la configurazione e l'operatività, consulta la documentazione di AWS Health e di EventBridge per il collegamento degli eventi. Nell'ambito dei certificati, rivedere la guida di ACM e gli esempi di DescribeCertificate se si devono integrare le verifiche sulle tubazioni o sui monitor interni.
- Pannello di controllo sanitario AWS: visibilità degli eventi pubblici e del conto, senza configurazione extra.
- Amazon EventBridge: ingesta fiable de eventos de salud, con reglas y destini flessibili.
- Gestore certificati AWS (ACM): stato di ristrutturazione e notifiche previas alla caducidad.
- Amazon EC2 + CloudWatch: controlli al minuto, parametri di stato e allarmi con azioni.
Se ti preoccupi dell'accesso al conto, ci sono articoli di aiuto molto utili: come creare e attivare un nuovo account, come avviare la sessione sulla console o come inviare supporto. Tenlos a mano se gestionas vari entornos o rotas credenciales con frecuencia.
Verificare lo stato di AWS non è guardare un unico pannello e già. Si tratta di unificare i segnali di AWS Health, gli eventi di EventBridge, gli stati di ACM e i controlli di EC2/componente per componente, con allarmi che stanno accadendo e i playbook chiariscono. Con questa combinazione la diagnosi sarà rapida, senza sorprese e con un'operazione più tranquilla, anche quando il traffico è sotto e le cose sembrano interessanti.