RAC e Cluster

giovedì 22 marzo 2007 alle 22:58 | Pubblicato su Installation and Configuration, RAC | Lascia un commento

Oggi voglio riprendere un post di qualche tempo fa di Kevin Closson (Rac Expert or Cluster Expert), esperto di Cluster. In particolare nel suo post discuteva sul meccanismo denominato “fencing”. E’ un meccansimo fondamentale in un Cluster tipo quello interpretato dal RAC di Oracle, prima quindi spiego brevemente l’architettura di un cluster tipo il RAC. Vi sono più macchine (i nodi del cluster) che lavorano insieme comunicando fra loro, tipicamente tramite un rete di interconnessione privata, tali macchine condividono però una risorsa comune: i dischi. Il meccansimo di fencing è quello che deve difendere la risorsa condivisa (i dischi, o meglio i dati che ivi sono registrati) dall’accesso di una macchina del cluster che per qualche motivo non comunica più con le altre. Se un nodo del cluster per qualche motivo non comunica più con gli altri nodi, accedendo ai dati sul disco potrebbe corromperli, quindi si rende necessario il fencing. Il tipo di fencing più comune è lo STOMITH, ossia Shot The Other Machine In The Head (in alternativa la M di machine è sostituita dalla N di Nodo). Il concetto è che se un nodo del cluster non è più “sano” e non comunica correttamente con gli altri nodi del cluster, allora non fa più parte del cluster e deve essere “eliminato”. L’approccio utilizzato dal Clusterware di Oracle (nel caso di Linux demandato i ad un modulo del kernel denominato hangcheck-timer) è quello di lanciare un reboot della macchina. Questo approccio viene un po’ criticato da Kevin Closson nel suo post, infatti egli fa notare che la macchina in questione potrebbe essere così impallata da non rispondere al comando di reboot. Ciò nonostante avrebbe ancora accesso ai dischi e potrebbe corrompere i dati.

Fra le alternative possibili al reboot Kevin Closson riporta un’implementazione della ditta per cui lavora che comunica con lo switch in fibra tramite cui i nodi sono collegati solitamente alla SAN: in caso un nodo di problemi gli viene troncato l’accesso ai dischi, lasciando la macchina in piedi per successive diagnosi del problema.

Lascia un commento »

RSS feed for comments on this post. TrackBack URI

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

Crea un sito o un blog gratuitamente presso WordPress.com.
Entries e commenti feeds.

%d blogger cliccano Mi Piace per questo: