Data Warehouse Appliances and Column-oriented DBMS

mercoledì 9 luglio 2008 alle 09:48 | Pubblicato su Business Intelligence, Diario, Installation and Configuration | Lascia un commento

Non molto tempo fa ho aggiunto a questo blog una nuova categoria: “Business Intelligence“.  In quel periodo ho avuto modo di esplorare, seppur per poco, il mondo della business intelligence cercando di capire cosa fosse, cos’è il data warehouse, i cubi e OLAP. Poi ho avuto un periodo di lavoro particolarmente intenso che ha interrotto i miei approfondimenti. Ora per fortuna sto riprendendo un po’ di fiato, e contemporanemente Kevin Closson ha ripreso a scrivere sul suo blog con una certa regolarità. A dire il vero a tratti sembra un po’ inacidito, perchè gli ultimi post hanno un sapore vagamente polemico. In particolare ho trovato istruttivi e interessanti gli ultimi tre post della serie “I Know Nothing About Data Warehouse Appliances and Now, So Won’t You. Tuning Data Warehouse Appliances” (Part I, Part II, Part III). Questi post mi permettono di riprendere il mio cammino di esplorazione del mondo della Business Intelligence.

Data Warehouse Appliance

Indirettamente questa nuova serie di post di Kevin Closson mi hanno fatto conoscere una cosa nuova: i “Data Warehouse Appliance“. In sostanza si tratta di apparecchi dedicati al datawarehouse, in cui è inclusa una parte harware e  una parte software specializzato, quindi riguarda l’argomento Business Intelligence su cui devo imparare ancora un sacco di cose. Un altro motivo ho trovato interessante  i post di Kevin Closson  è che sono dedicati a smentire degli slogan pubblicitari. Closson attacca più volte il CEO (e fondatore) di DATallegro, un produttore di DW Appliance appunto.

Column-oriented DBMS

Come ha ricordato nel primo post della serie, Kevin Closson ha avuto gia modo di criticare alcune teorie su cui in pratica pare facciano leva sistemi come DATAllegro o Vertica. Egli infatti rimanda a due suoi vecchi post ( columnar technology I, columnar technology II). Qui si parla della teoria dei database Column-oriented in contrapposizione ai database row-oriented. La ricorrenza di questo termine mi ha spinto a cercare di capire un po’ di cosa si trattasse. Il commento di Jonathan Lewis mi è piaciuto molto perchè forse centra il problema, ovvero di propagandare un concetto per quello che non è.  In realtà per quel poco che ho capito e letto il concetto è interessante, anche se come appunto ricorda Jonathan Lewis non stravolge la teoria dei database relazionali. Utile al riguardo mi sembra il commento di Maxim Grinev che cita un articolo in cui vengono confrontate le due tecniche (row-store contro column-store).

Vorrei poter riportare qui qualche informazioni tecnica più precisa e completa, ma siccome non sono ancora così preparato mi limito a citare un po’ di riferimenti e a riportare un po’ quello che ho capito fin’ora. Mi prendo la libertà di usare il blog per quello che è e no per una rivista tecnica specializzata o una enciclopedia. Quindi mi si scusi per l’incompletezza delle informazioni.

Per chi fosse interessato ad approfondire (me compreso) aggiungo alcuni riferimenti:

  • Progetto C-store, vi sono un po’ di documenti che descrivono il concetto di column-oriented DBMS
  • The Database Column. Si tratta di un blog sui DBMS su cui scrivono vari autori fra cui Michael Stonebraker, precursore dei database relazionali, co-fondatore di Vertica e attualmente pare precursore dei column-oriented DBMS.

La mia prima impressione, senza aver studiato tutti i detagli dei sistemi “column-oriented” è che in ambienti datawarehouse, quindi in presenza di dati spesso molto de-normalizzati il concetto di base di organizzare i dati per colonne piuttosto che per righe sembra aver senso. Il fatto è che alcuni venditori di DW Appliance forse lo pubblicizzano,m insieme ad altre cose, come la panacea di tutti i mali. Si tratta delle solite esagerazioni pubblicitarie e propagandistiche che personalmente mi infastidiscono e a quanto pare infastistidiscono anche Kevin Closson.

A pensarci bene, qualche giorno fa, in un post intitolato “Of Gag-Orders, Exitement and New Products” cita una frase di Larry Ellison in cui annuncia per il prossimo Settembre un grossa novità: che si tratti di un Oracle Datawarehouse Appliance ???😉 staremo a vedere.

Lascia un commento »

RSS feed for comments on this post. TrackBack URI

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

Blog su WordPress.com.
Entries e commenti feeds.

%d blogger cliccano Mi Piace per questo: