Yaygın Olarak Kullanılan Veri Ambarı Tasarım Teknikleri
2025-06-15 Abdullah Kise
Kurumsal karar destek sistemlerinin başarısı, doğru yapılandırılmış bir veri ambarına dayanır. Farklı sistemlerden gelen büyük miktarda verinin anlamlı, tutarlı ve sürdürülebilir şekilde yönetilebilmesi için etkili bir tasarım yaklaşımı şarttır. Veri ambarı mimarisinde kullanılan metodolojiler, zaman içinde farklı ihtiyaçlara ve teknolojik gelişmelere paralel olarak evrilmiştir.
Bu yazıda; geleneksel yaklaşımlar olan Inmon ve Kimball metodolojilerinden başlayarak, daha çevik ve esnek tasarım imkânı sunan Data Vault ve Anchor Modelling gibi modern yöntemlere kadar, en yaygın veri ambarı tasarım tekniklerini inceliyoruz. Her bir yaklaşımın mimari yapısı, güçlü yönleri ve uygulama senaryoları üzerinden karşılaştırmalı bir perspektif sunarak, hangi yöntemin hangi ihtiyaçlara daha uygun olabileceğine dair yol gösterici bir çerçeve ortaya koymayı hedefliyoruz.
Geleneksel Veri Ambarı Tasarım Yaklaşımları
- Dimensional Modelling (Boyutsal Modelleme)
- Geçmişi 1960'lardaki General Mills ve Dartmouth College işbirliğindeki araştırmalara dayanır.
- Kimball metodolojisi ile ilişkilendirilir. Ancak, Inmon ve Data Vault gibi diğer yaklaşımlarla da kullanılır.
- 3NF (Üçüncü Normal Form) olarak tasarlanan operasyonel veritabanlarının aksine kendine has bir tasarım yaklaşımı vardır. Bu yaklaşım denormalize bir yapı elde etmeyi sağlar. Denormalizasyon, NF (Normal Form) kurallarının tamamen kaldırılması anlamına gelmez. Yani, 3NF kurallarının bazıları hala geçerlidir.
- Dimension modelleme, verilerin boyutlarını (dimensions) ve ölçümlerini (facts) tanımlayarak raporlama ve analiz için optimize edilmiş bir veri yapısı oluştur.
- Kabaca ifade etmek gerekirse tanım belirten metinsel veriler Dim tabloları olarak, gruplanıp hesaplanacak sayısal veriler ise Fact tabloları olarak tanımlanır.
- Start, Snowflake ve Galaxy gibi farklı boyut modelleme teknikleri vardır.
- Power BI, Qlik Sense gibi modern BI araçları, dimension modelleme tekniklerini kullanarak veri ambarı tasarımını destekler.
- Hatta araçların tüm becerisini kullanabilmek için dimension modelleme tekniklerini bilmek önemlidir.
- Esnek, geliştirilebilir ve performanslı analitik alt yapılar oluşturmak için optimize edilmiş tasarım çözümleri sunar.
- Inmon Metodolojisi
- Top-Down yaklaşımını benimser. Yani kurumun tüm kaynaklarından elde edilen verilerinden müteşekkil genel veri deposu (Enterprise Data Warehouse) 3NF (Üçüncü Normal Form) olarak tasarlanır.
- Ardından, bu modelden farklı iş alanlarına yönelik dimension model tekniklerine uygun data martlar oluşturulur.
- Kurumsal büyüklük ve veri kalitesi açısından en iyi uygulama olarak kabul edilir.
- İlk raporlama ve veri analizi için daha uzun sürede hazır hale gelir.
- Genel mimari:
Enterprise Data Warehouse (3NF) -> Data Mart (DM) -> Reporting/Analytics
- Kimball Metodolojisi
- Bottom-Up yaklaşımını benimser. Yani, iş alanlarına yönelik data martlar ortaya çıkarılmaya çalışılır ve bu data martlar daha sonra birleştirilerek genel bir veri ambarı oluşturulur.
- Kimball için veri ambarı zaten data martların bir araya gelmesiyle oluşur.
- Veri ambarı ve data martlar Dimensional Model tekniği ile tasarlanır.
- Kimball dimensional model tasarımını temel aldığı için Dimension modelleme tekniği olarak da bilinir. Fakat tam olarak aynı şey değildir. Kimball metodlojisinin bu noktadaki katkısının BUS Architecture, Conformed Dimensions, Slowly Changing Dimensions (SCD) gibi kavramlar olduğunu söyleyebiliriz.
- İlk raporlama ve veri analizi için daha hızlı bir şekilde hazır hale gelir.
- Genel mimari:
[Data Mart (DM) -> Enterprise Data Warehouse (EDW)] -> Reporting/Analytics
Çevik Veri Ambarı Tasarım Yaklaşımları
- Data Vault Metodolojisi
- Hybrid bir yaklaşım olarak kabul edilir. Yani hem tüm kurumsal veriyi hem de iş alanlarına yönelik veriyi modellemeye olanak tanır.
- Hub, Link ve Satellite olarak isimlendirilen tablo yapıları ile 6NF (Altıncı Normal Form) benzeri bir yaklaşımla veriyi modelleyerek esnek ve genişletilebilir bir veri deposu (veri ambarı) tasarlanır.
- 6NF kabaca neredeyse her kolon için ayrı bir tablo oluşturmak anlamına gelir.
- Ardından bu modelden farklı iş alanlarına yönelik dimension model tekniklerine uygun data martlar oluşturulur.
- Kaynak sistemlerdeki yapısal değişiklere karşı daha iyi uyum sağlar.
- Genel Mimari:
Enterprise Data Warehouse (6NF) -> Data Mart (DM) -> Reporting/Analytics
- Anchor Modelling Metodolojisi
- Hybrid bir yaklaşım olarak kabul edilir. Yani hem tüm kurumsal veriyi hem de iş alanlarına yönelik veriyi modellemeye olanak tanır.
- Anchor, attribute, knot, tie olarak isimlendirilen tablo yapıları ile 6NF (Altıncı Normal Form) benzeri bir yaklaşımla veriyi modelleyerek esnek ve genişletilebilir bir veri deposu (veri ambarı) tasarlanır.
- 6NF kabaca neredeyse her kolon için ayrı bir tablo oluşturmak anlamına gelir.
- Ardından bu modelden farklı iş alanlarına yönelik dimension model tekniklerine uygun data martlar oluşturulur.
- Kaynak sistemlerdeki yapısal değişiklere uyum sağladığı gibi zamansal değişimini takip etme imkanı da sunar. Kendine has tasarım araçları ile yapısal değişiklikleri daha kolay yönetir.
- Genel Mimari:
Enterprise Data Warehouse (6NF) -> Data Mart (DM) -> Reporting/Analytics
Sonuç
Veri ambarı tasarımında kullanılacak yöntemi belirlemek; kurumsal hedefler, mevcut veri yapısı, teknik yetkinlikler ve raporlama ihtiyaçları gibi birçok faktöre bağlıdır. Inmon ve Kimball gibi geleneksel yaklaşımlar, belirli olgunluk seviyesindeki organizasyonlar için güçlü temeller sunarken; Data Vault ve Anchor Modelling gibi modern metodolojiler, değişken ve karmaşık veri ortamlarında çeviklik ve ölçeklenebilirlik avantajı sağlar.
Doğru yöntemi seçmek, yalnızca bugünkü ihtiyaçları değil, gelecekteki genişleme ve dönüşüm gereksinimlerini de karşılayabilecek esnek bir veri altyapısı kurmanın anahtarıdır. Bu yazının, veri ambarı mimarisi üzerine stratejik kararlar alırken size yol gösterici bir bakış açısı kazandırmasını umuyoruz.