Extend Nedir?
Tekrardan selamlar arkadaşlar. Bir önceki yazımda “Page nedir” sorusunu sormuştuk. Yine aynı şekilde ilerlemeyi düşünüyorum. Maddenin en küçük yapı taşı nasıl atomsa Sql Server’ında page demiştik. Şimdi bir adım yukarı çıkıyoruz. Maddeler nasıl moleküllerden oluşuyorsa (bir veya daha fazla atomun birleşmesi diyebiliriz.) Sql server ‘da içerisindeki işlemleri, verinin yönetimini 8 page’in birleşerek oluşturduğu extendler aracılığı ile yürütür.
Veriyi diskten page page çekerek ram’e aktarmaz. Extendler halinde çekerek ram’e aktarır. Her bir extend 8 Page’den oluşur ve boyutu 64KB olur. (8KB x 8)
Extendler 2 çeşittir.
Uniform Extend
Birleştirilen ve extend olarak tanımlanan pagelerin hepsi tek bir objeye (table , index vs aklınıza ne geliyorsa) aitse bu extend’e uniform extend denir.
Mixed Extend
Birleştirilen ve extend olarak tanımlanan pagelerin hepsi tek bir objeye ait değilse bu extende de mixed extend denir. Mixed extend en fazla 8 pageden oluştuğu için en fazla 8 objeye ait olabilir.
Yeni bir tablo oluşturduğunuzda genellikle mixed extend olarak oluşturulur. Ne zaman içerisindeki data miktarı 64KB geçerse o zaman Uniform extend olarak tekrar yapılandırılır.
SQL SERVER, 2016 sürümünden bu yana genellikle uniform extendler kullanma eğilimindedir. Eğer sisteminiz 2014 versiyonu ise ve uniform extendler kullanmasını istiyorsanız 1118 Trace Flagını kullanabilirsiniz. Ben tüm sql instancelarında bu trace flagı kullanmayı öneririm.
Extend ve Page yapısını bir miktar anladığımızı düşünüyorum. Çok basitçe özetleyecek olursak: Page bir kitabın sayfası gibiydi ve 8kb boyutundaydı. Extend kitapların içerisindeki her 8 sayfalık bölümlerdi.
Ancak kitaba bir şeyler yazılmaya devam ediyor. Henüz bitmiş bir kitap değil. Üstelik bu yazılma işlemi tek düze şekilde yapılmıyor. Bir yazar ilk bölümün (extend) 2. Sayfasına bir şeyler yazılırken bir başka yazar 15. Bölümün 6. Sayfasına bir şeyler yazmaya çalışıyor. ( Hatta birileri de bir yandan okumaya çalışıyor 🙂 )
Peki bir şeyler yazmak istersek hangi bölümde ve hangi sayfada boşluklar olduğunu nerden bileceğiz?
GAM – SGAM – PFS
Bu noktada ise karşımıza GAM (Global Allocation Map), SGAM (Shared Global Allocation Map) ve PFS çıkıyor.
GAM ve SGAM aslında birer page’dir. Bu pagelerde hangi extendlerin dolu yada boş olduğu bilgisi bulunur. Her bir extend hem GAM, hemde SGAM içerisinde bir bit ile temsil edilirler.
- Extend eğer uniform ise ve içerisinde boş yer var ise GAM page’inde 1 SGAM pageinde 0 ile temsil edilir.
- Extend eğer mixed ise ve içerisinde boş yer varsa GAM page’inde 0 ile SGAM page’inde 1 ile temsil edilir.
- Eğer Extend dolu ise ister mixed ister uniform olsun GAM ve SGAMda 0 ile temsil edilir.
Bu mekanizma bir insert esnasında veriyi nereye yazacağına karar vermek için kullanılan bir mekanizmadır.
Bir page 8KB demiştik. 8 KB ise 64.000 bit yapar. Yani bir GAM içerisinde 64bin extend işaretlenebilir. Buda yaklaşık 64.000 x 8KB = 4GB dataya işaret edebilir demek oluyor.
Her veri tabanı dosyasının kendi GAM ve SGAM sayfaları zinciri vardır. İlk GAM sayfası her zaman veri dosyasındaki üçüncü sayfadır (page id 2). İlk SGAM sayfası her zaman veri dosyasındaki dördüncü sayfadır (page id 3). Eğer data boyutu 4GB geçerse bir gam ve sgam page daha oluşturulur. Sonraki GAM ve SGAM sayfaları, veri dosyalarında her 511.230 sayfada bir görünür ve bu, gerektiğinde SQL Server’ın bunlar arasında hızlı bir şekilde gezinmesine olanak tanır.
Sayfa boş alanı ( Page Free Space – PFS ) adı verilen başka bir allocation map sayfası daha vardır.
PFS, sayfaların içindeki boş alan miktarını tutan bir sayfadır ve SQL Server’da veri sayfalarının yönetimini optimize etmeye yardımcı olur. Her bir page için 1 baytlık bir işaretleme yapar. Bu 1 bayt içerisinde sayfanın ne kadarının boş olduğu bilgisi, allocate edilip edilmediği, kullanılıp kullanılmadığı, içerisinde silinen data olup olmadığı bilgilerini tutar. Bu yapı, verinin verimli bir şekilde kullanılmasını ve veri depolama performansının artırılmasını sağlar.
Şimdiye kadar sizlere storage engine içerisinde kullanılan mekanizmanın parçalarını anlattım. Muhtemelen bir sonraki yazım Storage Engine ‘in nasıl çalıştığı ve bu mekanizmaları nasıl kullandığı hakkında olacaktır. Bir verinin veri tabanına yazılma serüvenini baştan sonra hikayeleştirmeyi düşünüyorum.
Hocam ilk gam sayfası her zaman veri dosyasındaki 3. Sayfasıdır (page ID 2 ) yazmışsınız bunun ne anlama geldiğini aynı şekilde SGAM içinde anlatabilir misin
Hocam MDF içerisinde SQL SERVER’ın çalışmasını sağlayan ve yerleri sabit olan pageler vardır. Örneğin HEADER page her mdf’in ilk pageidir. Ardından PFS gelir ve onun ardından GAM ve SGAM pageleri. Bunların yerleri sabittir. data miktarı 4gb geçtiğinde tekrar gam ve sgam pageler oluşturulur. Gam ve Sgam pagelerde her extend için 1 ve 0 değerleri tutulur. Extendde boş yer varsa 1 yoksa 0 şeklinde ifade edilir. Bu pageler allocation map pageleridir. Datanın efektif bir şekilde depolanmasını sağlar.