B+ strom: Porovnání verzí

Smazaný obsah Přidaný obsah
Přídání implementace, char.vlastností, historie, vše z EN wiki a z http://www.cecs.csulb.edu/~monge/classes/share/B+TreeIndexes.html
Adam Zivner (diskuse | příspěvky)
upravy
Řádek 2:
Všimněte si že každý list obsahuje odkaz na následující list (červeně), umožňující velice rychlé procházení celým stromem.]]
 
'''B+ strom''' je [[strom (datová struktura)|stromová]] [[datová struktura]] vycházející z [[B-strom]]u umožňující rychlé vkládání, vyhledávání i mazání dat. Data jsou zpřístupněna pomocí klíčů, přičemž narozdílna rozdíl od [[B-strom]]u jsou '''všechna data''' uložena až na samém konci stromu, v listech. Klíče jsou však uloženy i ve [[Strom (datová struktura)#Vnitřní uzly|vnitřních uzlech]] či v [[Strom (datová struktura)#Kořen stromu|kořenu]]. Ostatní vlastnosti má stejné jako zmiňovaný [[B-strom]].
 
"B+ strom poprvé popsal [[Rudolf Bayer,]] spolu s [[Edward M. McCreight:|Edwardem M. McCreightem]] roku [[1972]] v "Organization and Maintenance of Large Ordered Indices. Acta Informatica 1: 173-189 (1972)".
 
== Vlastnosti B+ stromu ==
Shrňme si klíčové informace '''B+ stromu''':
 
*Všechny [[Strom (datová struktura)#Koncové uzly|listy]] (tj.uzly které nemají žádné potomky) jsou na stejné úrovní (ve stejné [[Strom (datová struktura)#Hloubka, Výška, Šířka, Úroveň a Cesta|hloubce]]).
*Data můžou být uložena '''pouze''' v [[Strom (datová struktura)#Koncové uzly|listech]]
*Všechny [[Strom (datová struktura)#Uzly ve stromu|uzly]] kromě kořene mají maximálně ''nN'' a minimálně ''nN/2'' potomků (přesněji:<math>\left \lceil \frac{n}{2} \right \rceil -1 </math>).
*[[Strom (datová struktura)#Kořen stromu|Kořen]] má nejvýše ''nN'' potomků, spodní hranice není omezena.
 
=== Charakteristické vlastnosti B+ stromu ===
Mějme B+ strom řádu ''bB'' kde vzdálenost od kořene k listům je ''hH'':
 
* Maximální počet uložených záznamů je <math>nN = bB^hH</math>
* Minimální počet klíčů je <math>2(bB/2)^{hH-1}</math>
* Místo požadované pro uložení stromu je <math>O(nN)</math>
* Vložení záznamu do stromu vyžaduje v nejhorším případě <math>O(\log_bnlog_BN)</math> operací
* Vyhledání záznamu v nejhorším případě vyžaduje <math>O(\log_bnlog_BN)</math> operací
* Vymazání (dříve nalezeného) záznamu v nejhorším případě vyžaduje <math>O(\log_bnlog_BN)</math> operací
* Vyhledání více položek v rámci zadaného rozsahu trvá v nejhorším případe <math>O(\log_bnlog_BN+kK)</math> operací (''kK'' je zde počet položek vyskytujících se v dotazovaném rozsahu)
 
== Skutečná implementace B+ stromu ==
Skutečný B+ strom se ve skutečnosti realizuje tak, že je vždy ve všech listech uložen kromě vlastních klíčů a hodnot také odkaz (ukazatel) na následujícího sourozence. Díky tomu je umožněna rychlejší práce s bloky souvislých dat a s dotazy pracujícímypracujícími s rozsahy typu ''vrať všechny záznamy kde plat je mezi 10000-2000''. Tento jeden ukazatel navíc v rámci každého listu nijak dramaticky nezvětšuje paměťovou náročnost na uložení stromu, ale dramaticky zvyšuje výkon např. ve zmiňovaných souborových systémech.
Tento mechanismus odkazů na následujícího sourozence je zobrazen i na obrázku červenými políčky.
 
== Použití B+ stromu ==
'''B+ strom''' Jeje dynamická struktura, která je navržena pro práci s většími bloky dat (běžně je využíván pro ukládání dat na disk v blocích). Jeho výhodou je velice rychlé získávání (čtení) souvislého bloku dat (ve srovnání s ostatními druhy stromů). Pokud máme bloky dat definované délky ''bB'', do '''B+ stromu''' se uloží počet klíčů který je roven násobku ''bB'' a čtení celého bloku dat je velice efektivní oproti [[Binární vyhledávací strom|binárnímu vyhledávacímu stromu]] (což je odpovídající blokově neorientovaná alternativa).
 
Tento systém používají pro indexování dat na disku jak [[Souborový systém|souborový systém]] [[NTFS]] pod [[Windows]], tak [[Souborový systém|souborový systém]] [[ReiserFS]] pod [[Unix]]em a [[Linux]]em, [[Souborový systém|systém]] [[XFS]] pod [[Linux]]em a [[IRIX]]em i [[Souborový systém|systém]] [[JFS2]] pod [[Linux]]em, [[OS/2]] a pod [[AIX]].
[[Relační databáze]] také často používají tento typ [[Strom (datová struktura)|stromu]] pro ukládání tabulek s indexy.
 
== Historie ==
B+ strom byl poprvé popsán v článku
 
Tento systém používají pro indexování dat na disku [[Souborový systém|souborové systém]]y [[NTFS]], [[ReiserFS]], [[XFS]] a [[JFS2]]. [[Relační databáze]] také často používají tento typ [[Strom (datová struktura)|stromu]] pro ukládání tabulek s [[index (databáze)|indexy]].
"Rudolf Bayer, Edward M. McCreight: Organization and Maintenance of Large Ordered Indices. Acta Informatica 1: 173-189 (1972)".
 
== Podívejte se také ==