Verze z 2. 7. 2007, 01:13 editovat Rhadesan (diskuse \| příspěvky) 28 editací Přídání implementace, char.vlastností, historie, vše z EN wiki a z http://www.cecs.csulb.edu/~monge/classes/share/B+TreeIndexes.html ← Přejít na předchozí porovnání		Verze z 13. 7. 2007, 12:56 editovat zrušit editaci Adam Zivner (diskuse \| příspěvky) 7 183 editací upravy Přejít na další porovnání →
Řádek 2: Všimněte si že každý list obsahuje odkaz na následující list (červeně), umožňující velice rychlé procházení celým stromem.]] '''B+ strom''' je [[strom (datová struktura)\|stromová]] [[datová struktura]] vycházející z [[B-strom]]u umožňující rychlé vkládání, vyhledávání i mazání dat. Data jsou zpřístupněna pomocí klíčů, přičemž ~~narozdíl~~na rozdíl od [[B-strom]]u jsou '''všechna data''' uložena až na samém konci stromu, v listech. Klíče jsou však uloženy i ve [[Strom (datová struktura)#Vnitřní uzly\|vnitřních uzlech]] či v [[Strom (datová struktura)#Kořen stromu\|kořenu]]. Ostatní vlastnosti má stejné jako zmiňovaný [[B-strom]]. "B+ strom poprvé popsal [[Rudolf Bayer,]] spolu s [[Edward M. McCreight:\|Edwardem M. McCreightem]] roku [[1972]] v "Organization and Maintenance of Large Ordered Indices. Acta Informatica 1: 173-189 (1972)".▼ == Vlastnosti B+ stromu == ~~Shrňme si klíčové informace '''B+ stromu''':~~ Všechny [[Strom (datová struktura)#Koncové uzly\|listy]] (tj.uzly které nemají žádné potomky) jsou na stejné úrovní (ve stejné [[Strom (datová struktura)#Hloubka, Výška, Šířka, Úroveň a Cesta\|hloubce]]). Data můžou být uložena '''pouze''' v [[Strom (datová struktura)#Koncové uzly\|listech]] Všechny [[Strom (datová struktura)#Uzly ve stromu\|uzly]] kromě kořene mají maximálně ''nN'' a minimálně ''nN/2'' potomků (přesněji:<math>\left \lceil \frac{n}{2} \right \rceil -1 </math>). [[Strom (datová struktura)#Kořen stromu\|Kořen]] má nejvýše ''nN'' potomků, spodní hranice není omezena. === Charakteristické vlastnosti B+ stromu === Mějme B+ strom řádu ''bB'' kde vzdálenost od kořene k listům je ''hH'': * Maximální počet uložených záznamů je <math>nN = bB^hH</math> * Minimální počet klíčů je <math>2(bB/2)^{hH-1}</math> * Místo požadované pro uložení stromu je <math>O(nN)</math> * Vložení záznamu do stromu vyžaduje v nejhorším případě <math>O(\~~log_bn~~log_BN)</math> operací * Vyhledání záznamu v nejhorším případě vyžaduje <math>O(\~~log_bn~~log_BN)</math> operací * Vymazání (dříve nalezeného) záznamu v nejhorším případě vyžaduje <math>O(\~~log_bn~~log_BN)</math> operací * Vyhledání více položek v rámci zadaného rozsahu trvá v nejhorším případe <math>O(\~~log_bn~~log_BN+kK)</math> operací (''kK'' je zde počet položek vyskytujících se v dotazovaném rozsahu) == Skutečná implementace B+ stromu == Skutečný B+ strom se ve skutečnosti realizuje tak, že je vždy ve všech listech uložen kromě vlastních klíčů a hodnot také odkaz (ukazatel) na následujícího sourozence. Díky tomu je umožněna rychlejší práce s bloky souvislých dat a s dotazy ~~pracujícímy~~pracujícími s rozsahy typu ''vrať všechny záznamy kde plat je mezi 10000-2000''. Tento jeden ukazatel navíc v rámci každého listu nijak dramaticky nezvětšuje paměťovou náročnost na uložení stromu, ale dramaticky zvyšuje výkon např. ve zmiňovaných souborových systémech. Tento mechanismus odkazů na následujícího sourozence je zobrazen i na obrázku červenými políčky. == Použití B+ stromu == '''B+ strom''' Jeje dynamická struktura, která je navržena pro práci s většími bloky dat (běžně je využíván pro ukládání dat na disk v blocích). Jeho výhodou je velice rychlé získávání (čtení) souvislého bloku dat (ve srovnání s ostatními druhy stromů). Pokud máme bloky dat definované délky ''bB'', do '''B+ stromu''' se uloží počet klíčů který je roven násobku ''bB'' a čtení celého bloku dat je velice efektivní oproti [[Binární vyhledávací strom\|binárnímu vyhledávacímu stromu]] (což je odpovídající blokově neorientovaná alternativa). Tento systém používají pro indexování dat na disku jak [[Souborový systém\|souborový systém]] [[NTFS]] pod [[Windows]], tak [[Souborový systém\|souborový systém]] [[ReiserFS]] pod [[Unix]]em a [[Linux]]em, [[Souborový systém\|systém]] [[XFS]] pod [[Linux]]em a [[IRIX]]em i [[Souborový systém\|systém]] [[JFS2]] pod [[Linux]]em, [[OS/2]] a pod [[AIX]]. [[Relační databáze]] také často používají tento typ [[Strom (datová struktura)\|stromu]] pro ukládání tabulek s indexy.▼ ~~== Historie ==~~ ~~B+ strom byl poprvé popsán v článku~~ ▲Tento systém používají pro indexování dat na disku [[Souborový systém\|souborové systém]]y [[NTFS]], [[ReiserFS]], [[XFS]] a [[JFS2]]. [[Relační databáze]] také často používají tento typ [[Strom (datová struktura)\|stromu]] pro ukládání tabulek s [[index (databáze)\|indexy]]. ▲"Rudolf Bayer, Edward M. McCreight: Organization and Maintenance of Large Ordered Indices. Acta Informatica 1: 173-189 (1972)". == Podívejte se také ==

B+ strom: Porovnání verzí