Phyloseq (Explore Microbiome Profiles Using R, česky Prozkoumej profily mikrobiomů pomocí R) slouží jako nástroj k importu, ukládání, analýze a grafickému zobrazení komplexních fylogenetických sekvenačních dat mikrobiomů. Ty musejí být předem zklastrovány do OTUs (Operational Taxonomic Units, česky Operační taxonomické jednotky).

Data mohou být získávána z různých zdrojů, jako jsou mikrobiomy lidí a jiných organismů, mikrobiomy půdy, povrchů, vody a dalších.[1]

Phyloseq (balíček programu R) je otevřený softwarový balíček, který je volně dostupný na GitHub a Bioconductor.

Nástroje PhyloseqEditovat

Program REditovat

Podrobnější informace naleznete v článku R (programovací jazyk).

Používaný program R je programovací jazyk pro statistickou analýzu dat a jejich grafické zobrazení. V řadě oblastí statistiky je faktickým standardem. Funkce prostředí R lze rozšířit pomocí knihoven označovaných jako balíčky (packages). Pro verzi 3.6.2 jich bylo v lednu roku 2020 v centrálním repozitáři CRAN k dispozici 15 325. Příkladem často používaného balíčku je ggplot2 pro zobrazení dat.

OTUsEditovat

OTUs se používají ke kategorizaci bakterií na základě podobnosti sekvencí. Přiřazení k jednotlivým OTUs je provedeno pomocí BLAST analýz.

BlastEditovat

BLAST (Basic Local Alignment Search To, česky Základní vyhledávací nástroj pro místní zarovnání) je algoritmus používaný v bioinformatice za účelem srovnávání primárních sekvenčních informací, například nukleotidů DNA z různých sekvencí nebo sekvencí aminokyselin z různých proteinů. BLAST umožňuje srovnání dotazované (zadávané) sekvence se sekvencemi v databázi a zároveň rozpoznání obdobných sekvencí nad definovanou hranicí podobnosti.

Data PhyloseqEditovat

Amplikonová analýzaEditovat

Data mohou být získávána z různých zdrojů, jako jsou mikrobiomy lidí a jiných organismů, mikrobiomy půdy, povrchů, vody a dalších.

Nástroje balíčku je vhodné využít především v případě zpracování dat získaných pomocí amplikonových analýz mikrobiomových profilů. Vstupní data mohou být například metadata k analyzovaným vzorkům, fylogenetické stromy a přiřazení sekvencí k příslušným OTUs.

Formát a grafikaEditovat

Tento balíček zároveň využívá další nástroje v R (vegan, ade4, ape, picante) a také zavádí pokročilý a flexibilní grafický systém (ggplot2) pro snadnější tvorbu kvalitní grafiky vyžadované pro publikační účely. Phyloseq je spojen se speciálním systémem S4 tříd (S4 classes) pro možnost uložení všech souvisejících fylogenetických sekvenačních dat a tím i pro snadnější sdílení dat a reprodukovatelnost analýz.

Phyloseq podporuje data importovaná v mnoha formátech a zpracovává je pomocí různých analýz jako je kalibrace, filtrování, tvorba subsetů a klastrů, porovnání mezi tabulkami, analýzy diverzity, paralyzovaný Fast UniFrac, ordination metody. Výstupem je grafické zpracování v publikovatelné kvalitě.[2]

Balíček zahrnuje i příklady souborů ve formátu biom s různým stupněm organizace dat. Funkce import biom umožňuje současně importovat soubory s fylogenetickými stromy a referenčními sekvencemi.

Funkce PhyloseqEditovat

  • Vhodné obalovače pro běžné analýzy (convenience analysis wrappers)
  • Funkce grafického zobrazení mikrobiomů s využitím ggplot2 pro efektivní a flexibilní analýzu
  • Modulární a plně přizpůsobitelné přípravné funkce pro plně reprodukovatelnou práci
  • Funkce pro spojování dat v souborech s OTUs s jinými proměnnými vzorků a s podporou pro manuálně importovaná data
  • Native R/C kód, paralelizované provedení UniFrac výpočtu distancí
  • Mnoho testovacích metod specifických pro high-throughput amplikonová sekvenační data
  • Příklady pro jednotlivé analýzy a grafy s již publikovanými daty

ReferenceEditovat

  1. MCMURDIE, Paul J.; HOLMES, Susan. phyloseq: An R Package for Reproducible Interactive Analysis and Graphics of Microbiome Census Data. PLoS ONE. 2013-04-22, roč. 8, čís. 4, s. e61217. Dostupné online [cit. 2021-03-01]. ISSN 1932-6203. DOI 10.1371/journal.pone.0061217. PMID 23630581. (anglicky) 
  2. phyloseq: Explore microbiome profiles using R. joey711.github.io [online]. [cit. 2021-03-01]. Dostupné online.