O Pangenoma é o repertório de genes observado nos genomas de organismos de uma determinada espécie ou grupo taxonômico. Esse conjunto de genes é constituído pelo genoma core e o genoma acessório. O genoma core representa o conjunto de genes compartilhado entre todos os genomas. Esses genes geralmente são responsáveis pelos aspectos básicos da biologia do grupo taxonômico representado pelo pangenoma e estão relacionados às suas características fisiológicas e fenotípicas. O genoma acessório, também definido como genoma dispensável, representa o conjunto de genes compartilhado apenas entre alguns genomas. Esses genes são os elementos de diversidade no grupo representado pelo pangenoma e também estão relacionados às adaptações aos ambientes nos quais os organismos estão inseridos [1].
Atualmente, o conceito de pangenoma varia de acordo com a aplicação e o contexto. Essa alteração na definição foi adotada quando os estudos de pangenomas se estenderam aos genomas de plantas e animais. Microrganismos procariotos tipicamente apresentam genomas pequenos e com alta densidade gênica, apresentando poucas sequências não codificadoras e regulatórias. Organismos eucariotos, por sua vez, apresentam maior proporção de regiões não codificadoras nos genomas, que contém elementos funcionais como promotores e acentuadores transcricionais (enhancers). Duas abordagens de pangenomas foram criadas para lidar com essas diferenças entre genomas procariotos e eucariotos: a abordagem centrada nos genes e a abordagem centrada nas sequências. A abordagem centrada nos genes define o pangenoma como o conjunto de todos os genes (ou grupos de genes ortólogos) encontrado nos genomas dos organismos de um determinado grupo taxonômico, enquanto a abordagem centrada nas sequências define o pangenoma como o conjunto completo e não redundante de sequências, genes e elementos funcionais, encontradas nos genomas [2].
Independentemente da abordagem adotada, um pangenoma pode ser classificado como fechado ou aberto. Quando um pangenoma é fechado, o conjunto de genomas analisado é suficiente para representar quase todos genes/sequências esperados para o grupo taxonômico selecionado e o tamanho teórico do pangenoma pode ser predito. Em contraste, quando um pangenoma é aberto, cada nova sequência adicionada ao conjunto de genomas analisado aumentará o repertório de genes/sequências esperado e não é possível predizer o tamanho do pangenoma [2].
A análise de pangenomas e a classificação dos mesmos como abertos ou fechados pode ser feita usando softwares como o Roary [https://sanger-pathogens.github.io/Roary/] e o Pan-Genome Analysis Pipeline (PGAP) [http://pgaweb.vlcc.cn/].
Referências:
[1] Medini D, Donati C, Tettelin H, Masignani V, Rappuoli R. The microbial pan-genome. Curr Opin Genet Dev. 2005 Dec;15(6):589-94. https://doi.org/10.1016/j.gde.2005.09.006[2] Golicz AA, Bayer PE, Bhalla PL, Batley J, Edwards D. Pangenomics Comes of Age: From Bacteria to Plant and Animal Applications. Trends Genet. 2020 Feb;36(2):132-145. https://doi.org/10.1016/j.tig.2019.11.006