Genômica Comparativa

Escrito por Pedro Vidigal
  •  
  •  
  •  
  •  
  •   
  •  
  •  
  •  

A genômica comparativa é a área das ciências biológicas em que as sequências dos genomas de diferentes espécies são comparadas [1]. Os genomas são conhecidos por sofrerem vários tipos de eventos de rearranjos e de recombinação ao longo do processo evolutivo. Esses eventos podem resultar na duplicação de genes, formando famílias multigênicas, ou na perda de genes de genes ortólogos. Assim, essas comparações nos possibilitam compreender a dinâmica da organização das estruturas dos genomas e fornecem as evidências para os estudos evolutivos, ao identificar os genes que são conservados e exclusivos entre os organismos [1, 2].

A crescente disponibilidade de sequências de genomas nos bancos de dados públicos impõe novos desafios para a análise comparativa dessas sequências [2]. O alinhamento múltiplo de genomas ainda é um desafio computacional muito difícil de se resolver dentro da bioinformática, pois suas sequências possuem são grandes (contendo múltiplos caracteres para serem alinhados) e podem apresentar elevado conteúdo repetitivo [2]. Considerando que o alinhamento de genomas é o ponto de partida dos estudos de genômica comparativa, diferentes estratégias podem ser usadas para vencer esse desafio computacional.

Nos últimos anos, o índice de identidade média de nucleotídeos (average nucleotide identity, ANI) emergiu como um método robusto para estimar a distância genética entre dois genomas e determinar os limites da classificação taxonômica de espécies, sendo considerados pertencentes à mesma espécie os organismos que apresentam sequências de genomas com valores de ANI ≥95% na comparação entre pares de sequências [3]. Para alinhar os pares de sequências de genomas e calcular os valores de ANI, os softwares utilizam a estratégia de quebrar as sequências dos genomas em múltiplos fragmentos, alinhar os fragmentos usando diferentes algoritmos e então calcular a média dos valores das porcentagens de identidades nos alinhamentos obtidos. Entre os principais softwares atualmente disponíveis, o Pyani (https://github.com/widdowquinn/pyani) possibilita calcular valores de ANI usando os algoritmos do BLAST (ANIb) e do MUMmer (ANIm).

A interpretação direta dos alinhamentos de genomas para identificar regiões envolvidas em eventos de rearranjos genômicos e recombinação não é uma tarefa viável devido à complexidade dos dados [4]. Dentre as estratégias disponíveis, o algoritmo progressiveMauve [4] permite o alinhamento rápido de múltiplos genomas e trabalha com a identificação de blocos localmente colineares (locally colinear blocks, LCB). Os LCB representam regiões entre pares de genomas que são conservadas e livres de rearranjos e recombinação. E, para facilitar o processo de interpretação dos dados, o software Mauve (http://darlinglab.org/mauve/mauve.html) [3, 4] contém uma interface gráfica que permite identificar o padrão de distribuição dos LCBs entre os múltiplos genomas analisados.

Outro aspecto importante da genômica comparativa e do alinhamento de genomas é a identificação de regiões de sintenia, que são regiões onde se observa a preservação da organização e do ordenamento de um conjunto de genes ortólogos compartilhados entre dois genomas. Recentemente, o software clinker (https://github.com/gamcil/clinker) foi publicado como uma ferramenta para auxiliar a representação de clusters de genes e a análise da sintenia entre segmentos de genomas [5].

Referências:

[1] Touchman, J. (2010) Comparative Genomics. Nature Education Knowledge 3(10):13.

[2] Darling AC, Mau B, Blattner FR, Perna NT. Mauve: multiple alignment of conserved genomic sequence with rearrangements. Genome Res. 2004 Jul;14(7):1394-403. doi: 10.1101/gr.2289704. PMID: 15231754; PMCID: PMC442156.

[3] Jain C, Rodriguez-R LM, Phillippy AM, Konstantinidis KT, Aluru S. High throughput ANI analysis of 90K prokaryotic genomes reveals clear species boundaries. Nat Commun. 2018 Nov 30;9(1):5114. doi: 10.1038/s41467-018-07641-9. PMID: 30504855; PMCID: PMC6269478.

[4] Darling AE, Mau B, Perna NT. progressiveMauve: multiple genome alignment with gene gain, loss and rearrangement. PLoS One. 2010 Jun 25;5(6):e11147. doi: 10.1371/journal.pone.0011147. PMID: 20593022; PMCID: PMC2892488.

[5] Gilchrist CLM, Chooi YH. Clinker & clustermap.js: Automatic generation of gene cluster comparison figures. Bioinformatics. 2021 Jan 18:btab007. doi: 10.1093/bioinformatics/btab007. Epub ahead of print. PMID: 33459763.


  •  
  •  
  •  
  •  
  •   
  •  
  •  
  •  
Sem categoria

Atualizado em: 30 de março de 2021

Artigos Relacionados