Modelos de substituição de nucleotídeos

Escrito por Pedro Vidigal
  •  
  •  
  •  
  •  
  •   
  •  
  •  
  •  

O cálculo das distâncias genéticas entre pares de sequências incluídas em um alinhamento é uma etapa essencial dos estudos filogenéticos, pois essas distâncias fornecem as bases para a inferência da árvore filogenética que relacionará todas as sequências que constituem o conjunto de dados analisado [1].

As substituições nas sequências de nucleotídeos geralmente são modeladas como eventos aleatórios, sendo necessário especificar um modelo de substituição que fornecerá a descrição estatística desse processo [1]. Os modelos de substituição descrevem as taxas de mutações entre as sequências e constituem a base das estimativas das distâncias genéticas. Mesmo tendo sido descritos e extensivamente documentados, os modelos de substituição somente foram aplicados nos estudos evolutivos quando os primeiros softwares de análises filogenéticas baseadas nos métodos de Máxima Verossimilhança se tornaram disponíveis [2]. E a importância desses modelos nos estudos evolutivos somente foi reconhecida após a constatação de que a especificação incorreta de um modelo poderia influenciar os resultados das análises filogenéticas [2].

O primeiro modelo a descrever o processo de substituição do DNA foi proposto por Jukes e Cantor em 1969 (JC69). Esse modelo considera que os nucleotídeos apresentam uma mesma taxa de substituição e ocorrem com uma mesma frequência. Entretanto, as substituições do tipo transição (substituições entre purinas – adenina (A) e guanina (G) – ou pirimidinas – citosina (C) e timina (T)) são mais frequentes que as substituições do tipo transversão (substituições de purinas por pirimidinas, e vice-versa) [2]. Além disso, o código genético possibilita mais transições que transversões sem a substituição de aminoácidos nas sequências das proteínas [2]. Diante dessas evidências, Kimura apresentou em 1980 um modelo (K80) com dois parâmetros que diferem as taxas de transições e transversões.

Em 1981, Felsenstein (F81) reformulou o modelo JC69 para considerar frequências de nucleotídeos diferentes como consequência do processo de seleção natural [2]. Seguindo essa tendência de reformulação, vários outros modelos foram desenvolvidos incorporando extensões aos modelos originais. O modelo mais complexo incorpora diferentes taxas de substituição e diferentes frequências de nucleotídeos [2]. Esse modelo foi denominado como modelo geral reversível no tempo (General Time Reversible, GTR) e foi proposto por Tavaré em 1986. Outras extensões desses modelos são a adição do parâmetro proporção de sítios invariáveis dos nos alinhamentos (+I), proposto por Shoemaker e Fitch em 1989, e do parâmetro da taxa de variação entre os sítios dos alinhamentos (+G), proposto por Yang em 1994 [2].

Diferentes softwares foram desenvolvidos para identificar o melhor modelo de substituição que se adequa às variações observadas nos alinhamentos de sequências de nucleotídeos. Recentemente, o software ModelTest-NG (https://github.com/ddarriba/modeltest) [3] foi disponibilizado com funções que permite avaliar modelos de substituição de nucleotídeos e aminoácidos. Mesmo com toda variedade de possíveis modelos de substituição de nucleotídeos, o modelo de GTR+I+G geralmente se ajusta melhor aos dados e isso reforça a complexidade do processo evolutivo [2].

Referências:

[1] Strimmer, K., Von Haeseler, A., & Salemi, M. (2009). Genetic distances and nucleotide substitution models. In P. Lemey, M. Salemi, & A. Vandamme (Eds.), The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing (pp. 111-141). Cambridge: Cambridge University Press. https://doi.org/10.1017/CBO9780511819049.006.

[2] Arenas M. Trends in substitution models of molecular evolution. Front Genet. 2015; 6:319. https://doi.org/10.3389/fgene.2015.00319.

[3] Darriba D, Posada D, Kozlov AM, Stamatakis A, Morel B, Flouri T. ModelTest-NG: A New and Scalable Tool for the Selection of DNA and Protein Evolutionary Models. Mol Biol Evol. 2020; 37(1):291-294. https://doi.org/10.1093/molbev/msz189.


  •  
  •  
  •  
  •  
  •   
  •  
  •  
  •  

Artigos Relacionados