As proteínas produzidas pelas células são transportadas para diferentes compartimentos subcelulares para desempenharem suas funções biológicas. Algumas dessas proteínas são secretadas para fora das células e desempenham funções importantes nas interações entre células vizinhas dentro de um mesmo organismo ou entre células de organismos de espécies diferentes que estejam em contato próximo [1]. O conjunto dessas proteínas secretadas é denominado “secretoma” e pode representar até 30% do proteoma de um organismo, que é a proporção observada no proteoma humano [2].
O secretoma inclui classes de proteínas e moléculas funcionalmente diversas como enzimas extracelulares, moléculas sinalizadoras, proteínas estruturais e peptídeos [1, 3]. O estudo dos secretomas é fundamental para compreendermos as interações patógeno-hospedeiro, onde vários fatores de virulência são secretados pelo patógeno para facilitar o reconhecimento e a colonização de células e tecidos, permitindo modular as respostas do hospedeiro e causar doenças. Essas características tornam as moléculas secretadas alvos promissores para o desenvolvimento de candidatos vacinais e abordagens terapêuticas [3].
Várias ferramentas de bioinformática foram desenvolvidas para a predição de secretomas e os pipelines para executar essas análises podem ser resumidos nas seguintes etapas: identificação de peptídeos sinais, predição da localização subcelular e predição de hélices transmembrana. Aplicando-se esses filtros consecutivos, torna-se possível identificar proteínas candidatas a serem secretadas.
Os peptídeos sinais (SPs) são sequências curtas de aminoácidos na região amino terminal de algumas proteínas sintetizadas e são responsáveis pelo transporte dessas proteínas para o retículo endoplasmático para entrarem nas vias secreção [4, 5]. Após a translocação dessas proteínas através da membrana, uma enzima peptidase de sinal removerá esses peptídeos das proteínas secretadas [4]. Um dos principais softwares usados para a predição de peptídeos sinais em sequências de proteínas é o SignalP (http://www.cbs.dtu.dk/services/SignalP) [4].
Além dos peptídeos sinais, os peptídeos de trânsito mitocondrial (mTPs) são responsáveis por direcionar as proteínas para a matriz mitocondrial e os peptídeos de trânsito de cloroplasto (cTPs) estão envolvidos no transporte de proteínas para o estroma do cloroplasto [5]. Na predição do secretoma, proteínas contendo mTPs e cTPs devem ser removidas do conjunto de dados. Essas proteínas podem ser identificadas usando o software TargetP (http://www.cbs.dtu.dk/services/TargetP) [5].
A última etapa do processo consiste em identificar as proteínas que apresentam hélices transmembrana em suas estruturas. As proteínas que possuem peptídeo sinal e apresentam hélices transmembrana permanecerão ancoradas na membrana celular e não serão secretadas, sendo necessário removê-las do conjunto de dados. Essas estruturas podem ser preditas nas sequências das proteínas usando o software TMHMM (http://www.cbs.dtu.dk/services/TMHMM) [6].
Referências:
[1] Gogleva A, Drost HG, Schornack S. SecretSanta: flexible pipelines for functional secretome prediction. Bioinformatics. 2018 Jul 1;34(13):2295-2296. doi: 10.1093/bioinformatics/bty088. PMID: 29462238; PMCID: PMC6022548.
[2] Skach WR. The expanding role of the ER translocon in membrane protein folding. J Cell Biol. 2007 Dec 31;179(7):1333-5. doi: 10.1083/jcb.200711107. PMID: 18166647; PMCID: PMC2373491.
[3] Ranganathan S, Garg G. Secretome: clues into pathogen infection and clinical applications. Genome Med. 2009 Nov 30;1(11):113. doi: 10.1186/gm113. PMID: 19951402; PMCID: PMC2808748.
[4] Almagro Armenteros JJ, Tsirigos KD, Sønderby CK, Petersen TN, Winther O, Brunak S, von Heijne G, Nielsen H. SignalP 5.0 improves signal peptide predictions using deep neural networks. Nat Biotechnol. 2019 Apr;37(4):420-423. doi: 10.1038/s41587-019-0036-z. Epub 2019 Feb 18. PMID: 30778233.
[5] Almagro Armenteros JJ, Salvatore M, Emanuelsson O, Winther O, von Heijne G, Elofsson A, Nielsen H. Detecting sequence signals in targeting peptides using deep learning. Life Sci Alliance. 2019 Sep 30;2(5):e201900429. doi: 10.26508/lsa.201900429. PMID: 31570514; PMCID: PMC6769257.
[6] Krogh A, Larsson B, von Heijne G, Sonnhammer EL. Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes. J Mol Biol. 2001 Jan 19;305(3):567-80. doi: 10.1006/jmbi.2000.4315. PMID: 11152613.