Saúde

Criando Shorestop, Salik Institute, uma revolução em pesquisa genética

As proteínas mantêm a vida como sabemos, pois servem a muitos papéis estruturais e funcionais importantes em todo o corpo. Mas essas moléculas grandes lançaram uma sombra longa em uma categoria sub -sub -sub -sub -sub -proteínas chamada micro proteínas.

As micro proteínas foram perdidas em 99 % do DNA que foram ignoradas como “não criptografadas”-em extensões amplas de código genético sem importância. Mas, embora seja pequeno e vazio, seu efeito pode ser maior que a maior proteína.

Os cientistas do Instituto Salik estão agora explorando o misterioso lado sombrio do genoma em busca de micro proteínas. Por meio de seus novos medicamentos, os pesquisadores podem investigar bancos de dados genéticos e identificar extensões de DNA no genoma, que provavelmente será um símbolo de micro proteínas.

Mais importante, o shorestop também prevê micro proteínas que provavelmente estão relacionadas biológicas e economizam tempo e dinheiro na busca por micro proteínas envolvidas na saúde e na doença.

O Shorestop acende uma nova luz sobre as coleções de dados atuais, destacando as micro proteínas que era impossível encontrar anteriormente. De fato, a equipe Salk já usou a ferramenta para analisar o conjunto de dados de câncer de pulmão para encontrar 210 candidatos completamente novos para micro proteína–uma proteína precisa que foi validada de maio alcançar boas metas de tratamento no futuro.

Os resultados foram publicados em Métodos BMC Em 31 de julho de 2025.

A maioria das proteínas em nossos corpos é bem conhecida, mas descobertas recentes indicam que não temos milhares de pequenas micro proteínas chamadas proteínas cheias de proteínas que são codificadas pelas áreas que são ignoradas em nosso genoma. Durante muito tempo, os cientistas estudaram apenas as áreas de DNA que foram codificadas para proteínas grandes e rejeitaram o restante como “DNA indesejado”, mas agora aprendemos que essas outras áreas são muito importantes e que as micro proteínas que eles produzem podem desempenhar papéis críticos na regulação da saúde e da doença. “


Alan Sagatillian, autor e grande professor no estudo, Salik Institute

Mais sobre micro proteínas

É difícil descobrir micro proteínas e seu livro, principalmente por causa de seu tamanho. Comparados às proteínas padrão que podem variar de centenas a milhares de aminoácidos, as proteínas microscópicas geralmente contêm menos de 150 aminoácidos, tornando -os mais difíceis de descobrir métodos padrão de análise de proteínas. Portanto, em vez de procurar as mesmas micro proteínas, os cientistas estão procurando grandes grupos de dados disponíveis para o público para a sequência de DNA que você faz.

Os cientistas agora aprenderam que algumas extensões de DNA são chamadas de pequenos pneus de leitura aberta (SMORFS) pode conter instruções para fazer micro proteína. Os métodos experimentais atuais indexaram milhares de SMORFs, mas essas ferramentas ainda demoram um tempo longo e caro. Além disso, sua incapacidade de separar potenciais proteínas funcionais de micro proteínas não funcionais pode parar de descobri -las e descrevê -las.

Como funciona o shortstop

Nem todos os SMORFs são traduzidos em proteínas microscópicas significado biológico. Os métodos atuais de SMORFs funcionais e não funcionais não podem distinguir que gera proteína exata. Isso significa que os cientistas devem testar cada pequena proteína de forma independente para determinar se.

O shortstop altera radicalmente esse fluxo de trabalho, o que melhora a descoberta do SMORF, classificando micro proteínas em categorias funcionais e não funcionais. A chave de classificação que consiste em duas categorias de shorts é como é treinada como um sistema de aprendizado automático. Seu treinamento é baseado no conjunto de dados de controle negativo no SMORFS RAM criado pelo computador. O shortstop smorfs comparável a essas armadilhas para determinar se é provável que seja um novo SMORF funcional ou não -funcional.

O shortstop não pode dizer categoricamente se o SMORF simbolizará a proteína exata biologicamente relevante, mas esse sistema que consiste em duas categorias restringe significativamente a reunião experimental. Agora, os pesquisadores podem ter menos tempo para classificar os conjuntos de dados e falha no banco.

Quando os pesquisadores aplicam o shorttop na coleta de dados SMORF pré -publicada, eles estabelecem 8 % de micro proteínas funcionais potenciais, dando prioridade ao acompanhamento direcionado. Isso acelera a descrição da proteína exata, é improvável que as seqüências tenham importância biológica. O shortstop também pode determinar as micro proteínas que foram ignoradas de outras maneiras, incluindo aquelas que foram validadas descobrindo -as em células e tecidos humanos.

“O que torna o shortstop em particular é que ele trabalha com tipos de dados comuns, como coleções de sequência de dados de RNA, que muitos laboratórios já usam”, diz o primeiro autor Brendan Miller, pesquisador pós -PHD do Laboratório Sagabayliano. “Isso significa que agora podemos procurar microbios por meio de tecidos saudáveis e patológicos em larga escala, o que revelará novas visões na biologia humana e cancelará novos caminhos para diagnosticar e tratar doenças, como câncer e doença de Alzheimer”.

Pontos curtos de micro proteínas associadas ao câncer de pulmão

Os pesquisadores já usaram o shorttop para selecionar uma pequena proteína organizada em tumores de câncer de pulmão. Eles analisaram dados genéticos de tumores pulmonares humanos e tecidos naturais adjacentes à criação de uma possível lista de SMORFs. Entre os smorfs existentes, um foi expresso no tecido tumoral mais do que os tecidos normais, indicando que pode servir como um Sinais vitais Ou proteína funcional de carreira para câncer de pulmão

A determinação da proteína exata associada ao câncer de pulmão mostra o valor de aprendizado curto e automático para determinar as prioridades dos candidatos a futuras pesquisas e desenvolvimento terapêutico.

“Existem muitos dados que já existem para que agora possamos processá -los com shorts para encontrar os novos micro -proteínas associados à saúde e à doença e se estender da doença de Alzheimer à obesidade e além”, diz Sadhalanian. “Minha equipe é realmente boa em fabricar métodos e, com dados de outros membros do corpo docente, podemos integrar esses métodos e acelerar a bandeira”.

fonte:

Referências de revista:

Miller, B, E outros. (2025). SHETStop: quadro de aprendizado automatizado para detectar proteínas precisas. Métodos BMC. Doi.org/10.1186/s44330-025-00037-4

Source link

Artigos Relacionados

Botão Voltar ao Topo