Saúde

Os cientistas abrem um novo atlas para diversidade genética com sequência avançada

Um estudo histórico de uma sequência de leitura longa é usada para detectar as amplas diferenças estruturais que não foram descobertas anteriormente no DNA humano, que remodela nossa compreensão da genética e as capacidades da doença.

Ingressos: Contraste estrutural em 1019 pessoas diversas com base em uma longa sequência de leitura

Em um estudo recente publicado na revista naturezaOs pesquisadores investigaram as variáveis estruturais em larga escala (SVS), inserção, exclusão e rearranjo incompreensíveis e incompreensíveis do DNA, usando a sequência de “leitura longa” da próxima geração. Sua coleta de dados líder consiste em 1.019 indivíduos em 26 grupos internacionais. O estudo se beneficiou de uma estrutura analítica baseada no novo gráfico, permitindo a criação de mais de 107.000 sequências SVS, que os autores obtiveram acesso aberto.

A investigação genética de alta precisão não aprimora muito nossa compreensão da verdadeira diversidade da genética humana, mas também desenvolve a identificação de nossa identidade e o gerenciamento futuro de variáveis genéticas patogênicas nos pacientes.

fundo

Os livros didáticos do genoma humano são frequentemente retratados como uma série escrita de três bilhões de grupos de A, T, G e C – nosso DNA, para nossos blocos de vida. No entanto, a realidade é mais dinâmica, pois nosso DNA mostra as variáveis estruturais em larga escala (SVS)-a estrutura, a repetição, a inserção e todo o DNA.

Apesar do cálculo da maioria das diferenças entre a base (PA) entre qualquer organismos vivos e os principais contribuintes para a saúde humana e suas taxas, elas ainda são muito difíceis de estudá -las e entendê -las mal. A sequência de leitura curta, a tecnologia de sequência predominante hoje conecta longas lâminas de DNA a pequenos fragmentos, que são amplificados posteriormente. Embora essas tecnologias sejam eficazes para pequenas variáveis, essas tecnologias estão lutando para definir SVs complexos, especialmente inserções grandes e rotas de variáveis técnicas multi (VNTRs), que às vezes são perpetuadas completamente.

Consequentemente, a grande maioria do genoma humano ainda é invisível para a ciência e a medicina, permitindo que doenças genéticas que provavelmente tenham cura continuem inabaláveis. A sequência de leitura longa é uma tecnologia relativamente nova que pode ser lida mais longa e contínua que o DNA, superando assim os palácios básicos associados ao SV. A harmonia dessa tecnologia pode abrir essa parte oculta do genoma humano e tesouros médicos que se enquadram.

Sobre estudo

Esse trabalho atual funciona apenas: o consórcio de pesquisadores criou um enorme projeto multinacional para desenhar um mapa SVS usando uma variedade global. As amostras de estudo foram obtidas no projeto 1000 genoma (1kgp) e consistem inicialmente em 1064 amostras (linfócitos).

Controle de qualidade redutível (QC) usando uma mistura de identificação da concentração de DNA (microplaca multode) e avaliação de pureza do DNA (escala de espectro óptico) e verificando o comprimento da parte do DNA (FEMTO) no conjunto de dados para 1.019. Esse grupo de dados incluiu participantes de 26 questões distintas em toda a África, americanos, Europa, Oriente e Sul da Ásia.

A, O colapso das questões geográficas autônomas de 1019 genes de leitura longa representam 26 geografia (ou seja, população) de 5 regiões continentais. As três letras utilizadas símbolos são equivalentes às usadas no estágio de 1kgp para III18 e são resolvidas na Tabela Suplementar 2. B, uma cobertura de sequência para cada amostra, expressando -a como uma cobertura dobrável (esquerda) e o comprimento da leitura N50 em pares de bases (direita). C, Planejando o quadro da saga para descobrir o gráfico SVS e o uso gráfico genético da abordagem do gráfico Panjinom. Mapa de base em dados naturais da Terra (https://www.nathalearthdata.com).UMO pênis geográfico auto -definido em colapso para 1019 genes de leitura de 1019 anos representa 26 geografia (isto é, população) de 5 regiões continentais. As três letras usadas símbolos são equivalentes à terceira etapa de 1kgp18 Está resolvido no cronograma suplementar 2. paraA cobertura de sequência em cada amostra, que é expressa como uma cobertura dobrável (à esquerda) e o comprimento do N50 em maridos básicos (à direita). CSaga Framework para descobrir o gráfico SVS e o sistema genético para SVs usando a abordagem do gráfico Panjinom. Mapa base UM De dados naturais da terra (https://www.naturalreavedata.com).

A plataforma de sequência de longo prazo utilizada foi o LRS nas tecnologias de nanoporos de Oxford (ON), que é uma tecnologia avançada capaz de gerar dados ao longo do comprimento médio de leitura de mais de 20.000 pares básicos.

Para analisar essa complexa coleta de dados, eles classificaram um novo quadro aritmético chamado SAGA (análise SV por aumento de gráfico). Esse processo incluiu quatro etapas principais: primeiro, o alinhamento de longas leituras de referências escritas (GRCH38) e gráficos gráficos (HPRC); Segundo, a descoberta de SV usando algoritmo Snifles, Delly e Svarp nas taxas gráficas, incluindo a re -clientenização especializada para resolver um alinhamento arqueológico da reflexão; Terceiro, aumentando o gráfico de pangenoma para a nova inclusão de SVS, apesar das complexidades da genética multiallica do VNTR; Finalmente, os estereótipos genéticos do regimento usando o programa de risadas para identificar as empresas de transporte variáveis (n = 967 amostras), observando que os locais multi -éticos mostraram um aumento na contradição mandaliana (15,1 %).

Resultados do estudo

O presente estudo resultou na produção de um catálogo explicativo e aberto para o público para mais de 100.000 SVs que foram resolvidos (biallleic), juntamente com 369.685 variáveis múltiplas repetidas repetidamente (VNTRs) usando a ferramenta VAMOS. Os SVs específicos incluíram golpes, exclusão, repetição e inserção, cujo total atingiu um aumento de dez vezes no número de locais de inserção que foram completamente resolvidos, preenchendo uma lacuna crítica no conhecimento genético humano.

Os experimentos de consciência mostraram o uso de um trio familiar (religião e uma criança) dentro do regimento de precisão do ensino médio e uma taxa de erro muito baixa (exclusão e inserção em apenas 3,87 % e 4,44 %, respectivamente) para SVS Biallliic. Vale ressaltar que a maioria dos novos SVs especificados neste estudo é muito rara, com 59,3 % tem uma frequência de alelo simples (MAF) menor que 1 %. Os indivíduos africanos mostraram o maior grau de diversidade de SV.

Finalmente, o estudo forneceu novas visões sobre os mecanismos biológicos que criam SVs, mostrando em detalhes os elementos de DNA móvel, como retrotransposons L1 e SVA, e empurrando a inovação genética, aprimorando a composição SV e movendo os processos do local, incluindo o seqüestro de prados (por exemplo, 8q211111111111111111.

Conclusões

Este estudo representa um salto digno em nosso conhecimento e compreensão do genoma humano. A aplicação da sequência de leitura longa é permitida para descobrir e explicar mais SVs (especialmente inserções) e a diversidade do grupo de amostras (26 dos problemas distintos em vários continentes) verificar a generalização e a aplicação global dos resultados do estudo.

Além disso, o atlas SV abrangente e exato, à medida que está aberto, abre as portas para uma nova era da medicina genética, permitindo a identificação de condições genéticas e o tratamento precoce que ainda não conhecemos. Vale a pena notar, quando aplicado à genômica de remoção rara, o fornecedor é filtrado 55 % dos SVs candidatos, mantendo 94 % (35/37) das variáveis de autenticação causal. Essa fonte de acesso aberto será inestimável para a comunidade científica, que permite uma compreensão mais profunda do desenvolvimento humano, genética populacional e as consequências funcionais da mudança genética.

Referência do diário:

  • Schloissnsn, S Saint-Garcia, W., Moreira-Pinhal, R., Hunt, St. Llanos, FJ, Wollenweber, que, … Corbel, Jo (2025). A estrutura varia em 1,019 seres humanos diferentes com base na sequência de longo prazo. natureza. 2-10.1038/S41586-025-09290-7, https://www.nature.com/articles/s41586-025-09290-7

Source link

Artigos Relacionados

Botão Voltar ao Topo