Em formação

Existe alguma evidência de que genes associados a estruturas fisicamente adjacentes estão localizados próximos uns dos outros dentro do genoma?

Existe alguma evidência de que genes associados a estruturas fisicamente adjacentes estão localizados próximos uns dos outros dentro do genoma?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Não tenho certeza se existem genes individuais para, digamos, dedos e, em caso afirmativo, esses genes estariam próximos dos genes que afetam o crescimento da mão? Se não "próximo" no sentido euclidiano, poderia haver uma métrica diferente em que os genes para estruturas associadas pudessem ser considerados próximos?


Existe alguma evidência de que genes associados a estruturas fisicamente adjacentes estão localizados próximos uns dos outros no genoma? - Biologia

Os genomas de mamíferos codificam informações genéticas em sua sequência linear, mas a expressão apropriada de seus genes requer que os cromossomos se dobrem em estruturas tridimensionais complexas. O controle transcricional envolve o estabelecimento de conexões físicas entre genes e elementos reguladores, tanto ao longo como entre os cromossomos. As recentes inovações tecnológicas na sondagem do dobramento dos cromossomos estão fornecendo novos insights sobre a organização espacial dos genomas e seu papel na regulação gênica. Está emergindo que o dobramento de grandes cromossomos complexos envolve uma hierarquia de estruturas, de loops de cromatina que conectam genes e potenciadores a domínios cromossômicos maiores e compartimentos nucleares. Quanto maiores são essas estruturas ao longo dessa hierarquia, mais estáveis ​​elas são dentro das células, enquanto se tornam mais estocásticas entre as células. Aqui, revisamos os dados experimentais e teóricos sobre essa hierarquia de estruturas e propomos um papel fundamental para os domínios de associação topológica recém-descobertos.


Regulação do gene em procariontes

Em bactérias e arquéias, proteínas estruturais com funções relacionadas - como os genes que codificam as enzimas que catalisam as muitas etapas em uma única via bioquímica - são geralmente codificadas juntas dentro do genoma em um bloco chamado operon e são transcritos juntos sob o controle de um único promotor. Isso forma uma transcrição policistrônica (Figura 1). O promotor tem então controle simultâneo sobre a regulação da transcrição desses genes estruturais porque eles serão todos necessários ao mesmo tempo ou nenhum será necessário.

Figura 1. Em procariotos, genes estruturais de funções relacionadas são frequentemente organizados juntos no genoma e transcritos juntos sob o controle de um único promotor. A região regulatória do operon inclui o promotor e o operador. Se um repressor se liga ao operador, os genes estruturais não serão transcritos. Alternativamente, os ativadores podem se ligar à região reguladora, aumentando a transcrição.

Cientistas franceses François Jacob (1920–2013) e Jacques Monod no Instituto Pasteur foram os primeiros a mostrar a organização de genes bacterianos em operons, por meio de seus estudos sobre a laca operon do E. coli. Eles descobriram que em E. coli, todos os genes estruturais que codificam as enzimas necessárias para usar a lactose como fonte de energia estão próximos uns dos outros na lactose (ou laca) operon sob o controle de um único promotor, o laca promotor. Por este trabalho, eles ganharam o Prêmio Nobel de Fisiologia ou Medicina em 1965.

Embora os genes eucarióticos não sejam organizados em operons, os operons procarióticos são excelentes modelos para aprender sobre a regulação gênica em geral. Existem alguns agrupamentos de genes em eucariotos que funcionam de forma semelhante aos operons. Muitos dos princípios podem ser aplicados a sistemas eucarióticos e contribuir para a nossa compreensão das mudanças na expressão gênica em eucariotos que podem resultar em mudanças patológicas, como o câncer.

Cada operon inclui sequências de DNA que influenciam sua própria transcrição e estão localizadas em uma região chamada região reguladora. A região regulatória inclui o promotor e a região em torno do promotor, para a qual fatores de transcrição, proteínas codificadas por genes reguladores, podem se ligar. Fatores de transcrição influenciam a ligação de RNA polimerase ao promotor e permitir sua progressão para transcrever genes estruturais. UMA repressor é um fator de transcrição que suprime a transcrição de um gene em resposta a um estímulo externo ao se ligar a uma sequência de DNA dentro da região regulatória chamada operador, que está localizado entre o local de ligação da RNA polimerase do promotor e o local de início da transcrição do primeiro gene estrutural. A ligação do repressor bloqueia fisicamente a RNA polimerase de transcrever genes estruturais. Por outro lado, um ativador é um fator de transcrição que aumenta a transcrição de um gene em resposta a um estímulo externo, facilitando a ligação da RNA polimerase ao promotor. Um indutor, um terceiro tipo de molécula reguladora, é uma pequena molécula que ativa ou reprime a transcrição ao interagir com um repressor ou ativador.

Em procariontes, há exemplos de operons cujos produtos gênicos são necessários de forma bastante consistente e cuja expressão, portanto, não é regulada. Esses operons são expresso constitutivamente, o que significa que eles são transcritos e traduzidos continuamente para fornecer à célula níveis intermediários constantes dos produtos proteicos. Esses genes codificam enzimas envolvidas em funções de manutenção necessárias para a manutenção celular, incluindo replicação, reparo e expressão de DNA, bem como enzimas envolvidas no metabolismo central. Em contraste, existem outros operons procarióticos que são expressos apenas quando necessários e são regulados por repressores, ativadores e indutores.

Questões Práticas

Quais são as partes na sequência de DNA de um operon?

Que tipos de moléculas regulatórias existem?


Mapeamento e sequenciamento do genoma humano

Mapas de ligação genética

Um mapa de ligação genética mostra as localizações relativas de marcadores de DNA específicos ao longo do cromossomo. Qualquer característica física ou molecular herdada que difira entre os indivíduos e é facilmente detectável em laboratório é um marcador genético potencial. Os marcadores podem ser regiões expressas de DNA (genes) ou segmentos de DNA que não têm função codificadora conhecida, mas cujo padrão de herança pode ser seguido. As diferenças na sequência de DNA são marcadores especialmente úteis porque são abundantes e fáceis de caracterizar com precisão.

Os marcadores devem ser polimórficos para serem úteis no mapeamento, ou seja, devem existir formas alternativas entre os indivíduos para que sejam detectáveis ​​entre os diferentes membros em estudos de família. Polimorfismos são variações na sequência de DNA que ocorrem em média uma vez a cada 300 a 500 bp. Variações nas sequências de exon podem levar a mudanças observáveis, como diferenças na cor dos olhos, tipo de sangue e suscetibilidade a doenças. A maioria das variações ocorre dentro dos íntrons e tem pouco ou nenhum efeito na aparência ou função de um organismo, embora sejam detectáveis ​​no nível do DNA e possam ser usados ​​como marcadores. Exemplos desses tipos de marcadores incluem (1) polimorfismos de comprimento de fragmento de restrição (RFLPs), que refletem variações de sequência em locais de DNA que podem ser clivados por enzimas de restrição de DNA (ver caixa, p. 203), e (2) _número variável de tandem sequências de repetição, que são sequências curtas repetidas que variam no número de unidades repetidas e, portanto, no comprimento (uma característica facilmente medida). O mapa de ligação genética humana é construído observando a frequência com que dois marcadores são herdados juntos.

Dois marcadores localizados próximos um do outro no mesmo cromossomo tendem a ser passados ​​juntos de pai para filho. Durante a produção normal de espermatozoides e óvulos, as fitas de DNA ocasionalmente se rompem e se reúnem em locais diferentes no mesmo cromossomo ou na outra cópia do mesmo cromossomo (isto é, o cromossomo homólogo). Este processo (denominado recombinação meiótica) pode resultar na separação de dois marcadores originalmente no mesmo cromossomo (Fig. 8). Quanto mais próximos os marcadores estão uns dos outros, mais estreitamente ligados, menos provável que um evento de recombinação caia entre eles e os separe. A frequência de recombinação fornece, portanto, uma estimativa da distância entre dois marcadores.

No mapa genético, as distâncias entre os marcadores são medidas em termos de centimorgans (cM), em homenagem ao geneticista americano Thomas Hunt Morgan. Diz-se que dois marcadores estão separados por 1_cM se forem separados por recombinação 1% do tempo. Uma distância genética de 1_cM é aproximadamente igual a uma distância física de 1 milhão de bp (1 Mb). A resolução atual da maioria das regiões do mapa genético humano é de cerca de 10 Mb.

O valor do mapa genético é que uma doença hereditária pode ser localizada no mapa seguindo a herança de um marcador de DNA presente em indivíduos afetados (mas ausente em indivíduos não afetados), mesmo que a base molecular da doença ainda não possa ser entendida nem o gene responsável identificado. Mapas genéticos têm sido usados ​​para encontrar a localização cromossômica exata de vários genes de doenças importantes, incluindo fibrose cística, doença falciforme, doença de Tay-Sachs, síndrome do X frágil e distrofia miotônica.

Um objetivo de curto prazo do projeto genoma é desenvolver um mapa genético de alta resolução (2 a 5_cM). Os mapas de consenso recentes de alguns cromossomos têm uma média de 7 a 10_cM entre os marcadores genéticos. A resolução do mapeamento genético foi aumentada através da aplicação da tecnologia de DNA recombinante, incluindo fragmentação cromossômica induzida por radiação in vitro e fusões celulares (juntando células humanas com as de outras espécies para formar células híbridas) para criar painéis de células com humanos específicos e variados componentes cromossômicos. Avaliar a frequência de locais de marcadores que permanecem juntos após a fragmentação de DNA induzida por radiação pode estabelecer a ordem e a distância entre os marcadores. Como apenas uma única cópia de um cromossomo é necessária para a análise, mesmo os marcadores não polimórficos são úteis no mapeamento de híbridos de radiação. [No mapeamento meiótico (descrito acima), duas cópias de um cromossomo devem ser distinguidas uma da outra por marcadores polimórficos.]

Enzimas de restrição: bisturis microscópicos

Isoladas de várias bactérias, as enzimas de restrição reconhecem sequências curtas de DNA e cortam as moléculas de DNA nesses locais específicos. (Uma função biológica natural dessas enzimas é proteger as bactérias atacando o DNA viral e outro estranho.) Algumas enzimas de restrição (cortadores raros) cortam o DNA muito raramente, gerando um pequeno número de fragmentos muito grandes (vários milhares a um milhão bp). A maioria das enzimas corta o DNA com mais frequência, gerando um grande número de pequenos fragmentos (menos de cem a mais de mil e bp).

Em média, as enzimas de restrição com

* Sites de reconhecimento de 4 bases renderão pedaços de 256 bases de comprimento,

* Sites de reconhecimento de 6 bases renderão peças de 4.000 bases de comprimento, e

* Sites de reconhecimento de 8 bases renderão pedaços de 64.000 bases de comprimento.

Uma vez que centenas de diferentes enzimas de restrição foram caracterizadas, o DNA pode ser cortado em muitos pequenos fragmentos diferentes.

Mapas Físicos

Diferentes tipos de mapas físicos variam em seu grau de resolução. O mapa físico de resolução mais baixa é o mapa cromossômico (às vezes chamado de citogenético), que se baseia nos padrões de bandas distintos observados por microscopia de luz de cromossomos corados. Um mapa de cDNA mostra as localizações de regiões expressas de DNA (exons) no mapa cromossômico. O mapa contig de cosmídeo mais detalhado descreve a ordem dos fragmentos de DNA sobrepostos que abrangem o genoma. Um mapa de macrorrestrição descreve a ordem e a distância entre os locais de corte de enzima (clivagem). O mapa físico de mais alta resolução é a elucidação completa da sequência do par de bases do DNA de cada cromossomo do genoma humano. Os mapas físicos são descritos em mais detalhes abaixo.

Mapeamento Físico de Baixa Resolução

Mapa cromossômico. Em um mapa cromossômico, genes ou outros fragmentos de DNA identificáveis ​​são atribuídos a seus respectivos cromossomos, com distâncias medidas em pares de bases. Esses marcadores podem ser fisicamente associados a bandas específicas (identificadas por coloração citogenética) principalmente por hibridização in situ, uma técnica que envolve marcar o marcador de DNA com um marcador observável (por exemplo, um que apresenta fluorescência ou é radioativo). A localização da sonda marcada pode ser detectada após se ligar à sua fita complementar de DNA em um cromossomo intacto.

Tal como acontece com o mapeamento de ligação genética, o mapeamento cromossômico pode ser usado para localizar marcadores genéticos definidos por características observáveis ​​apenas em organismos inteiros. Como os mapas cromossômicos são baseados em estimativas de distância física, eles são considerados mapas físicos. O número de pares de bases dentro de uma banda só pode ser estimado.

Até recentemente, mesmo os melhores mapas cromossômicos podiam ser usados ​​para localizar um fragmento de DNA apenas em uma região de cerca de 10 Mb, o tamanho de uma banda típica vista em um cromossomo. Melhorias nos métodos de hibridização in situ por fluorescência (FISH) permitem a orientação de sequências de DNA que se encontram em 2 a 5 Mb. Modificações nos métodos de hibridização in situ, usando cromossomos em um estágio da divisão celular (interfase) quando eles são menos compactos, aumentam a resolução do mapa para cerca de 100.000 bp. Um refinamento adicional de bandas pode permitir que bandas cromossômicas sejam associadas a fragmentos de DNA amplificados específicos, uma melhoria que pode ser útil na análise de características físicas observáveis ​​associadas a anormalidades cromossômicas.

mapa de cDNA. Um mapa de cDNA mostra as posições de regiões expressas de DNA (exões) em relação a determinadas regiões ou bandas cromossômicas. (As regiões de DNA expressas são aquelas transcritas em mRNA.) O cDNA é sintetizado em laboratório usando a molécula de mRNA como modelo de regras de emparelhamento de base (ou seja, um A na molécula de mRNA irá emparelhar com um T na nova fita de DNA) . Este cDNA pode então ser mapeado para regiões genômicas.

Por representarem regiões genômicas expressas, acredita-se que os cDNAs identifiquem as partes do genoma com maior significado biológico e médico. Um mapa de cDNA pode fornecer a localização cromossômica para genes cujas funções são atualmente desconhecidas. Para caçadores de genes de doenças, o mapa também pode sugerir um conjunto de genes candidatos a serem testados quando a localização aproximada de um gene de doença for mapeada por técnicas de ligação genética.

Mapeamento Físico de Alta Resolução

As duas abordagens atuais para o mapeamento físico de alta resolução são chamadas de cima para baixo (produzindo um mapa de macrorrestrição) e de baixo para cima (resultando em um mapa contig). Com qualquer uma das estratégias (descritas abaixo), os mapas representam conjuntos ordenados de fragmentos de DNA que são gerados pelo corte do DNA genômico com enzimas de restrição (consulte Enzimas de restrição discutidas anteriormente). Os fragmentos são então amplificados por clonagem ou por métodos de reação em cadeia da polimerase (PCR) (ver Amplificação de DNA abaixo). Técnicas eletroforéticas são utilizadas para separar os fragmentos de acordo com o tamanho em diferentes bandas, que podem ser visualizadas por coloração direta de DNA ou por hibridização com sondas de DNA de interesse. O uso de cromossomos purificados separados por classificação de fluxo de linhas de células humanas ou em linhas de células híbridas permite que um único cromossomo seja mapeado (consulte Separando Cromossomos abaixo).

Uma série de estratégias pode ser usada para reconstruir a ordem original dos fragmentos de DNA no genoma. Muitas abordagens utilizam a capacidade das fitas simples de DNA e / ou RNA de hibridizarem para formar segmentos de fita dupla por ligação de hidrogênio entre bases complementares. A extensão da homologia de sequência entre as duas fitas pode ser inferida a partir do comprimento do segmento de fita dupla. A impressão digital usa dados do mapa de restrição para determinar quais fragmentos têm uma sequência específica (impressão digital) em comum e, portanto, se sobrepõem. Outra abordagem usa clones de ligação como sondas para hibridização para corte de DNA cromossômico com a mesma enzima de restrição.

Mapas de macrorestrição: mapeamento de cima para baixo. No mapeamento de cima para baixo, um único cromossomo é cortado (com enzimas de restrição de corte raro) em grandes pedaços, que são ordenados e subdivididos, e os pedaços menores são mapeados posteriormente. Os mapas de macro-restrição resultantes representam a ordem e a distância entre os locais nos quais as enzimas de corte raro clivam (Fig. 9a). Esta abordagem produz mapas com mais continuidade e menos lacunas entre fragmentos do que mapas contig (veja abaixo), mas a resolução do mapa é menor e pode não ser útil na localização de genes específicos, além disso, essa estratégia geralmente não produz longos trechos de locais mapeados. Atualmente, esta abordagem permite que pedaços de DNA sejam localizados em regiões que medem cerca de 100.000 bp a 1_Mb.

O desenvolvimento de métodos eletroforéticos em gel de campo pulsado (PFG) aprimorou o mapeamento e a clonagem de grandes moléculas de DNA. Enquanto os métodos convencionais de eletroforese em gel separam peças com tamanho inferior a 40 kb (1 kb = 1000 bases), o PFG separa moléculas de até 10 Mb, permitindo a aplicação de métodos de mapeamento convencionais e novos para regiões genômicas maiores.

Mapas Contig: mapeamento ascendente. A abordagem ascendente envolve cortar o cromossomo em pequenos pedaços, cada um dos quais clonado e ordenado. Os fragmentos ordenados formam blocos contíguos de DNA (contigs). Atualmente, a biblioteca de clones resultante varia em tamanho de 10.000 bp a 1 Mb (Fig. 9b). Uma vantagem dessa abordagem é a acessibilidade desses clones estáveis ​​a outros pesquisadores. A construção de contig pode ser verificada por FISH, que localiza cosmídeos em regiões específicas dentro de bandas cromossômicas.

Mapas Contig, portanto, consistem em uma biblioteca vinculada de pequenos clones sobrepostos que representam um segmento cromossômico completo. Embora úteis para encontrar genes localizados em uma área pequena (abaixo de 2 Mb), os mapas contig são difíceis de se estender por grandes extensões de um cromossomo porque todas as regiões não são clonáveis. As técnicas de sonda de DNA podem ser usadas para preencher as lacunas, mas são demoradas. A Figura 10 é um diagrama que relaciona os diferentes tipos de mapas.

Melhorias tecnológicas agora possibilitam a clonagem de grandes pedaços de DNA, usando vetores cromossômicos construídos artificialmente que carregam fragmentos de DNA humano de até 1 Mb. Esses vetores são mantidos em células de levedura como cromossomos artificiais (YACs). Para obter mais explicações, consulte Amplificação de DNA abaixo). Antes dos YACs serem desenvolvidos, os maiores vetores de clonagem (cosmídeos) carregavam inserções de apenas 20 a 40 kb. A metodologia YAC reduz drasticamente o número de clones a serem solicitados, muitos YACs abrangem genes humanos inteiros. Um mapa mais detalhado de uma grande inserção YAC pode ser produzido por subclonagem, um processo no qual fragmentos da inserção original são clonados em vetores de inserção menores.Como algumas regiões YAC são instáveis, vetores bacterianos de grande capacidade (ou seja, aqueles que podem acomodar grandes inserções) também estão sendo desenvolvidos.

Separando Cromossomos

Classificação de fluxo

Pioneira no Laboratório Nacional de Los Alamos (LANL), a classificação por fluxo emprega citometria de fluxo para separar, de acordo com o tamanho, os cromossomos isolados das células durante a divisão celular, quando estão condensados ​​e estáveis. À medida que os cromossomos fluem isoladamente por um feixe de laser, eles são diferenciados pela análise da quantidade de DNA presente, e os cromossomos individuais são direcionados para tubos de coleta específicos.

Hibridização de células somáticas

Na hibridização de células somáticas, as células humanas e as células tumorais de roedores são fundidas (hibridizadas) ao longo do tempo, após a mistura dos cromossomos, os cromossomos humanos são preferencialmente perdidos da célula híbrida até que apenas um ou alguns permaneçam. Essas células híbridas individuais são então propagadas e mantidas como linhas celulares contendo cromossomos humanos específicos. As melhorias nesta técnica geraram várias linhas de células híbridas, cada uma com um único cromossomo humano específico.

Tecnologias de sequenciamento

O mapa físico final do genoma humano é a seqüência completa de DNA e a determinação de todos os pares de bases em cada cromossomo. O mapa completo fornecerá aos biólogos uma pedra de Roseta para estudar a biologia humana e permitirá que os pesquisadores médicos comecem a desvendar os mecanismos de doenças hereditárias. Muito esforço continua a ser despendido na localização de genes. Se a sequência completa fosse conhecida, a ênfase poderia mudar para a determinação da função do gene. O Projeto Genoma Humano está criando ferramentas de pesquisa para a biologia do século 21, quando o objetivo será entender a sequência e as funções dos genes que nela residem.

Alcançar os objetivos do Projeto Genoma Humano exigirá melhorias substanciais na taxa, eficiência e confiabilidade dos procedimentos de sequenciamento padrão. Embora os avanços tecnológicos estejam levando à automação das etapas padrão de purificação, separação e detecção de DNA, os esforços também estão se concentrando no desenvolvimento de métodos de sequenciamento inteiramente novos que podem eliminar algumas dessas etapas. Os procedimentos de sequenciação envolvem atualmente a primeira subclonagem de fragmentos de DNA de uma biblioteca de cosmídeos ou bacteriófagos em vetores de sequenciamento especiais que carregam pedaços mais curtos dos fragmentos de cosmídeos originais (Fig. 11). A próxima etapa é fazer os fragmentos subclonados em conjuntos de fragmentos aninhados diferindo em comprimento por um nucleotídeo, de modo que a base específica no final de cada fragmento sucessivo seja detectável após os fragmentos terem sido separados por eletroforese em gel. As tecnologias de sequenciamento atuais são discutidas posteriormente.

Amplificação de DNA: clonagem e reação em cadeia da polimerase

Clonagem (amplificação de DNA in vivo)

A clonagem envolve o uso de tecnologia de DNA recombinante para propagar fragmentos de DNA dentro de um hospedeiro estranho. Os fragmentos são geralmente isolados de cromossomos usando enzimas de restrição e depois unidos a um transportador (um vetor). Após a introdução em células hospedeiras adequadas, os fragmentos de DNA podem então ser reproduzidos juntamente com o DNA da célula hospedeira. Vetores são moléculas de DNA originadas de vírus, bactérias e células de levedura. Eles acomodam vários tamanhos de fragmentos de DNA estranho variando de 12.000 bp para vetores bacterianos (plasmídeos e cosmídeos) a 1 Mb para vetores de levedura (cromossomos artificiais de levedura). Na maioria das vezes, as bactérias são os hospedeiros dessas inserções, mas também são usadas células de levedura e de mamíferos. (Figura 11a: Clonagem de DNA em plasmídeos)

Os procedimentos de clonagem fornecem material ilimitado para estudo experimental. Um conjunto aleatório (não ordenado) de fragmentos de DNA clonados é chamado de biblioteca. As bibliotecas genômicas são conjuntos de fragmentos sobrepostos que abrangem um genoma inteiro. Figura 11b: Clonagem de DNA em plasmídeos. Também estão disponíveis bibliotecas específicas de cromossomos, que consistem em fragmentos derivados do DNA de origem enriquecido para um cromossomo particular. (Consulte Separando Cromossomos, acima.)

PCR (amplificação de DNA in vitro)

Descrito como sendo para os genes o que a impressora de Gutenberg era para a palavra escrita, o PCR pode amplificar uma sequência de DNA desejada de qualquer origem (vírus, bactéria, planta ou humano) centenas de milhões de vezes em questão de horas, uma tarefa que exigiram vários dias com a tecnologia recombinante. O PCR é especialmente valioso porque a reação é altamente específica, facilmente automatizada e capaz de amplificar pequenas quantidades de amostra. Por essas razões, o PCR também teve um grande impacto na medicina clínica, diagnóstico de doenças genéticas, ciência forense e biologia evolutiva.

A PCR é um processo baseado em uma enzima polimerase especializada, que pode sintetizar uma fita complementar a uma dada fita de DNA em uma mistura contendo as 4 bases de DNA e 2 fragmentos de DNA (primers, cada um com cerca de 20 bases de comprimento) flanqueando a sequência alvo. A mistura é aquecida para separar as fitas de DNA de fita dupla contendo a sequência alvo e, em seguida, resfriada para permitir que (1) os iniciadores encontrem e se liguem às suas sequências complementares nas fitas separadas e (2) a polimerase para estender os iniciadores em novas fitas complementares. Ciclos repetidos de aquecimento e resfriamento multiplicam o DNA alvo exponencialmente, uma vez que cada nova fita dupla se separa para se tornar dois modelos para síntese posterior. Em cerca de 1 hora, 20 ciclos de PCR podem amplificar o alvo em um milhão de vezes.

Tecnologias de sequenciamento atuais

As duas abordagens básicas de sequenciamento, Maxam-Gilbert e Sanger, diferem principalmente na forma como os fragmentos de DNA aninhados são produzidos. Ambos os métodos funcionam porque a eletroforese em gel produz separações de alta resolução de moléculas de DNA, mesmo fragmentos que diferem em tamanho por apenas um único nucleotídeo podem ser resolvidos. Quase todas as etapas desses métodos de sequenciamento agora são automatizadas. O sequenciamento Maxam-Gilbert (também chamado de método de degradação química) usa produtos químicos para clivar o DNA em bases específicas, resultando em fragmentos de diferentes comprimentos. Um refinamento do método Maxam-Gilbert conhecido como sequenciamento multiplex permite aos investigadores analisar cerca de 40 clones em um único gel de sequenciamento de DNA. O sequenciamento de Sanger (também chamado de terminação de cadeia ou método didesoxi) envolve o uso de um procedimento enzimático para sintetizar cadeias de DNA de comprimento variável em quatro reações diferentes, parando a replicação do DNA em posições ocupadas por uma das quatro bases e, em seguida, determinando os comprimentos de fragmento resultantes (Fig. 12).

Essas tecnologias de sequenciamento baseadas em gel de primeira geração agora estão sendo usadas para sequenciar pequenas regiões de interesse no genoma humano. Embora os investigadores possam usar a tecnologia existente para sequenciar cromossomos inteiros, as considerações de tempo e custo tornam os projetos de sequenciamento em larga escala dessa natureza impraticáveis. O menor cromossomo humano (Y) contém 50 Mb, o maior (cromossomo 1) tem 250 Mb. A maior sequência contínua de DNA obtida até agora, entretanto, é de aproximadamente 350.000 bp, e o melhor equipamento disponível pode sequenciar apenas 50.000 a 100.000 bases por ano a um custo aproximado de $ 1 a $ 2 por base. A essa taxa, seriam necessários 30.000 anos de trabalho inaceitáveis ​​e pelo menos US $ 3 bilhões apenas para o sequenciamento.

Tecnologias de sequenciamento em desenvolvimento

Um dos principais focos do Projeto Genoma Humano é o desenvolvimento de tecnologia de sequenciamento automatizado que pode sequenciar com precisão 100.000 ou mais bases por dia a um custo de menos de $ 0,50 por base. Objetivos específicos incluem o desenvolvimento de esquemas de sequenciamento e detecção que são mais rápidos e mais sensíveis, precisos e econômicos. Muitas novas tecnologias de sequenciamento estão sendo exploradas e as mais promissoras serão eventualmente otimizadas para uso generalizado.

As tecnologias de sequenciamento de segunda geração (provisórias) permitirão que a velocidade e a precisão aumentem em uma ordem de magnitude (ou seja, 10 vezes maior), enquanto reduzem o custo por base. Alguns genes de doenças importantes serão sequenciados com tecnologias como (1) eletroforese capilar de alta voltagem e ultrafina para aumentar a taxa de separação de fragmentos e (2) uso de espectroscopia de ionização por ressonância para detectar marcadores de isótopos estáveis.

Espera-se que as tecnologias de sequenciamento sem gel de terceira geração, que visam aumentar a eficiência em várias ordens de magnitude, sejam usadas para sequenciar a maior parte do genoma humano. Essas tecnologias em desenvolvimento incluem (1) detecção de fluorescência aprimorada de bases marcadas individuais em citometria de fluxo, (2) leitura direta da sequência de base em uma fita de DNA com o uso de tunelamento de varredura ou microscopias de força atômica, (3) análise de espectrometria de massa aprimorada de Sequência de DNA, e (4) sequenciamento por hibridização em pequenos painéis de nucleotídeos de sequência conhecida. Projetos piloto de sequenciamento em larga escala fornecerão oportunidades para melhorar as tecnologias atuais e revelarão desafios que os investigadores podem encontrar em esforços em larga escala.

Sequenciamento parcial para facilitar o mapeamento, identificação de genes

Correlacionar dados de mapeamento de diferentes laboratórios tem sido um problema devido às diferenças na geração, isolamento e mapeamento de fragmentos de DNA. Um sistema de referência comum projetado para atender a esses desafios usa regiões únicas parcialmente sequenciadas (200 a 500 bp) para identificar clones, contigs e longos trechos de sequência. Chamados de sites com marcação de sequência (STSs), essas sequências curtas se tornaram marcadores padrão para mapeamento físico.

Como as sequências codificadoras de genes representam a maior parte do conteúdo de informação potencialmente útil do genoma (mas são apenas uma fração do DNA total), alguns pesquisadores começaram o sequenciamento parcial de cDNAs em vez de DNA genômico aleatório. (Os cDNAs são derivados de sequências de mRNA, que são produtos de transcrição de genes expressos.) Além de fornecer marcadores únicos, essas sequências parciais [denominadas etiquetas de sequência expressa (ESTs)] também identificam genes expressos. Essa estratégia pode, portanto, fornecer um meio de identificar rapidamente a maioria dos genes humanos. Outras aplicações da abordagem EST incluem a determinação de localizações de genes ao longo dos cromossomos e a identificação de regiões codificantes em sequências genômicas.

Jogos finais: completando mapas e sequências encontrando genes específicos

Iniciar mapas e sequências é relativamente simples e terminá-los exigirá novas estratégias ou uma combinação de métodos existentes. Depois que uma sequência é determinada usando os métodos descritos acima, a tarefa permanece para preencher as muitas lacunas deixadas pelos métodos de mapeamento atuais. Uma abordagem é a microdissecção de cromossomo único, em que uma peça é fisicamente cortada de uma região cromossômica de interesse particular, quebrada em pedaços menores e amplificada por PCR ou clonagem (ver Amplificação de DNA acima). Esses fragmentos podem então ser mapeados e sequenciados pelos métodos descritos anteriormente.

A caminhada cromossômica, uma estratégia para preencher lacunas, envolve a hibridização de um primer de sequência conhecida com um clone de uma biblioteca genômica desordenada e a síntese de uma fita complementar curta (chamada de caminhada ao longo de um cromossomo). A fita complementar é então sequenciada e sua extremidade usada como o próximo iniciador para continuar a caminhar desta forma, a região adjacente, anteriormente desconhecida, é identificada e sequenciada. O cromossomo é então sequenciado sistematicamente de uma extremidade à outra. Como os primers devem ser sintetizados quimicamente, uma desvantagem dessa técnica é o grande número de diferentes primers necessários para percorrer uma longa distância. A caminhada cromossômica também é usada para localizar genes específicos por meio do sequenciamento dos segmentos cromossômicos entre os marcadores que flanqueiam o gene de interesse (Fig. 13).

O mapa genético humano atual tem cerca de 1000 marcadores, ou 1 marcador espaçado a cada 3 milhões de pb, cerca de 100 genes estão entre cada par de marcadores. Mapas genéticos de alta resolução foram feitos em regiões de particular interesse. Novos genes podem ser localizados combinando informações de mapas genéticos e físicos para uma região. O mapa genético descreve basicamente a ordem dos genes. Informações aproximadas sobre a localização do gene às vezes também estão disponíveis, mas esses dados devem ser usados ​​com cautela porque a recombinação não é igualmente provável em todos os lugares do cromossomo. Assim, o mapa genético, comparado ao mapa físico, se estende em alguns lugares e se comprime em outros, como se fosse desenhado em um elástico.

O grau de dificuldade em encontrar um gene de doença de interesse depende muito das informações já conhecidas sobre o gene e, principalmente, de que tipo de alterações no DNA causam a doença. Identificar o gene da doença é muito difícil quando a doença resulta de uma única anemia falciforme de base de DNA alterada é um exemplo de tal caso, como provavelmente a maioria das principais doenças hereditárias humanas. Quando a doença resulta de um grande rearranjo de DNA, essa anomalia geralmente pode ser detectada como alterações no mapa físico da região ou mesmo por exame microscópico direto do cromossomo. A localização dessas alterações indica o local do gene.

Identificar o gene responsável por uma doença específica sem um mapa é análogo a encontrar uma agulha em um palheiro. Na verdade, encontrar o gene é ainda mais difícil, porque mesmo de perto, o gene ainda se parece com apenas mais um pedaço de feno. No entanto, os mapas fornecem pistas sobre onde olhar quanto melhor a resolução do mapa, menos pedaços de feno a serem testados.

Uma vez que a vizinhança de um gene de interesse foi identificada, várias estratégias podem ser usadas para encontrar o próprio gene. Uma biblioteca ordenada da vizinhança do gene pode ser construída, se ainda não houver uma disponível. Esta biblioteca fornece fragmentos de DNA que podem ser rastreados para polimorfismos adicionais, melhorando o mapa genético da região e restringindo ainda mais a possível localização do gene. Além disso, os fragmentos de DNA da região podem ser usados ​​como sondas para pesquisar sequências de DNA que são expressas (transcritas para RNA) ou conservadas entre os indivíduos. A maioria dos genes terá essas sequências. Em seguida, os candidatos a genes individuais devem ser examinados. Por exemplo, é provável que um gene responsável pela doença hepática seja expresso no fígado e menos provável em outros tecidos ou órgãos. Este tipo de evidência pode limitar ainda mais a pesquisa. Finalmente, um gene suspeito pode precisar ser sequenciado em indivíduos saudáveis ​​e afetados. Um padrão consistente de variação de DNA quando essas duas amostras são comparadas mostrará que o gene de interesse muito provavelmente foi encontrado. A prova final é corrigir a suspeita de alteração do DNA em uma célula e mostrar que o comportamento das células volta ao normal.

Próxima seção: Pesquisa de Organismo Modelo

Vá para o índice


Resultados

Uma vez que a mancha branca pode ser influenciada por genes que operam por meio de mecanismos diferentes, conduzimos dois GWAS separados que diferiram na definição do fenótipo. Primeiro, manchas brancas foram pontuadas como a presença ou ausência de branco na pelagem e codificadas como um fenótipo binário (N = 2973 animais). Em segundo lugar, manchas brancas foram codificadas como uma variável quantitativa, onde os animais foram pontuados com base na proporção geral de brancos (N = 2.232 animais). Animais de cor sólida não foram incluídos na última população, para a qual a proporção de branco também foi transformada em log antes da análise de associação para renderizar os dados em uma forma aproximada de uma distribuição normal. Todas as medidas fenotípicas foram baseadas na análise manual de fotografias (consulte a seção Métodos), que incluiu imagens representando 699 vacas Holstein-Friesian × Jersey (HF × J) F2 classificadas como parte de um estudo QTL anterior [10]. A composição da raça e os sexos dos animais restantes são descritos na seção Métodos, que incluem uma mistura de vacas e touros HF, J e HF × J.

A análise de associação de todo o genoma foi conduzida com base nos genótipos de sequência do genoma imputado usando o software GCTA (v1.91.6). Os genótipos foram imputados à resolução da sequência usando uma população de referência de 565 animais sequenciados do genoma completo e métodos que são semelhantes aos descritos anteriormente (consulte a seção "Métodos" e Lopdell et al. [16]). Os modelos lineares mistos assumiram aditividade e ajustes incorporados para fazenda de origem, coorte [10] e uma matriz de relacionamento genômico (GRM) calculada no GCTA (v1.91.6). Os dados computados também foram filtrados para remover variantes que tinham um MAF inferior a 0,005 e atendiam a outros critérios de filtragem de qualidade descritos em mais detalhes na seção Métodos. Os resultados da análise de associação para presença / ausência de branco na pelagem revelaram três sinais que ultrapassaram o limite de significância de todo o genoma de p = 5 × 10 −8 e estavam localizados nos cromossomos 2, 6 e 22 (Fig. 1a). As principais variantes para esses QTL mapeadas para Chr 22 g.31769747A & gtG (rs209784468, p = 1,51 × 10 −56), Chr 6 g.64210286A & gtG (rs451683615, p = 3,73 × 10 −53), e Chr 2 g.111576221A & gtC (rs109979909, p = 3.26 × 10 −15 ).

uma Gráfico de Manhattan com base nos resultados GWAS para a presença / ausência de cor branca na pelagem. As principais variantes no cromossomo 22, 6 e 2 têm p-valores de 1,51 × 10 −56, 3,73 × 10 −53 e 3,26 × 10 −15, respectivamente. b Gráfico de Manhattan com base nos resultados GWAS para a proporção de manchas brancas. As principais variantes no cromossomo 22, 6 e 2 têm p-valores de 1,83 × 10 −79, 1,1 × 10 −64 e 1,27 × 10 −13, respectivamente. A linha vermelha indica o limite de significância de todo o genoma p = 5 × 10 −8

Para a análise que tratou manchas brancas como uma variável quantitativa (proporção de manchas brancas), GWAS revelou as mesmas três regiões descritas para o traço codificado por binário (p & lt 5 × 10 -8 Fig. 1b). Além disso, essa análise apresentou as mesmas três variantes associadas ao topo que foram identificadas no primeiro GWAS, o que sugeriu que esses sinais representavam o mesmo QTL. Estes resultados estão de acordo com descobertas anteriores que descreveram manchas brancas como uma característica quantitativa, ou seja, sob o controle de múltiplos QTL [1, 11]. Dado que os sinais derivados do fenótipo quantitativo também foram mais significativos do que para a característica binária, esse fenótipo passou a ser o foco das análises que são apresentadas a seguir. A Tabela 1 lista as 10 principais variantes associadas e os efeitos desses QTL. Notavelmente, os tamanhos dos efeitos de todos os três QTL foram muito grandes, com efeitos de substituição de alelo de 3,2, 12,9 e 11,5% para os SNPs da marca superior nos cromossomos 2, 6 e 22, respectivamente.

Análise dos loci significativos em cada cromossomo detectado

Cromossomo 22

Um SNP em Chr22 g.31769747A & gtG (rs209784468) foi identificado como a variante mais significativa em nossa análise de associação (p = 1,83 × 10 −79), e mapeado para uma região de 284 pb a montante do local de início da transcrição anotado por Ensembl (TSS) do MITF gene. O fator de transcrição MITF está envolvido na sobrevivência, manutenção e diferenciação dos melanócitos [29] e, portanto, é o candidato mais óbvio neste locus.Com base na construção do gene Ensembl v92.31 [25, 26], MITF é também um dos dois únicos genes codificadores de proteínas anotados que estão presentes dentro de uma janela de 1 Mb em torno de rs209784468, o que fornece um forte suporte para o status causal desse gene. A Figura 2a mostra um gráfico de Manhattan desse intervalo, com as variantes sendo codificadas por cores de acordo com o impacto funcional previsto usando SNPEff [24]. Para avaliar se o sinal observado no cromossomo 22 era provavelmente representativo de um único QTL bialélico, executamos uma análise adicional, ajustando o SNP associado ao topo (rs209784468) como um efeito fixo no modelo de associação. Esta análise removeu a significância em quase todas as variantes dentro de um intervalo de 1 Mb (Fig. 2a, b), mas um ligeiro sinal residual permaneceu (menor p = 8,53 × 10 −11 para Chr22 g.31730376 rs109549448 Fig. 2b). Embora o erro de imputação ou a estratificação da população não tratada possam explicar o pequeno sinal residual revelado nesta análise, a heterogeneidade alélica bem descrita para MITF suporta a existência potencial de QTL múltiplos e / ou multialélicos. Deve-se notar que, em uma análise recente em gado pardo suíço, Hofstetter et al. [12] identificou um SNP (rs722765315), localizado dentro da região 5′ do MITF gene como uma variante causal candidata para manchas brancas [12]. No entanto, o exame desse local em nossa coorte sequenciada do genoma inteiro mostra que ele é invariável em animais Holstein-Friesian e Jersey, o que sugere a presença de uma ou mais variantes causais alternativas na população da Nova Zelândia.

Análise de QTL do cromossomo 22 com variantes codificadas por cores de acordo com o impacto funcional previsto usando SNPEff. uma Janela de 1 Mb de dados de associação de sequência de genoma total imputados centrados em torno da variante superior Chr22 g.31769747A & gtG (rs209784468) com a trilha de gene anotada correspondente acima. b Janela de 1 Mb de dados de associação de sequência imputada com rs209784468 ajustada como um efeito fixo no modelo de associação. A linha vermelha indica o limite de significância de todo o genoma p = 5×10 −8

Um novo pseudogene polimórfico MITF como candidato para o QTL de manchas brancas Notavelmente, observamos uma mutação missense prevista que afeta MITF em Chr22 g.31769331C & gtT (rs110881545 Fig. 2a). Embora pudesse ser uma mutação candidata para o QTL, esta variante não era significativa e foi chamada com uma frequência muito baixa na população de referência da sequência do genoma usada para imputação (MAF & lt 0,01). A inspeção manual de alinhamentos de sequência de animais heterozigotos para esta variante mostrou anomalias de profundidade de leitura em torno dos limites de íntron-exon anotados, o que nos levou a analisar em mais detalhes essas características. Embora tenhamos usado dados de sequência baseados em DNA, nesses limites observamos uma profundidade de sequenciamento aumentada para os exons, que são uma reminiscência de alinhamentos de sequência de RNA (consulte o arquivo adicional 2: Figura S1). A análise de leituras com clipagem suave dos exões mostrou que as incompatibilidades correspondiam a estruturas de exões vizinhas, o que sugere que foram derivadas de um mapeamento errado e processado MITF pseudogene. Pares de leitura não exônica do aparente MITF pseudogene mapeado para um único local no cromossomo 12 em 58,7 Mb, indicando que este locus é o provável local de integração do pseudogene. Notavelmente, esse pseudogene foi polimórfico entre os animais, o que levantou a possibilidade de que o QTL pudesse ser causado por essa variante estrutural. Correspondência de string procurando por emendas MITF leituras de sequência dos alinhamentos de sequência do genoma completo, nos permitiram genotipar os 565 animais sequenciados do genoma completo em nossa população de referência para o pseudogene, dando um MAF de 0,026 para o alelo integrado. Este valor MAF contrastou marcadamente com aquele da variante de marca superior de GWAS (MAF = 0,304) e quando as estatísticas de desequilíbrio de ligação em pares foram examinadas entre o pseudogene 'genótipo' e variantes das regiões mais amplas do cromossomo 22 e do cromossomo 12, os marcadores mais altamente correlacionados também não foram significativas no GWAS (cromossomo 12, R 2 máximo = 0,72 para rs461882713 Chr12 g.6060748C & gtG, p = 0,72 cromossomo 22, R 2 máximo = 0,69 para rs384283283 Chr22 g.31734120C & gtT, p = 0,67). Embora o processado MITF pseudogene foi um bom candidato biológico para a modulação da cor ou padrão da pelagem, essas observações nos levaram a supor que não foi responsável pelo QTL de manchas brancas em nosso estudo.

Evolutivamente conservadas, candidatas a variantes regulatórias causais no locus MITF Apesar de MITF pseudogene identificado acima, nenhuma outra alteração de codificação de proteína foi identificada em MITF que poderia explicar este QTL. Embora dois sinônimos MITF variantes excederam a significância em todo o genoma, sua associação foi suficientemente fraca para descartá-los como sustentando o QTL (Fig. 2a). Juntas, essas observações sugeriram um mecanismo baseado em expressão para um efeito derivado de MITF em manchas brancas. A variante associada superior Chr22 g.31769747A & gtG (rs209784468) é uma candidata razoável a este respeito, pois mapeia para uma região imediatamente a montante do local de início da transcrição anotado (TSS). No entanto, a inspeção de dados de sequência de RNA (RNA-seq) para amostras de pele bovina preta e branca publicada por Koufariotis et al. [22] mostraram estruturas gênicas alternativas que incluem exons 5 ′ adicionais para a anotação derivada de Ensembl (MITF-201 Ensembl v92.31), em que a variante rs209784468 mapeada para o íntron 2 das duas estruturas derivadas de RNA-seq predominantes (Fig. 3). Da mesma forma, o exame das transcrições anotadas na versão mais recente do conjunto de referência bovino no momento da preparação deste artigo (ARS-UCD1.2) mostrou alternativas MITF estruturas, para as quais os transcritos derivados da pele foram melhor representados pelos transcritos MITF-205 e MITF-206 (Ensembl v96.12). Notavelmente, 18 variantes adicionais que exibiram estatísticas de associação que eram amplamente semelhantes às de rs209784468 (p & lt 5 × 10 −70) também mapeado dentro dos íntrons 1, 2, 3 e até 100 kb a montante do alternativo MITF isoformas. Para investigar ainda mais essas variantes, baixamos as pontuações do perfil evolutivo do genoma (GERP) do portal Ensembl para avaliar as métricas de conservação dos locais (Tabela 2 [25, 26]). Embora a localização desta variante fosse menos atraente do que algumas das outras que mapeiam mais perto do 5 ′ assumido MITF promotor, o SNP associado ao topo é a única variante mapeada para um elemento conservado identificado a partir dos alinhamentos de vertebrados amniote de 32 vias (Fig. 3). Este SNP também é conservado em uma base local (pontuação GERP = 1,21) e com base em sua classificação de associação, constitui uma mutação reguladora candidata plausível para este QTL.

Visão detalhada dos íntrons 1 a 3 do derivado de conjunto MITF estrutura do gene e íntrons 1 a 5 do RNA-seq derivado MITF estruturas, com elementos restritos e pontuação GERP para 32 vertebrados amniota de Ensembl (Bos taurus v92.31). g.31769747A & gtG (rs209784468) está destacado e localizado em uma região altamente conservada dentro do íntron 2 das estruturas do gene MITF derivadas de RNA-seq

Cromossomo 6

A variante superior no locus do cromossomo 6 (Chr6 g.64210286A & gtG rs451683615, p = 1,1 × 10 -64), mapeia para uma região intergênica de aproximadamente 280 kb a jusante do KCTD8 gene, que representa uma distância considerável do KIT gene (

7,5 Mb). No entanto, a terceira e a quarta variantes mais fortemente associadas mapeiam dentro do quarto intron de KIT (Chr6 g.71873479T & gtC rs109512689, p = 8,08 × 10 −61 e Chr6 g.71873455A & gtC rs385773341, p = 8.08 × 10 −61 ).

Dada a dispersão do sinal do cromossomo 6 e a associação de variantes que estão localizadas dentro e adjacentes ao forte gene candidato a priori KIT, consideramos um grande intervalo (16 Mb) em torno da variante superior rs451683615 para a previsão funcional dos efeitos das variantes. Os seguintes genes mapeiam para este intervalo: C6H4orf19, TBC1D1, KLF3, TMEM156, KLB, UBE2K, RHOH, RBM47, APBB2, UCHL1, BEND4, SHISA3, HTATSF1, KCTD8, YIPF7, GABRG1, GABRA2, MGC127695, GABRB1, ATPq0D, NFXL1, TXK, SLAIN2, OCIAD1, LRRC66, USP46, SCFD2, FIP1L1, UFM1, GSX2, KIT, KDR, SRD5A3, PDCL2 e CREP135. A Figura 4 mostra um gráfico de Manhattan para esta região, com variantes codificadas por cores de acordo com o impacto funcional previsto usando SNPEff. Com base nas estatísticas de associação, nenhuma das variantes nas 10 principais ordens de magnitude está prevista para alterar a sequência de codificação da proteína desses genes, embora haja uma variante da região de splice modestamente associada em KIT (Chr6 g.71906518T & gtC rs109750754, p = 1,94 × 10 −23). Dado que os sinais primários destacam as variantes não codificantes, um mecanismo QTL que incorpora um ou mais efeitos baseados na expressão gênica parece mais provável.

Análise de QTL do cromossomo 6 com variantes codificadas por cores de acordo com o impacto funcional previsto usando SNPEff. uma Janela de 16 Mb de dados de associação de sequência de genoma total imputados centrados em torno da variante superior Chr6 g.64210286A & gtG (rs451683615) com a trilha de gene anotada correspondente acima. b Janela de 16 Mb de dados de associação de sequência do genoma total imputado com rs451683615, c Chr6 g.71722665C & gtT (rs463810013) e d ambos rs451683615 e rs463810013 ajustados como efeitos fixos. A linha vermelha indica o limite de significância de todo o genoma p = 5 × 10 −8

Múltiplos QTL de segregação no locus KIT Uma explicação para a natureza dispersa do cromossomo 6 QTL é que este locus compreende múltiplos efeitos sobrepostos. Análise de desequilíbrio de ligação (LD) entre a variante superior (Chr6 g.64210286A & gtG rs451683615) e as próximas três variantes mais fortemente associadas (Chr6 g.71722665C & gtT rs463810013, Chr6 g.71873479T & gtC rs109512689 e as hipóteses rs10951268t e rs10951268t mais fortemente associadas (Chr6 g.71722665C & gtT rs463810013, Chr6 g.71873479T & gtC rs10951268t, esta hipótese rs10951268t, r.71873456 gt. estando em LD relativamente baixo com as outras variantes (R 2 máximo = 0,35). Além disso, quando rs451683615 foi ajustado como um efeito fixo, o sinal no cromossomo 6 ainda excedeu o limite de significância de todo o genoma (p = 5 × 10 −8), com os dois fortemente correlacionados KIT variantes (R 2 = 0,91) rs208251862 (Chr6 g.71692344C & gtA p = 7,1 × 10 −19) e rs463810013 (p = 1,5 × 10 −18) sendo agora as principais variantes (Fig. 4b). Quando a variante rs463810013 foi ajustada como um efeito fixo para representar esses efeitos, rs451683615 mais uma vez se tornou a variante mais significativa (p = 3,054 × 10 −25 Fig. 4c), e quando rs451683615 e rs463810013 foram ajustados como efeitos fixos, um pequeno sinal ainda foi detectado perto KIT (menor p = 3,31 × 10-11 para Chr6 g.72007252A & gtT rs109258078 Fig. 4d). Estes resultados sugerem que o sinal observado no cromossomo 6 é provavelmente o resultado de dois ou mais QTL e / ou alternativamente, a consequência de uma ou mais variantes estruturais que não estão bem marcadas e, portanto, não podem ser facilmente explicadas pelo ajuste de SNPs bialélicos nos modelos de associação.

Análise de variantes estruturais no locus do cromossomo 6. Dada a ambigüidade dos sinais de associação no locus do cromossomo 6, e a implicação de KIT variantes estruturais que têm um papel em outros caracteres de revestimento em bovinos (por exemplo, piebaldismo de face branca em Hereford [30] e coloração em Belgian Blue, Brown Swiss e outras raças [31]), realizamos uma análise de variantes estruturais baseada em sequência. para tentar identificar mutações candidatas de segregação para este QTL. Esta análise foi conduzida usando a mesma população de 565 animais sequenciados do genoma inteiro como aquela usada para imputação de sequência antes de GWAS, e focamos em uma ampla região de 20 Mb (60 a 80 Mb) para capturar a natureza dispersa do pico de associação. Esta região incluiu as 10 principais variantes mostradas na Tabela 1, para as quais o software CNVnator (v0.3.3) [28] foi usado para chamar variantes estruturais dentro do intervalo com base em uma abordagem de janela deslizante de 1 kb com sobreposições de 500 bp (ver Métodos). Esta análise revelou um grande número de intervalos polimórficos candidatos (N = 39.960). Usamos a análise de correlação entre os números de cópias estimados e genótipos das duas principais variantes GWAS associadas (Chr6 g.64210286A & gtG rs451683615 e Chr6 g.71722665C & gtT rs463810013) para priorizar as variantes para investigações subsequentes. Das 10 variantes mais altamente correlacionadas para cada um dos dois SNPs de tag, esses intervalos representaram seis variantes estruturais discretas (e algumas variantes podem ser mescladas porque abrangem intervalos adjacentes). A Tabela 3 mostra a posição, o tipo de mutação e o coeficiente de correlação de LD dessas seis variantes para o tag-SNP de interesse, com valores de LD com base na rechamada dos intervalos após a fusão e refinamento manual do limite. A visualização de alinhamentos de sequência sugeriu variação estrutural polimórfica legítima para todas as seis variantes, com quatro delas mostrando uma multimodalidade clara em profundidade de leitura (consulte o arquivo adicional 2: Figura S2). Notavelmente, a análise de LD entre as seis variantes estruturais e as 124.445 outras variantes de sequência dentro do intervalo do cromossomo 6 de 20 Mb mostrou que cinco das seis variantes foram melhor marcadas por outros polimorfismos do cromossomo 6, que mostraram associação fenotípica limitada em comparação com o topo - SNPs de marcação associados rs451683615 e rs463810013 (Tabela 3). Uma exceção foi uma duplicação de 330 bp em Chr6: 72.060.120-72.060.450 bp, onde esta variante foi melhor marcada por um SNP que é amplamente equivalente a rs463810013 (rs385773341 Chr6 g.71873455A & gtC R 2 = 0,98 com rs463810013 Tabela 3). Nenhum dos seis candidatos estruturais mapeados para sequências de codificação de proteínas, embora a duplicação aparente de 330 pb também fosse o polimorfismo mais próximo de KIT (embora 142 kb a jusante). A avaliação da função potencial para esta variante não apresentou nenhuma implicação regulatória óbvia, uma vez que a duplicação era desprovida de conservação local digna de nota ou elementos restritos anotados com GERP. Reconhecendo o fato de que nossa análise baseada em leitura de profundidade da variação estrutural pode representar a complexidade das mutações candidatas identificadas, esses dados provavelmente excluem cinco de seis das variantes estruturais como candidatas para o QTL de manchas brancas. O papel potencial da sexta variante candidata é desconhecido e, embora a duplicação fosse melhor representada pelas principais variantes da tag GWAS, sua correlação geral ainda era baixa (R 2 máximo = 0,43). Esta observação, e o fato de que os genótipos do número de cópias não foram claramente diferenciados para esta variante (ver arquivo adicional 2: Figura S2), nos levam a sugerir que a genotipagem física e uma investigação mais detalhada serão necessárias para avaliar melhor a natureza e candidatura deste polimorfismo.

Cromossomo 2

A variante superior no locus do cromossomo 2 (Chr2 g.111576221A & gtC rs109979909, p = 1,27 × 10 −13) mapeia para o íntron 1 do FARSB gene. Considerando todos os genes em um intervalo de 1 Mb centrado em rs109979909, o PAX3, MIR2284Y-5, FARSB, LOC538702, MOGAT1, ACSL3, RPSL3, RPS6 e KCNEE4 genes mapeiam para esta região. Em particular, PAX3 é um candidato notável, uma vez que codifica um MITF fator de transcrição (consulte a seção "Cromossomo 22" acima) e foi proposto como um gene causal para o fenótipo de pelagem "branca salpicada" em cavalos [4]. A previsão do efeito variante para todas as variantes no intervalo de 1 Mb (Chr2: 111.076.221-112.076.221 bp) revelou uma mutação missense causal candidata em PAX3, que codifica uma substituição de treonina por metionina na posição de aminoácido 424 (rs208582518 p.Thr424Met Fig. 5 [32]). Embora a variante p.Thr424Met mostre uma associação comparativamente mais fraca do que a variante associada superior neste local (p = 2,72 × 10 −11 contra o menor p = 1,27 × 10 −13), é suficientemente fortemente associado para permanecer uma mutação candidata convincente para o QTL. A inspeção adicional dos alinhamentos de sequência através da região de 1 Mb centrada em rs109979909 não mostrou qualquer evidência de segregação de variantes estruturais como candidatos alternativos neste locus.

Análise de QTL do cromossomo 2 com variantes codificadas por cores de acordo com o impacto funcional previsto usando SNPEff. uma Janela de 1 Mb de dados de associação de sequência de genoma total imputados centrados em torno da variante superior Chr2 g.111576221A& gtC (rs109979909) com a trilha de gene anotada correspondente acima. b Janela de 1 Mb de dados de associação de sequência de genoma inteiro imputados com rs109979909 ajustado como um efeito fixo. A linha vermelha indica o limite de significância de todo o genoma p = 5 × 10 −8

Um novo candidato a mutação missense causal PAX3 A variante p.Thr424Met (rs208582518) mapeia para o exon 9 do PAX3 gene. Quando ajustado como um efeito fixo no modelo de associação, a variante foi responsável pela maioria do sinal neste locus (o menor p = 0,0149 para Chr2 g.111955758G & gtA rs41718011 para este modelo (Fig. 5b). A variante p.Thr424Met está localizada dentro do domínio de transativação do fator de transcrição PAX3, que também é identificado como um elemento restrito dos alinhamentos de amniota de 32 vias GERP. A variante tem uma pontuação GERP local-wise de 1,72, e ao avaliar o impacto funcional previsto da variante missense usando o algoritmo SIFT [33] que é integrado como parte do Preditor de Efeito de Variante Ensembl [32], este SNP está previsto para ser 'deletério' (pontuação 0,01, baixa confiança). Da mesma forma, p.Thr424Met é previsto para ser 'possivelmente prejudicial' (pontuação 0,86) pela ferramenta de predição funcional Polifen-2 [34, 35], e o alinhamento múltiplo de sequências de proteína PAX3 representando uma gama de vertebrados também mostra a conservação do resíduo de treonina e aminoácidos circundantes em mamíferos (Fig. 6). No geral, o PAX3 A mutação missense p.Thr424Met é uma mutação causal candidata convincente para o fenótipo de manchas brancas, embora a forte associação de outras variantes não codificantes deixe em aberto a possibilidade de efeitos baseados na expressão, que novamente operam mais provavelmente através do PAX3 gene.

Região em torno da mutação p.Thr424Met. A treonina de tipo selvagem na posição 424 é conservada em toda a vaca (Bos taurus), cavalo (Equus caballus), humano (Homo sapiens) e mouse (Mus musculus) PAX3 ortólogos

Características da raça, frequência e tamanho do efeito dos três principais QTL

A mancha branca é um traço característico em HF e tem estado sob seleção por muitas gerações. Embora alguns animais J na Nova Zelândia apresentem manchas brancas, é muito menos frequente nesta raça. Assim, esperamos que os alelos associados a uma maior proporção de manchas brancas sejam mais frequentes na IC.Com base nas frequências alélicas das principais variantes de marcação para cada um dos três principais QTL em 589 HF de raça pura e 274 de raça pura J, obtivemos as frequências mostradas na Tabela 4 (ver “Métodos”: Populações de estudo para definições de raça). Aqui, denotamos o alelo crescente de branco como Q, e o alelo branco diminuindo como q.

Dados os grandes tamanhos do efeito do QTL, é interessante examinar como 'Q’(Mais branco) ou inversamente‘q'(Menos branco) alelos podem combinar em loci para impactar o fenótipo. Para investigar o QTL desta forma, genótipos "empilhados" foram derivados para cada animal com base nas variantes de tag associadas no topo que representam os cromossomos 2, 6 e 22 loci. Desta forma, os animais podem ser categorizados com base no número de 'Q'Alelos apresentados (intervalo possível de 0 a 6). Esta análise se concentrou em um subconjunto de 699 vacas F2 (½HF × ½J) para minimizar a possível confusão por mistura, onde os animais também eram todos derivados do mesmo grupo de pesquisa. O menor número de Q alelos transportados nesta população eram dois (‘2Q’N = 10 vacas), nenhuma dessas vacas exibindo uma cor branca visível em seu pelo (com base em imagens que mostram apenas uma única vista lateral). Em comparação, os animais que carregam seis Q alelos (ou seja, homozigotos Q para todos os três loci ‘6Q’N = 160) exibiu um aumento notável nas manchas brancas. A Figura 7 compara os 10 2Q animais (painel esquerdo) com uma seleção aleatória de 10 6Q animais (painel direito), e destaca o maior impacto desses QTL. A porcentagem média do valor de manchas brancas foi de 0% para o 10 2Q animais e 32,6% para os 160 6Q animais (ou 36,9% para o subconjunto de 10 6Q animais mostrados na Fig. 7). Essas observações fornecem algumas pistas quanto à descoberta um tanto contra-intuitiva de que Q alelos para dois dos três QTL são os principais alelos em J animais. Embora esta raça seja mais conhecida por sua pelagem marrom-clara sólida, em animais F2, apenas aqueles com um grande número de Q alelos mostraram proporções substanciais de manchas brancas em sua pelagem. Arquivo adicional 2: Figura S3 e arquivo adicional 1: Tabela S2 também mostra uma divisão do Q contagens de alelos em raças puras, com base nos animais 589 HF e 274 J referenciados acima. Neste conjunto de dados de raça pura, a porcentagem de animais J com 6Q alelos é de apenas 1,8%, enquanto na IC chega a 91,7%. Isso é consistente com a observação de que o número de animais J na Nova Zelândia com manchas brancas proeminentes é pequeno e o número daqueles que têm manchas brancas ou brancas são maiores. Também é digno de nota que o Q alelos para os três principais QTL são alelos de referência na montagem do genoma UMD3.1, que é baseado em uma única vaca Hereford. As frequências populacionais dessas variantes na raça Hereford são desconhecidas e, embora esta raça não seja tão caracteristicamente manchada como a raça Holstein, os Herefords são bem conhecidos por suas faces brancas (atribuídas a outra mutação em KIT [30]), com marcações brancas substanciais concentradas na barriga, peito, pescoço e costas.

Imagens em preto e branco de 10 vacas ½HF × ½J carregando o menor número de Q alelos observados (2Q esquerda), em contraste com 10 vacas ½HF × ½J carregando o [número máximo de Q alelos nos três principais loci (6Q direito)


Conclusão

Os sindecanos são uma antiga família de proteínas de adesão e sinalização celular em animais. Os domínios citoplasmáticos contêm sequências altamente conservadas e os domínios extracelulares sofreram mudanças rápidas. Os quatro genes do sindecano dos vertebrados são sintênicos entre os tetrápodes, e a sintaxe dos genes do sindecano-2 e -3 também é aparente entre peixes e tetrápodes. Cada um dos quatro membros da família é codificado com regiões genômicas parálogas nas quais os membros da família matrilina também são sintênicos entre tetrápodes e peixes. Esta organização genômica parece ter sido estabelecida após a divergência de urocordados (Ciona) e vertebrados. O gene syndecan-1 parece ter sido perdido relativamente cedo na linhagem dos peixes. Essas conclusões fornecem a base para um novo modelo de evolução do sindecano em vertebrados e uma nova perspectiva para a análise experimental dos papéis dos sindecanos em células e organismos inteiros.


Métodos

Coleção de dados

Todos os dados do genoma GBS (no genoma completo, cromossomo e níveis de estrutura) foram baixados do banco de dados do genoma do NCBI em janeiro de 2016 (arquivo adicional 1 Tabela. S6). Todos os dados vieram da mesma espécie. Tecnicamente falando, o GTN pode analisar várias espécies, mas essa função não foi demonstrada no estudo atual. Entre esses genomas, 28 genomas completos no nível completo ou cromossômico foram encontrados, e 23 genomas de rascunho apenas no nível do andaime foram encontrados. Cada genoma deve conter arquivos de ácido nucleico FASTA (FNA), aminoácido FASTA (FAA) e GFF.

Montamos os dois grupos a seguir para processar os dados genômicos de forma eficiente: o grupo do genoma completo continha apenas genomas completos, para os quais todas as sequências do genoma foram analisadas pelo GTN; o outro grupo continha todos os 51 genomas completos e preliminares, e cada genoma neste grupo foi alinhado entre si usando o programa nucmer (com parâmetros padrão) do MUMmer (versão 3.23). Os resultados do alinhamento foram interceptados para obter as regiões no genoma que poderiam ser alinhadas a outros genomas apenas uma vez. Definimos as regiões de interseção como os blocos de sintaxe comuns deste genoma. O GTN analisou apenas os blocos de sintaxe comuns.

Também usamos Mauve (data de construção de fevereiro 132.015, com parâmetros padrão), que é uma ferramenta de alinhamento de genoma múltiplo, para encontrar as sequências genômicas conservadas nos genomas GBS para comparação.

Filtragem de dados genômicos

Os blocos sintéticos comuns são as sequências genômicas conservadas que existem em todos os genomas. Assim, se um genoma estiver incompleto ou uma quantidade considerável de sua sequência estiver faltando, os blocos de sintaxe comuns podem ser reduzidos consideravelmente. Aqui, se o tamanho dos blocos de sintaxe comum foi aumentado em & gt 1% após o descarte de um único genoma, o genoma foi reconhecido como incompleto e inadequado para este estudo. Na análise dos grupos de genoma completo e preliminar, 51 genomas foram filtrados principalmente em termos do comprimento médio do bloco de sintaxe comum dos outros genomas após a remoção de um genoma. Os genomas não qualificados foram filtrados quando os tamanhos dos blocos de sintaxe comum de outros genomas foram aumentados em & gt 1%. Uma vez que COG são as unidades básicas para a ordem dos genes, quanto maior o número de COG em um genoma, mais precisos serão os cálculos do GTN. Todas as sequências de proteínas traduzidas de 51 genomas foram alinhadas ao banco de dados COG usando o software BLASTP para filtrar genomas com baixas proporções de COG.

Atribuição de COG e construção de família de genes ortólogos

A função de atribuição de COG foi embutida no GTN pela introdução do algoritmo MCL. Após a filtração genômica, as sequências de proteínas dos genomas foram integradas ao banco de dados de proteínas COG em dois arquivos FASTA. Em seguida, esses dois arquivos foram autoalinhados usando BLASTP [31] (versão 2.2.26, parâmetros: -e & lt 1e-5 –m 9). A família COG resultante foi processada em clusters usando mcxdeblast do pacote MCL (versão 14–137, parâmetros: --m9 --line-mode = abc --score = r) e o algoritmo MCL (versão 14–137, parâmetros : --abc) com base nos resultados de autoalinhamento. O cluster com apenas uma família COG foi selecionado e considerado como a anotação funcional da família COG.

O software OrthoMCL (versão 1.0, parâmetros padrão) também foi usado para obter as famílias ortólogas no grupo de 27 genomas completos para avaliar a função de atribuição de COG atualizada da ferramenta GTN.

Análise filogenética

Quando um resultado de atribuição de família de genes é concluído, o GTN pode usar f1 na Fig. 1 para calcular a distância evolutiva e então construir a árvore filogenética de NJ. Neste estudo, três árvores filogenéticas foram construídas com base nos quatro resultados de atribuição diferentes, como segue:

Árvore baseada em COG: uma árvore de grupo genômica completa construída com base nos resultados de atribuição da família COG agrupados pelo algoritmo MCL e embutidos no GTN. A função das famílias COG foi anotada.

Árvore baseada em OrthoMCL: uma árvore de grupo genômica completa construída com base nos resultados de atribuição do software orthoMCL. As funções das famílias de genes não eram claras.

Árvore baseada em DEG: O banco de dados DEG consiste em genes essenciais [32]. Selecionamos 317 genes essenciais de 'Streptococcus agalactiae A909 'como sequências representativas. Todas as sequências de proteínas de cada genoma foram alinhadas a elas usando BLASTP (versão 2.2.26, parâmetros: -e 1e-5), e os genes alinhados com os melhores acertos foram considerados genes essenciais deste genoma.

Árvore do genoma 46: uma árvore que consiste em 46 genomas obtidos após a filtração genômica com as famílias de genes COG atribuídas pelo MCL.

O GTN usou esses resultados de atribuição de família de genes para construir redes de topologia e, em seguida, usou f1f3 na primeira versão do GTN [14] para calcular a distância evolutiva, obter uma matriz de distância e definir genes não fixados. O pacote R ape (versão 2.8, parâmetro padrão) [33] foi aplicado para produzir o resultado da matriz de distância usando o algoritmo NJ com 1000 réplicas de bootstrap no GTN. O software MEGA (versão 5.05, bootstrap cutoff & lt 80) [34] foi usado para derivar um consenso dos resultados do bootstrap (arquivo nwk) e então desenhar árvores filogenéticas com base no arquivo nwk. O valor de corte foi definido como 80, e Streptococcus pyogenes foi usado como o grupo externo no grupo do genoma completo.

Definimos uma permutação de ordem de gene aleatória para cada arquivo GFF e, em seguida, construímos outra árvore filogenética como uma árvore nula. A informação DD relativa também foi obtida pelo GTN.

Para comparar as árvores filogenéticas calculadas pelo GTN, usamos o panX (versão 1.5.1, parâmetro padrão) para identificar os genes centrais de cópia única do grupo do genoma completo. Considerando que panX carece de um parâmetro de bootstrap, alinhamos esses genes usando mafft [35] (versão 6.864b, parâmetros padrão) e, em seguida, construímos uma árvore filogenética de máxima verossimilhança usando RAxML (versão 8.2.11, parâmetros: -e 1e-5 -p 12345 - # 1000 -m GTRGAMMA) com 1000 réplicas de bootstrap. O software MEGA também foi usado para obter um consenso dos resultados de bootstrap e desenhar a árvore filogenética.

Para otimizar o tempo de execução do GTN, desenvolvemos um método alternativo para realizar a atribuição de famílias de genes ao método BLAST + MCL. Os genes foram agrupados usando CD-HIT [36], e a sequência representativa de cada agrupamento escolhida por CH-HIT (versão 4.8.1, parâmetros: -c 0,9 -g 1 -d 60 -M 0) foi então alinhada com o banco de dados COG usando DIAMOND (versão 0.9.24.125, parâmetro: -sensitive) [37] o melhor resultado COG foi considerado como a anotação funcional para esta família de genes.

Análise de gene adjacente

Nesta versão melhorada, o GTN fornece informações sobre cada conexão de nó exclusivo no genoma (ou clado) para seu genoma (ou clado) de referência. Esses dados incluem a id do gene no arquivo GFF de produção de gene, função do gene e conexões detalhadas. Para um clado com mais de um genoma, as conexões de nós existentes em todos os genomas do clado são comparadas às conexões de nós existentes em todos os genomas do clado paralelo. Os genes pertencentes a esses nós também são identificados com base no arquivo GFF.

Enriquecimento da via KEGG

Uma vez que nem todos os genes do GBS estão registrados no banco de dados DAVID (https://david.ncifcrf.gov/) [38]. Os genes localizados nas conexões exclusivas nos seis clados principais foram alinhados contra as proteínas da cepa GBS 2603 usando BLASTP (−e 1e-5), e os melhores resultados classificados em primeiro lugar nas pontuações de alinhamento de cada alinhamento de BLASTP foram considerados para refletir os genes registrados em DAVID. Essas reflexões foram enriquecidas com o banco de dados DAVID. Essas funções não existiam na ferramenta GTN.


Existe alguma evidência de que genes associados a estruturas fisicamente adjacentes estão localizados próximos uns dos outros no genoma? - Biologia

Infelizmente, muitas pessoas têm conceitos errôneos persistentes sobre a evolução. Alguns são simples mal-entendidos - idéias que se desenvolvem no decorrer do aprendizado sobre a evolução, possivelmente a partir de experiências escolares e / ou da mídia. Outros equívocos podem resultar de tentativas propositadas de deturpar a evolução e minar a compreensão do público sobre este tópico.

Navegue pelas listas abaixo para aprender sobre os equívocos comuns sobre a evolução, bem como os esclarecimentos sobre esses equívocos. Você também pode baixar um pdf desta seção.


Equívocos sobre teoria e processos evolutivos

Equívocos sobre seleção natural e adaptação

Equívocos sobre árvores evolucionárias

Equívocos sobre genética populacional

Equívocos sobre a evolução e a natureza da ciência

Equívocos sobre a aceitação da evolução

Equívocos sobre as implicações da evolução

Equívocos sobre evolução e religião

Equívocos sobre o ensino da evolução

CONCEITO ERRADO: Evolução é uma teoria sobre a origem da vida.

CORREÇÃO: Teoria da evolução faz englobam ideias e evidências sobre as origens da vida (por exemplo, se aconteceu ou não perto de uma abertura no fundo do mar, quais moléculas orgânicas vieram primeiro, etc.), mas este não é o foco central da teoria evolucionária. A maior parte da biologia evolutiva trata de como a vida mudou depois de sua origem. Independentemente de como a vida começou, depois ela se ramificou e se diversificou, e a maioria dos estudos de evolução concentra-se nesses processos.

CORREÇÃO: Oportunidade e aleatoriedade Faz fator na evolução e na história da vida de muitas maneiras diferentes, entretanto, alguns mecanismos importantes da evolução não são aleatórios e tornam o processo geral não aleatório. Por exemplo, considere o processo de seleção natural, que resulta em adaptações & # 151 características de organismos que parecem se adequar ao ambiente em que vivem (por exemplo, o ajuste entre uma flor e seu polinizador, a resposta coordenada do sistema imunológico a patógenos e a capacidade de ecolocalização dos morcegos). Essas adaptações surpreendentes claramente não aconteceram "por acaso". Eles evoluíram por meio de uma combinação de processos aleatórios e não aleatórios. O processo de mutação, que gera variação genética, é aleatório, mas a seleção não é aleatória. A seleção favoreceu variantes que eram mais capazes de sobreviver e se reproduzir (por exemplo, para serem polinizadas, para afastar patógenos ou para navegar no escuro). Ao longo de muitas gerações de mutação aleatória e seleção não aleatória, adaptações complexas evoluíram. Dizer que a evolução acontece "por acaso" ignora metade do quadro. Para saber mais sobre o processo de seleção natural, visite nosso artigo neste tópico. Para saber mais sobre mutação aleatória, visite nosso artigo sobre DNA e mutações.

CORREÇÃO: Um importante mecanismo de evolução, seleção natural, faz resultar na evolução de habilidades aprimoradas para sobreviver e se reproduzir; no entanto, isso não significa que a evolução seja progressiva & # 151 por várias razões. Primeiro, conforme descrito em um equívoco abaixo (link para "A seleção natural produz organismos perfeitamente adequados a seus ambientes"), a seleção natural não produz organismos perfeitamente adequados a seus ambientes. Muitas vezes permite a sobrevivência de indivíduos com uma variedade de características & # 151 indivíduos que são "bons o suficiente" para sobreviver. Conseqüentemente, a mudança evolutiva nem sempre é necessária para que as espécies persistam. Muitos taxa (como alguns musgos, fungos, tubarões, gambás e lagostins) mudaram pouco fisicamente ao longo de grandes extensões de tempo. Em segundo lugar, existem outros mecanismos de evolução que não causam mudanças adaptativas. Mutação, migração e deriva genética podem fazer com que as populações evoluam de maneiras que são realmente prejudiciais em geral ou que as tornam menos adequadas para seus ambientes. Por exemplo, a população Afrikaner da África do Sul tem uma frequência excepcionalmente alta do gene responsável pela doença de Huntington porque a versão do gene mudou para alta frequência conforme a população cresceu de uma pequena população inicial. Finalmente, toda a ideia de "progresso" não faz sentido quando se trata de evolução. Os climas mudam, os rios mudam de curso, novos competidores invadem & # 151 e um organismo com características que são benéficas em uma situação pode estar mal equipado para sobreviver quando o ambiente muda. E mesmo se nos concentrarmos em um único ambiente e habitat, a ideia de como medir o "progresso" é distorcida pela perspectiva do observador. Da perspectiva de uma planta, a melhor medida de progresso pode ser a capacidade fotossintética de uma aranha; pode ser a eficiência de um sistema de liberação de veneno a partir da capacidade cognitiva de um ser humano. É tentador ver a evolução como uma grande escada progressiva com Homo sapiens emergindo no topo. Mas a evolução produz uma árvore, não uma escada & # 151 e nós somos apenas um dos muitos galhos da árvore.

CORREÇÃO: A mudança evolutiva é baseada em mudanças na composição genética das populações ao longo do tempo. As populações, não os organismos individuais, evoluem. Mudanças em um indivíduo ao longo de sua vida podem ser de desenvolvimento (por exemplo, um pássaro macho crescendo plumagem mais colorida à medida que atinge a maturidade sexual) ou podem ser causadas por como o ambiente afeta um organismo (por exemplo, um pássaro perdendo penas porque está infectados com muitos parasitas) no entanto, essas alterações não são causadas por alterações em seus genes. Embora fosse útil se houvesse uma maneira de as mudanças ambientais causarem mudanças adaptativas em nossos genes & # 151, quem não gostaria que um gene para resistência à malária viesse junto com as férias em Moçambique? & # 151 a evolução simplesmente não funciona dessa maneira. Novas variantes de genes (ou seja, alelos) são produzidas por mutação aleatória e, ao longo de muitas gerações, a seleção natural pode favorecer variantes vantajosas, fazendo com que se tornem mais comuns na população.

CORREÇÃO: A evolução ocorre lenta e gradualmente, mas também pode ocorrer rapidamente. Temos muitos exemplos de evolução lenta e constante & # 151 por exemplo, a evolução gradual das baleias a partir de seus ancestrais mamíferos que viviam na terra, conforme documentado no registro fóssil. Mas também sabemos de muitos casos em que a evolução ocorreu rapidamente. Por exemplo, temos um registro fóssil detalhado que mostra como algumas espécies de organismos unicelulares, chamados foraminíferos, desenvolveram novas formas corporais em um piscar de olhos geológicos, conforme mostrado abaixo.

Da mesma forma, podemos observar a rápida evolução acontecendo ao nosso redor o tempo todo.Nos últimos 50 anos, observamos que os esquilos evoluem em novos tempos de reprodução em resposta às mudanças climáticas, uma espécie de peixe desenvolve resistência a toxinas despejadas no rio Hudson e uma série de micróbios desenvolvem resistência a novos medicamentos que desenvolvemos. Muitos fatores diferentes podem promover uma evolução rápida & # 151 pequeno tamanho da população, curto período de geração, grandes mudanças nas condições ambientais & # 151 e as evidências deixam claro que isso aconteceu muitas vezes. Para saber mais sobre o ritmo da evolução, visite Evolution 101. Para saber mais sobre a evolução rápida em resposta às mudanças causadas pelo homem no meio ambiente, visite nossa reportagem sobre mudanças climáticas, nossa reportagem sobre a evolução de peixes resistentes ao PCB, ou nosso perfil de pesquisa sobre a evolução do tamanho dos peixes em resposta às nossas práticas de pesca.

CORREÇÃO: Conforme descrito no equívoco sobre as taxas evolutivas acima, a evolução às vezes ocorre rapidamente. E como os humanos costumam causar grandes mudanças no meio ambiente, frequentemente somos os instigadores da evolução em outros organismos. Aqui estão apenas alguns exemplos de evolução causada pelo homem para você explorar:

CORREÇÃO: A deriva genética tem um efeito maior em pequenas populações, mas o processo ocorre em todas as populações & # 151 grandes ou pequenas. A deriva genética ocorre porque, por acaso, os indivíduos que se reproduzem podem não representar exatamente a composição genética de toda a população. Por exemplo, em uma geração de uma população de camundongos em cativeiro, os indivíduos com pelo marrom podem reproduzir mais do que os indivíduos com pelo branco, fazendo com que a versão do gene que codifica para o pelo marrom aumente na população & # 151 não porque melhora a sobrevivência, apenas por causa do acaso. O mesmo processo ocorre em grandes populações: alguns indivíduos podem ter sorte e deixar muitas cópias de seus genes na próxima geração, enquanto outros podem ter azar e deixar poucas cópias. Isso faz com que as frequências de diferentes versões de genes "flutuem" de geração em geração. No entanto, em grandes populações, as mudanças na frequência gênica de geração em geração tendem a ser pequenas, enquanto em populações menores, essas mudanças podem ser muito maiores. Quer seu impacto seja grande ou pequeno, ocorre deriva genética tudo o tempo, em tudo populações. Também é importante ter em mente que a deriva genética pode atuar ao mesmo tempo que outros mecanismos de evolução, como seleção natural e migração. Para saber mais sobre deriva genética, visite Evolution 101. Para saber mais sobre o tamanho da população no que se refere à deriva genética, visite este artigo avançado.

CORREÇÃO: Os humanos agora são capazes de modificar nossos ambientes com a tecnologia. Inventamos tratamentos médicos, práticas agrícolas e estruturas econômicas que alteram significativamente os desafios de reprodução e sobrevivência enfrentados pelos humanos modernos. Então, por exemplo, porque agora podemos tratar o diabetes com insulina, as versões do gene que contribuem para o diabetes juvenil não são mais fortemente selecionadas nos países desenvolvidos. Alguns argumentaram que tais avanços tecnológicos significam que optamos por sair do jogo evolucionário e nos colocamos além do alcance da seleção natural & # 151 essencialmente, que paramos de evoluir. No entanto, este não é o caso. Os humanos ainda enfrentam desafios de sobrevivência e reprodução, mas não os mesmos que enfrentávamos há 20.000 anos. A direção, mas não o fato de nossa evolução mudou. Por exemplo, os humanos modernos que vivem em áreas densamente povoadas enfrentam maiores riscos de doenças epidêmicas do que nossos ancestrais caçadores-coletores (que não tinham contato próximo com tantas pessoas diariamente) & # 151 e esta situação favorece a disseminação de versões de genes que protegem contra essas doenças. Os cientistas descobriram muitos desses casos de evolução humana recente. Explore estes links para saber mais sobre:

CORREÇÃO: Muitos de nós estamos familiarizados com o conceito biológico de espécie, que define uma espécie como um grupo de indivíduos que realmente ou potencialmente se cruzam na natureza. Essa definição de uma espécie pode parecer cortada e seca & # 151 e para muitos organismos (por exemplo, mamíferos), ela funciona bem & # 151, mas em muitos outros casos, esta definição é difícil de aplicar. Por exemplo, muitas bactérias se reproduzem principalmente assexuadamente. Como o conceito de espécie biológica pode ser aplicado a eles? Muitas plantas e alguns animais formam híbridos na natureza, mesmo que acasalem amplamente dentro de seus próprios grupos. Os grupos que ocasionalmente hibridizam em áreas selecionadas devem ser considerados a mesma espécie ou espécies separadas? O conceito de espécie é confuso porque os humanos inventaram o conceito para ajudar a compreender a diversidade do mundo natural. É difícil de aplicar porque o termo espécie reflete nossas tentativas de dar nomes distintos a diferentes partes da árvore da vida & # 151, que não é nem um pouco discreta, mas uma teia contínua de vida, conectada de suas raízes às folhas. Para aprender mais sobre o conceito biológico de espécie, visite Evolução 101. Para aprender sobre outros conceitos de espécie, visite esta viagem paralela.

CONCEPÇÃO ERRADA: A seleção natural envolve organismos que tentam se adaptar.

CORREÇÃO: A seleção natural leva à adaptação das espécies ao longo do tempo, mas o processo não envolve esforço, tentativa ou desejo. A seleção natural resulta naturalmente da variação genética em uma população e do fato de que algumas dessas variantes podem ser capazes de deixar mais descendentes na geração seguinte do que outras variantes. Essa variação genética é gerada por mutação aleatória & # 151, um processo que não é afetado pelo que os organismos da população desejam ou pelo que estão "tentando" fazer. Ou um indivíduo tem genes que são bons o suficiente para sobreviver e se reproduzir, ou não, não pode obter os genes certos "tentando". Por exemplo, as bactérias não desenvolvem resistência aos nossos antibióticos porque "tentam" muito. Em vez disso, a resistência evolui porque a mutação aleatória acontece para gerar alguns indivíduos que são mais capazes de sobreviver ao antibiótico, e esses indivíduos podem se reproduzir mais do que outros, deixando para trás bactérias mais resistentes. Para saber mais sobre o processo de seleção natural, visite nosso artigo neste tópico. Para saber mais sobre mutação aleatória, visite nosso artigo sobre DNA e mutações.

CORREÇÃO: A seleção natural não tem intenções ou sentidos - não pode sentir o que uma espécie ou um indivíduo "precisa". A seleção natural atua sobre a variação genética em uma população, e essa variação genética é gerada por mutação aleatória & # 151, um processo que não é afetado pelas necessidades dos organismos na população. Se uma população tiver variação genética que permite que alguns indivíduos sobrevivam a um desafio melhor do que outros ou se reproduzam mais do que outros, então esses indivíduos terão mais descendentes na próxima geração e a população irá evoluir. Se essa variação genética não estiver na população, a população pode sobreviver de qualquer maneira (mas não evoluir por meio da seleção natural) ou pode morrer. Mas não será concedido o que "precisa" pela seleção natural. Para saber mais sobre o processo de seleção natural, visite nosso artigo neste tópico. Para saber mais sobre mutação aleatória, visite nosso artigo sobre DNA e mutações.

CORREÇÃO: Conforme descrito no equívoco acima, a seleção natural não fornece automaticamente aos organismos as características de que eles "precisam" para sobreviver. Claro, algum espécies podem possuir características que lhes permitem prosperar sob condições de mudanças ambientais causadas por humanos e, portanto, podem ser selecionadas, mas outras podem não e, portanto, podem ser extintas. Se uma população ou espécie não tiver os tipos certos de variação genética, ela não evoluirá em resposta às mudanças ambientais provocadas pelos humanos, sejam essas mudanças causadas por poluentes, mudanças climáticas, invasão de habitat ou outros fatores. Por exemplo, como a mudança climática faz com que o gelo marinho do Ártico se dilua e se desfaça cada vez mais cedo, os ursos polares estão tendo mais dificuldade para obter alimentos. Se as populações de ursos polares não tiverem a variação genética que permitiria a alguns indivíduos aproveitar as oportunidades de caça que não dependem do gelo marinho, eles poderiam ser extintos na natureza.

CORREÇÃO: Quando ouvimos sobre altruísmo na natureza (por exemplo, golfinhos gastando energia para apoiar um indivíduo doente ou um suricato chamando para avisar os outros de um predador que se aproxima, mesmo que isso coloque o alarme sonoro em risco extra), é tentador pensar que esses comportamentos surgiu por meio da seleção natural que favorece a sobrevivência da espécie & # 151 que a seleção natural promove comportamentos que são bons para a espécie como um todo, mesmo que sejam arriscados ou prejudiciais para os indivíduos da população. No entanto, essa impressão está incorreta. A seleção natural não tem previsão ou intenções. Em geral, a seleção natural simplesmente seleciona entre os indivíduos em uma população, favorecendo características que permitem aos indivíduos sobreviver e se reproduzir, produzindo mais cópias dos genes desses indivíduos na próxima geração. Teoricamente, de fato, uma característica que é vantajosa para o indivíduo (por exemplo, ser um predador eficiente) poderia se tornar cada vez mais frequente e acabar levando toda a população à extinção (por exemplo, se a predação eficiente realmente eliminasse toda a população de presas , deixando os predadores sem fonte de alimento).

Então, qual é a explicação evolucionária para o altruísmo se não for para o bem da espécie? Esses comportamentos podem evoluir de muitas maneiras. Por exemplo, se atos altruístas são "retribuídos" em outras ocasiões, esse tipo de comportamento pode ser favorecido pela seleção natural. Da mesma forma, se o comportamento altruísta aumenta a sobrevivência e a reprodução dos parentes de um indivíduo (que provavelmente também carregam genes altruístas), esse comportamento pode se espalhar por uma população por meio da seleção natural. Para saber mais sobre o processo de seleção natural, visite nosso artigo neste tópico.

Estudantes avançados de biologia evolutiva podem estar interessados ​​em saber que a seleção pode atuar em diferentes níveis e que, em algumas circunstâncias, pode ocorrer seleção em nível de espécie ou em nível de grupo. No entanto, é importante lembrar que, mesmo nesse caso, a seleção não tem previsão e não "visa" nenhum resultado, mas apenas favorece as unidades reprodutoras que melhor deixarem cópias de si mesmas na próxima geração. Para aprender mais sobre os níveis de seleção, visite nossa viagem paralela sobre este tópico.

CORREÇÃO: Em termos evolutivos, ginástica tem um significado muito diferente do significado comum da palavra. A aptidão evolutiva de um organismo não indica sua saúde, mas sim sua capacidade de colocar seus genes na geração seguinte. Quanto mais fértil um organismo deixar na geração seguinte, mais apto ele fica. Isso nem sempre se correlaciona com força, velocidade ou tamanho. Por exemplo, um pássaro macho franzino com penas de cauda brilhantes pode deixar para trás mais descendentes do que um macho mais forte e maçante, e uma planta delgada com grandes vagens de sementes pode deixar para trás mais descendentes do que um espécime maior & # 151, o que significa que o pássaro franzino e o as plantas finas têm maior aptidão evolutiva do que suas contrapartes maiores e mais fortes. Para saber mais sobre a aptidão evolutiva, visite Evolution 101.

CORREÇÃO: Embora "sobrevivência do mais apto" seja o bordão da seleção natural, "sobrevivência do mais apto" é mais precisa. Na maioria das populações, organismos com muitas variações genéticas diferentes sobrevivem, se reproduzem e deixam descendentes com seus genes na geração seguinte. Não são simplesmente um ou dois "melhores" indivíduos na população que passam seus genes para a próxima geração. Isso é aparente nas populações ao nosso redor: por exemplo, uma planta pode não ter os genes para florescer em uma seca, ou um predador pode não ser rápido o suficiente para pegar sua presa sempre que ela está com fome. Esses indivíduos podem não ser os "mais aptos" da população, mas são "aptos o suficiente" para se reproduzir e passar seus genes para a próxima geração. Para saber mais sobre o processo de seleção natural, visite nosso artigo neste tópico. Para saber mais sobre a aptidão evolutiva, visite Evolution 101.

CORREÇÃO: A seleção natural não é onipotente. Existem muitas razões pelas quais a seleção natural não pode produzir traços "perfeitamente projetados". Por exemplo, os seres vivos são feitos de características resultantes de um conjunto complicado de compensações & # 151 mudar uma característica para melhor pode significar mudar outra para pior (por exemplo, um pássaro com a plumagem "perfeita" da cauda para atrair parceiros talvez seja particularmente vulnerável a predadores por causa de sua longa cauda). E, claro, como os organismos surgiram por meio de histórias evolutivas complexas (não por um processo de design), sua evolução futura é freqüentemente limitada por características que eles já desenvolveram. Por exemplo, mesmo que fosse vantajoso para um inseto crescer de alguma forma diferente da muda, essa mudança simplesmente não poderia acontecer porque a muda está embutida na composição genética dos insetos em muitos níveis. Para aprender mais sobre as limitações da seleção natural, visite nosso módulo sobre equívocos sobre seleção natural e adaptação.

CORREÇÃO: Porque os seres vivos têm tantas adaptações impressionantes (camuflagem incrível, meios furtivos de capturar presas, flores que atraem apenas os polinizadores certos, etc.), é fácil assumir que tudo as características dos organismos devem ser adaptativas de alguma forma & # 151 para perceber algo sobre um organismo e automaticamente se perguntar: "Agora, o que é isso para? "Embora alguns traços sejam adaptativos, é importante ter em mente que muitos traços não são adaptações. Alguns podem ser resultados casuais da história. Por exemplo, a sequência de bases GGC codifica para o aminoácido glicina simplesmente porque é assim que aconteceu de começar & # 151 e foi assim que o herdamos de nosso ancestral comum. Não há nada de especial na relação entre GGC e glicina. É apenas um acidente histórico que permaneceu. Outras características podem ser subprodutos de outra característica. Por exemplo, a cor do sangue não é adaptativa. Não há razão para que ter sangue vermelho seja melhor do que ter sangue verde ou azul. A vermelhidão do sangue é um subproduto de sua química, que faz com que ele reflita a luz vermelha. A química do sangue pode ser uma adaptação, mas a cor do sangue não é uma adaptação. Para ler mais sobre explicações para características que não são adaptativas, visite nosso módulo sobre conceitos errados sobre seleção natural e adaptação. Para saber mais ab para saber quais características são adaptações, visite outra página no mesmo módulo.

CONCEPÇÃO ERRADA: Os táxons adjacentes nas pontas da filogenia estão mais intimamente relacionados entre si do que os táxons nas pontas mais distantes da filogenia.

CORREÇÃO: Em uma filogenia, as informações sobre parentesco são retratadas pelo padrão de ramificação, não pela ordem dos táxons nas pontas da árvore. Os organismos que compartilham um ponto de ramificação mais recente (ou seja, um ancestral comum mais recente) são mais intimamente relacionados do que os organismos conectados por um ponto de ramificação mais antigo (ou seja, um que está mais próximo da raiz da árvore). Por exemplo, na árvore abaixo, o táxon A é adjacente a B e mais distante de C e D. No entanto, o táxon A está igualmente relacionado aos táxons B, C e D. O ancestral / ponto de ramificação compartilhado por A e B é o mesmo que o ancestral / ponto de ramificação compartilhado por A e C, bem como por A e D. Da mesma forma, na árvore abaixo, o táxon B é adjacente ao táxon A, mas o táxon B está, na verdade, mais relacionado ao táxon D. Isso é porque os táxons B e D compartilham um ancestral comum mais recente (rotulado na árvore abaixo) do que os táxons B e A.

Pode ser útil lembrar que o mesmo conjunto de relacionamentos pode ser retratado de muitas maneiras diferentes. As seguintes filogenias são todas equivalentes. Embora cada filogenia abaixo tenha uma ordem diferente de taxa nas pontas da árvore, cada uma retrata o mesmo padrão de ramificação. A informação em uma filogenia está contida no padrão de ramificação, não na ordem dos táxons nas pontas da árvore.

Para aprender mais sobre filogenética, visite nosso tutorial avançado sobre o assunto.

Pode ser útil lembrar que o mesmo conjunto de relacionamentos pode ser retratado de muitas maneiras diferentes. A informação em uma filogenia está contida no padrão de ramificação, não na ordem dos táxons nas pontas da árvore. As seguintes filogenias são todas equivalentes, mas têm diferentes táxons posicionados no lado direito da filogenia. Não há relação entre a ordem dos táxons nas pontas de uma filogenia e os traços evolutivos que podem ser considerados "avançados".

Para aprender mais sobre filogenética, visite nosso tutorial avançado sobre o assunto.

CORREÇÃO: Nas filogenias, as formas ancestrais são representadas por galhos e pontos de ramificação, não pelas pontas da árvore. As pontas da árvore (onde quer que estejam localizadas & # 151 superior, inferior, direita ou esquerda) representam os descendentes, e a própria árvore representa as relações entre esses descendentes. Na filogenia abaixo, o táxon A é primo dos táxons B, C e D & # 151, não seu ancestral.

Isso é verdade mesmo se os organismos mostrados na filogenia estiverem extintos. Por exemplo, Tiktaalik (mostrado na filogenia abaixo) é um organismo extinto semelhante a um peixe que está intimamente relacionado ao ancestral dos anfíbios modernos, mamíferos e lagartos. No entanto Tiktaalik está extinto, não é uma forma ancestral e, portanto, é mostrado em uma ponta da filogenia, não como um ramo ou nó. O verdadeiro ancestral de Tiktaalik, assim como de anfíbios modernos, mamíferos e lagartos, é mostrado na filogenia abaixo.

Para aprender mais sobre filogenética, visite nosso tutorial avançado sobre o assunto.

CORREÇÃO: É a ordem dos pontos de ramificação da raiz à ponta em uma filogenia que indica a ordem em que os diferentes clados se separam & # 151 e não a ordem dos táxons nas pontas da filogenia. Na filogenia abaixo, os pontos de ramificação mais antigos e mais recentes são rotulados.

Normalmente as filogenias são apresentadas de forma que os taxa com os ramos mais longos apareçam na parte inferior ou no lado esquerdo da filogenia (como é o caso na filogenia acima). Esses clados estão conectados à filogenia pelo ponto de ramificação mais profundo e fez divergem de outros na filogenia primeiro. No entanto, é importante lembrar que o mesmo conjunto de relações pode ser representado por filogenias com diferentes ordenações de táxons nas pontas e que táxons com ramos longos nem sempre estão posicionados próximos à esquerda ou na parte inferior de uma filogenia (como mostrado abaixo).

Também é importante ter em mente que quantidades substanciais de mudança evolutiva podem ter ocorrido em uma linhagem depois que ela divergiu de outras linhagens estreitamente relacionadas. Isso significa que as características que associamos a esses taxa de ramificação longa hoje podem não ter evoluído até substancialmente depois de terem se tornado uma linhagem distinta. Para saber mais sobre isso, veja o equívoco abaixo. Para aprender mais sobre filogenética, visite nosso tutorial avançado sobre o assunto.

CORREÇÃO: Na maioria das filogenias que são vistas em livros didáticos e na imprensa popular, o comprimento do ramo não indica nada sobre a quantidade de mudança evolutiva que ocorreu ao longo desse ramo. O comprimento do galho geralmente não significa nada e é apenas uma função da ordem de ramificação da árvore. No entanto, os alunos avançados podem estar interessados ​​em saber que nas filogenias especializadas onde o comprimento do ramo faz significa algo, um ramo mais longo geralmente indica um período de tempo mais longo desde que o táxon se separou do resto dos organismos na árvore ou mais mudança evolutiva em uma linhagem! Essas filogenias geralmente podem ser identificadas por uma barra de escala ou pelo fato de que os táxons representados não se alinham para formar uma coluna ou linha. Na filogenia à esquerda abaixo, 1 o comprimento de cada ramo corresponde ao número de alterações de aminoácidos que evoluíram em uma proteína ao longo desse ramo. Em ramos mais longos, o colágeno da proteína parece ter experimentado mais mudanças evolutivas do que ao longo dos ramos mais curtos. A filogenia à direita mostra as mesmas relações, mas o comprimento do ramo não é significativo nesta filogenia. Observe a falta de barra de escala e como todos os táxons se alinham nesta filogenia.

O equívoco de que um táxon em um ramo curto passou por poucas mudanças evolutivas provavelmente surge em parte por causa de como as filogenias são construídas. Muitas filogenias são construídas usando um "grupo externo" & # 151 um táxon fora do grupo de interesse. Às vezes, um determinado grupo externo é selecionado porque se pensa ter características em comum com o ancestral do clado de interesse. O grupo externo é geralmente posicionado próximo à parte inferior ou no lado esquerdo de uma filogenia e é mostrado sem nenhum de seus parentes próximos & # 151, o que faz com que o grupo externo tenha um ramo longo. Isso significa que organismos que se acredita terem características em comum com o ancestral de um clado são frequentemente vistos com longos ramos nas filogenias. É importante ter em mente que se trata de um artefato e que não há conexão entre o comprimento do ramo longo e a pequena mudança evolutiva.

Pode ser útil lembrar que, freqüentemente, ramos longos podem parecer mais curtos simplesmente incluindo mais táxons na filogenia. Por exemplo, a filogenia à esquerda abaixo concentra-se nas relações entre répteis e, conseqüentemente, os mamíferos são mostrados como tendo um longo ramo. No entanto, se simplesmente adicionarmos mais detalhes sobre as relações entre os mamíferos (como mostrado à direita abaixo), nenhum táxon na filogenia tem um ramo particularmente longo. Ambas as filogenias estão corretas, a da direita simplesmente mostra mais detalhes sobre as relações entre os mamíferos.

Para aprender mais sobre filogenética, visite nosso tutorial avançado sobre o assunto.

CONCEITO ERRADO: Cada traço é influenciado por um locus Mendeliano.

CORREÇÃO: Antes de aprender sobre características complexas ou quantitativas, os alunos geralmente aprendem sobre características simples de Mendel controladas por um único locus & # 151, por exemplo, ervilhas redondas ou enrugadas, flores roxas ou brancas, vagens verdes ou amarelas, etc. Infelizmente, os alunos podem presumir que tudo os traços seguem esse modelo simples, mas não é o caso. Ambos os traços quantitativos (por exemplo, altura) e qualitativos (por exemplo, cor dos olhos) podem ser influenciados por vários loci e esses loci podem interagir uns com os outros e podem não seguir as regras simples de dominância Mendeliana. Em termos de evolução, esse equívoco pode ser problemático quando os alunos estão aprendendo sobre o equilíbrio de Hardy-Weinberg e a genética populacional. Os alunos podem precisar de lembretes frequentes de que os traços podem ser influenciados por mais de um locus e que esses loci podem não envolver a simples dominância.

CORREÇÃO: Antes de aprender sobre características complexas, os alunos geralmente aprendem sobre sistemas genéticos simples nos quais apenas dois alelos influenciam um fenótipo. Como os alunos podem não ter feito conexões entre a genética mendeliana e a estrutura molecular do DNA, eles podem não perceber que muitos alelos diferentes podem estar presentes em um locus e, portanto, podem presumir que todas as características são influenciadas por apenas dois alelos. Esse equívoco pode ser reforçado pelo fato de que os alunos geralmente se concentram em sistemas genéticos diplóides e pelo uso de letras maiúsculas e minúsculas para representar os alelos. O uso de subscritos para denotar diferentes alelos em um locus (bem como lembretes frequentes de que loci podem ter mais de dois alelos) pode ajudar a corrigir esse equívoco.

CONCEPÇÃO ERRADA: A evolução não é ciência porque não é observável ou testável.

CORREÇÃO: Esse equívoco engloba duas idéias incorretas: (1) que toda ciência depende de experimentos de laboratório controlados e (2) que a evolução não pode ser estudada com tais experimentos. Primeiro, muitas investigações científicas não envolvem experimentos ou observação direta. Os astrônomos não podem segurar estrelas nas mãos e os geólogos não podem voltar no tempo, mas ambos os cientistas podem aprender muito sobre o universo por meio da observação e comparação. Da mesma forma, os biólogos evolucionistas podem testar suas idéias sobre a história da vida na Terra fazendo observações no mundo real. Em segundo lugar, embora não possamos realizar um experimento que nos diga como a linhagem dos dinossauros se irradiou, nós posso estudar muitos aspectos da evolução com experimentos controlados em um ambiente de laboratório. Em organismos com tempos de geração curtos (por exemplo, bactérias ou moscas de fruta), podemos realmente observar a evolução em ação ao longo de um experimento. E, em alguns casos, os biólogos observaram a evolução ocorrendo na natureza. Para saber mais sobre a evolução rápida na natureza, visite nossa notícia sobre mudança climática, nossa notícia sobre a evolução de peixes resistentes ao PCB ou nosso perfil de pesquisa sobre a evolução do tamanho dos peixes em resposta às nossas práticas de pesca. Para saber mais sobre a natureza da ciência, visite o site Understanding Science.

CORREÇÃO: Este equívoco decorre de uma confusão entre o uso casual e científico da palavra teoria. Na linguagem do dia a dia, teoria é freqüentemente usado para significar um palpite com pouco suporte de evidências. As teorias científicas, por outro lado, são amplas explicações para uma ampla gama de fenômenos. Para ser aceita pela comunidade científica, uma teoria deve ser fortemente apoiada por muitas linhas de evidência diferentes. A evolução é uma teoria científica bem apoiada e amplamente aceita, não é "apenas" um palpite. Para saber mais sobre a natureza das teorias científicas, visite o site Understanding Science.

CORREÇÃO: Esse equívoco origina-se de um mal-entendido sobre a natureza das teorias científicas. Tudo teorias científicas (da teoria da evolução à teoria atômica) são trabalhos em andamento. À medida que novas evidências são descobertas e novas idéias são desenvolvidas, nossa compreensão de como o mundo funciona muda, assim como as teorias científicas. Embora não saibamos tudo o que há para saber sobre evolução (ou qualquer outra disciplina científica, nesse caso), sabemos muito sobre a história da vida, o padrão de divisão de linhagem ao longo do tempo e os mecanismos que causaram essas mudanças. E mais será aprendido no futuro. A teoria da evolução, como qualquer teoria científica, ainda não explica tudo o que observamos no mundo natural. No entanto, a teoria evolucionária nos ajuda a entender uma ampla gama de observações (desde o surgimento de bactérias resistentes a antibióticos até a combinação física entre os polinizadores e suas flores preferidas), faz previsões precisas em novas situações (por exemplo, tratar pacientes de AIDS com um (coquetel de medicamentos deve retardar a evolução do vírus), e tem se provado repetidamente em milhares de experimentos e estudos observacionais. Até o momento, a evolução é a única explicação bem fundamentada para a diversidade da vida. Para saber mais sobre a natureza das teorias científicas, visite o site Understanding Science.

CORREÇÃO: Embora seja verdade que existem lacunas no registro fóssil, isso não constitui evidência contra a teoria da evolução. Os cientistas avaliam hipóteses e teorias descobrindo o que esperaríamos observar se uma ideia em particular fosse verdadeira e, então, vendo se essas expectativas se confirmavam. Se a teoria da evolução fosse verdadeira, esperaríamos que houvesse formas de transição conectando espécies antigas a seus ancestrais e descendentes. Essa expectativa se confirmou. Paleontologistas tenho encontraram muitos fósseis com características de transição, e novos fósseis são descobertos o tempo todo. No entanto, se a teoria da evolução fosse verdadeira, não esperaríamos tudo dessas formas a serem preservadas no registro fóssil. Muitos organismos não possuem partes do corpo que se fossilizem bem, as condições ambientais para formar bons fósseis são raras e, claro, descobrimos apenas uma pequena porcentagem dos fósseis que podem ser preservados em algum lugar da Terra. Então cientistas Espero que para muitas transições evolutivas, haverá lacunas no registro fóssil. Para saber mais sobre como testar ideias científicas, visite o site Understanding Science. Para aprender mais sobre as transições evolutivas e os fósseis que as documentam, visite nosso módulo sobre este tópico.

CONCEPÇÃO ERRADA: A teoria da evolução é falha, mas os cientistas não o admitem.

CORREÇÃO: Os cientistas estudaram as supostas "falhas" que os grupos anti-evolução afirmam existir na teoria da evolução e não encontraram suporte para essas afirmações. Essas "falhas" são baseadas em mal-entendidos da teoria da evolução ou deturpações das evidências. À medida que os cientistas reúnem novas evidências e surgem novas perspectivas, a teoria da evolução continua a ser refinada, mas isso não significa que a teoria seja falha. A ciência é um empreendimento competitivo, e os cientistas estariam ansiosos para estudar e corrigir "falhas" na teoria da evolução, se elas existissem. Para saber mais sobre como a teoria evolucionária muda, veja nosso equívoco sobre este tópico acima.

CORREÇÃO: A teoria da evolução não está em crise, os cientistas aceitam a evolução como a melhor explicação para a diversidade da vida por causa das múltiplas linhas de evidências que a sustentam, seu amplo poder de explicar fenômenos biológicos e sua capacidade de fazer previsões precisas em uma ampla variedade de situações. Cientistas não debatem se evolução ocorreu, mas eles debatem muitos detalhes de Como as evolução ocorreu e ocorre em diferentes circunstâncias. Antievolucionistas podem ouvir os debates sobre Como as evolução ocorre e os interpreta erroneamente como debates sobre se evolução ocorre. A evolução é uma ciência sólida e é tratada de acordo com cientistas e estudiosos de todo o mundo.

CORREÇÃO: É verdade que aprendemos muito sobre a evolução desde a época de Darwin. Hoje, entendemos a base genética para a herança de características, podemos datar muitos eventos no registro fóssil em algumas centenas de milhares de anos e podemos estudar como a evolução moldou o desenvolvimento em nível molecular. Esses avanços & # 151 que Darwin provavelmente não poderia ter imaginado & # 151 expandiram a teoria da evolução e a tornaram muito mais poderosa; no entanto, eles não derrubaram os princípios básicos da evolução por seleção natural e ancestralidade comum que Darwin e Wallace estabeleceram, mas simplesmente adicionei a eles. É importante ter em mente que a elaboração, modificação e expansão de teorias científicas é uma parte normal do processo da ciência. Para saber mais sobre como a teoria evolucionária muda, veja nosso equívoco sobre este tópico acima.

CONCEPÇÃO ERRADA: A evolução leva a um comportamento imoral.

CORREÇÃO: A evolução não faz declarações éticas sobre o certo e o errado. Algumas pessoas interpretam erroneamente o fato de que a evolução moldou o comportamento animal (incluindo o comportamento humano) como suporte à ideia de que quaisquer comportamentos que sejam "naturais" são os "corretos". Este não é o caso. Cabe a nós, como sociedades e indivíduos, decidir o que constitui um comportamento ético e moral. A evolução simplesmente nos ajuda a entender como a vida mudou e continua mudando ao longo do tempo & # 151 e não nos diz se esses processos ou os resultados deles estão "certos" ou "errados". Além disso, algumas pessoas acreditam erroneamente que a evolução e a fé religiosa são incompatíveis e, portanto, presumem que aceitar a teoria da evolução incentiva o comportamento imoral. Nenhum deles está correto. Para saber mais sobre este tópico, verifique o equívoco abaixo. Para saber mais sobre a ideia de que a ciência não pode fazer declarações éticas, visite o site Understanding Science.

CORREÇÃO: No século XIX e no início do século XX, uma filosofia chamada Darwinismo Social surgiu de um esforço equivocado de aplicar as lições da evolução biológica à sociedade. O darwinismo social sugere que a sociedade deve permitir que os fracos e menos aptos falhem e morram e que esta é uma boa política e moralmente correta. Supostamente, a evolução por seleção natural forneceu suporte para essas idéias. Os preconceitos pré-existentes eram racionalizados pela noção de que nações colonizadas, pessoas pobres ou minorias desfavorecidas deviam ter merecido suas situações porque eram "menos adequados" do que aqueles que estavam em melhor situação. Nesse caso, a ciência foi mal aplicada para promover uma agenda social e política. Embora o darwinismo social como orientação política e social tenha sido amplamente rejeitado, a ideia científica da evolução biológica resistiu ao teste do tempo. Visite os Arquivos da Talk Origins para obter mais informações sobre o Darwinismo Social.

CORREÇÃO: Parte da teoria da evolução inclui a ideia de que todos os organismos na Terra estão relacionados. A linhagem humana é um pequeno galho no galho da árvore da vida que constitui todos os animais. Isso significa que, em um sentido biológico, os humanos estão animais. Compartilhamos traços anatômicos, bioquímicos e comportamentais com outros animais. Por exemplo, nós, humanos, cuidamos de nossos jovens, formamos grupos cooperativos e nos comunicamos uns com os outros, como muitos outros animais. E, claro, cada linhagem animal também possui características comportamentais que são exclusivas dessa linhagem. Nesse sentido, os humanos agem como humanos, as lesmas agem como lesmas e os esquilos agem como esquilos. É improvável que as crianças, ao saberem que são parentes de todos os outros animais, comecem a se comportar como águas-vivas ou guaxinins.

CONCEPÇÃO ERRADA: Evolução e religião são incompatíveis.

CORREÇÃO: Por causa de alguns indivíduos e grupos declararem estridentemente suas crenças, é fácil ter a impressão de que a ciência (que inclui a evolução) e a religião estão em guerra, entretanto, a ideia de que sempre se deve escolher entre ciência e religião é incorreta. Pessoas de muitas religiões e níveis de conhecimento científico diferentes não veem nenhuma contradição entre ciência e religião. Para muitas dessas pessoas, a ciência e a religião simplesmente lidam com domínios diferentes. A ciência lida com as causas naturais dos fenômenos naturais, enquanto a religião lida com crenças que estão além do mundo natural.

Claro, algumas crenças religiosas contradizem explicitamente a ciência (por exemplo, a crença de que o mundo e toda a vida nele foram criados em seis dias literais faz conflito com a teoria da evolução) no entanto, a maioria dos grupos religiosos não tem conflito com a teoria da evolução ou outras descobertas científicas. Na verdade, muitas pessoas religiosas, incluindo teólogos, sentem que uma compreensão mais profunda da natureza realmente enriquece sua fé. Além disso, na comunidade científica existem milhares de cientistas que são devotamente religiosos e também aceitam a evolução. Para declarações concisas de muitas organizações religiosas sobre a evolução, consulte Voices for Evolution no site NCSE. Para saber mais sobre a relação entre ciência e religião, visite o site Understanding Science.

CONCEPÇÃO ERRADA: Os professores devem ensinar "ambos os lados" da questão da evolução e deixar os alunos decidirem & # 151 ou dar tempo igual à evolução e ao criacionismo.

CORREÇÃO: Tempo igual não faz sentido quando os dois "lados" não são iguais. Religião e ciência são empreendimentos muito diferentes, e as visões religiosas não pertencem de forma alguma a uma sala de aula de ciências. Nas aulas de ciências, os alunos devem ter oportunidades de discutir os méritos dos argumentos e evidências no âmbito da ciência. Por exemplo, os alunos podem investigar e discutir exatamente onde os pássaros se ramificam na árvore da vida: antes dos dinossauros ou dentro do clado dos dinossauros. Em contraste, um debate que opõe um conceito científico a uma crença religiosa não tem lugar em uma aula de ciências e sugere erroneamente que uma "escolha" entre os dois deve ser feita. O argumento da "justiça" tem sido usado por grupos que tentam insinuar suas crenças religiosas nos currículos de ciências. Para aprender mais sobre a ideia de que evolução e religião não precisam ser incompatíveis, veja o equívoco acima. Para saber mais sobre por que as visões religiosas sobre a criação não são ciência e, portanto, não pertencem às salas de aula de ciências, visite o site Understanding Science.

CORREÇÃO: Este argumento falacioso é baseado na ideia de que evolução e religião são fundamentalmente iguais, uma vez que ambas são "sistemas de crenças". Essa ideia é simplesmente incorreta. A crença em ideias religiosas é baseada na fé, e a religião lida com tópicos além do reino do mundo natural. A aceitação de idéias científicas (como a evolução) é baseada em evidências do mundo natural, e a ciência se limita a estudar os fenômenos e processos do mundo natural. O Supremo Tribunal Federal e outras decisões do tribunal federal diferenciam claramente a ciência da religião e não permitem a defesa da doutrina religiosa nas aulas de ciências (ou outras escolas públicas). Outras decisões defendem especificamente o direito de um distrito escolar de exigir o ensino da evolução. Para obter informações adicionais sobre decisões judiciais significativas envolvendo educação evolutiva, visite o site NCSE. Para saber mais sobre a diferença entre ciência e religião, visite o site Understanding Science.


Referências

Ohno S, Wolf U, Atkin NB. Evolução de peixes para mamíferos por duplicação de genes. Hereditas. 196759: 169–87. https://doi.org/10.1111/j.1601-5223.1968.tb02169.x.

Zhang J. Evolução por duplicação de genes: uma atualização. Trends Ecol Evol. 200318: 292–8. https://doi.org/10.1016/S0169-5347(03)00033-8.

De Smet R, Sabaghian E, Li Z, Saeys Y, Van de Peer Y. Divergência funcional coordenada de genes após a duplicação do genoma em Arabidopsis thaliana. Plant Cell. 201729: 2786–800. https://doi.org/10.1105/TPC.17.00531.

Osborn TC, Chris Pires J, Birchler JA, Auger DL, Jeffery Chen Z, Lee H-S, et al. Compreendendo os mecanismos de expressão de novos genes em poliplóides. Trends Genet. 200319: 141–7. https://doi.org/10.1016/S0168-9525(03)00015-5.

Crow KD, Wagner GP. Qual é o papel da duplicação do genoma na evolução da complexidade e diversidade? Mol Biol Evol. 200623: 887–92. https://doi.org/10.1093/molbev/msj083.

Yao Y, Carretero-Paulet L, Van de Peer Y. Usando organismos digitais para estudar as consequências evolutivas da duplicação do genoma inteiro e poliploidia. PLoS One. 201914: e0220257. https://doi.org/10.1371/journal.pone.0220257.

Landis JB, Soltis DE, Li Z, Marx HE, Barker MS, Tank DC, et al. Impacto de eventos de duplicação do genoma inteiro nas taxas de diversificação em angiospermas. Am J Bot. 2018105: 348–63. https://doi.org/10.1002/ajb2.1060.

Tank DC, Eastman JM, Pennell MW, Soltis PS, Soltis DE, Hinchliff CE, et al. Radiações aninhadas e o pulso de diversificação de angiospermas: taxas de diversificação aumentadas freqüentemente seguem duplicações do genoma inteiro. Fonte New Phytol. 2015207: 454–67. https://doi.org/10.2307/newphytologist.207.2.454.

Schranz ME, Mohammadin S, Edger PP. Duplicações de genomas inteiros antigos, novidade e diversificação: o modelo de atraso de radiação WGD. Curr Opin Plant Biol. 201215: 147–53.https://doi.org/10.1016/J.PBI.2012.03.011.

Mayrose I, Zhan SH, Rothfels CJ, Magnuson-Ford K., Barker MS, Rieseberg LH, et al. As plantas poliplóides recentemente formadas diversificam-se a taxas mais baixas. Ciência. 2011333: 1257. https://doi.org/10.1126/science.1207205.

Van de Peer Y, Maere S, Meyer A. O significado evolutivo das duplicações do genoma antigo. Nat Rev Genet. 200910: 725–32. https://doi.org/10.1038/nrg2600.

Mable BK. ‘Por que a poliploidia é mais rara em animais do que em plantas’: mitos e mecanismos. Biol J Linn Soc. 200482: 453–66. https://doi.org/10.1111/j.1095-8312.2004.00332.x.

Muller HJ. Por que a poliploidia é mais rara em animais do que em plantas. Am Nat. 192559: 346–53. https://doi.org/10.1086/280047.

Orr HA. “Por que a poliploidia é mais rara em animais do que em plantas” revisitou. Am Nat. 1990136: 759–70. https://doi.org/10.1086/285130.

Hallinan NM, Lindberg DR. A análise comparativa das contagens de cromossomos infere três Paleopoliploidias no Mollusca. Genome Biol Evol. 20113: 1150–63. https://doi.org/10.1093/gbe/evr087.

Kenny NJ, Chan KW, Nong W, Qu Z, Maeso I, Yip HY, et al. Duplicação ancestral do genoma total nos caranguejos-ferradura quelicerato marinho. Hereditariedade. 2016116: 190–9. https://doi.org/10.1038/hdy.2015.89.

Clarke TH, Garb JE, Hayashi CY, Arensburger P, Ayoub NA. Os transcriptomas de aranha identificam eventos de duplicação de genes em larga escala, potencialmente importantes na evolução da glândula da seda. Genome Biol Evol. 20157: 1856–70. https://doi.org/10.1093/gbe/evv110.

Li Z, Tiley GP, Galuska SR, Reardon CR, Kidder TI, Rundell RJ, et al. Múltiplas duplicações de genes e genomas em grande escala durante a evolução dos hexápodes. Proc Natl Acad Sci U S A. 2018115: 4713–8. https://doi.org/10.1073/pnas.1710791115.

Schwager EE, Sharma PP, Clarke T, Leite DJ, Wierschin T, Pechmann M, et al. O genoma da aranha doméstica revela uma antiga duplicação do genoma completo durante a evolução dos aracnídeos. BMC Biol. 201715: 62. https://doi.org/10.1186/s12915-017-0399-x.

Leite DJ, McGregor AP. Evolução e desenvolvimento de artrópodes: descobertas recentes de queliceratos e miriápodes. Curr Opin Genet Dev. 201639: 93–100. https://doi.org/10.1016/J.GDE.2016.06.002.

Zwaenepoel A, Li Z, Lohaus R, Van de Peer Y. Encontrar evidências para duplicações do genoma inteiro: uma reavaliação. Mol Plant. 201912: 133–6. https://doi.org/10.1016/J.MOLP.2018.12.019.

Zwaenepoel A, Van de Peer Y. Inferência de duplicações de todo o genoma antigo e a evolução da duplicação de genes e taxas de perda. Mol Biol Evol. 201936: 1384–404. https://doi.org/10.1093/molbev/msz088.

Nakatani Y, análise de McLysaght A. Macrosynteny mostra a ausência de duplicação de todo o genoma antigo em insetos lepidópteros. Proc Natl Acad Sci U S A. 2019116: 1816–8. https://doi.org/10.1073/pnas.1817937116.

Vanneste K, Van de Peer Y, Maere S. Inference of genome duplications from age distributions revisited. Mol Biol Evol. 201330: 177–90. https://doi.org/10.1093/molbev/mss214.

Tiley GP, Barker MS, Burleigh JG. Avaliação do desempenho de plotagens Ks para detecção de duplicações de genomas inteiros antigos. Genome Biol Evol. 201810: 2882–98. https://doi.org/10.1093/gbe/evy200.

Jaillon O, Aury J-M, Brunet F, Petit J-L, Stange-Thomann N, Mauceli E, et al. A duplicação do genoma no peixe teleósteo Tetraodon nigroviridis revela o proto-cariótipo dos vertebrados primitivos. Natureza. 2004431: 946–57. https://doi.org/10.1038/nature03025.

Kellis M, Birren BW, Lander ES. Prova e análise evolutiva da duplicação do genoma antigo na levedura Saccharomyces cerevisiae. Natureza. 2004428: 617–24. https://doi.org/10.1038/nature02424.

Nakatani Y, McLysaght A. Genomes como documentos da história evolutiva: um modelo de macrossintenia probabilística para a reconstrução de genomas ancestrais. Bioinformática. 201733: i369–78. https://doi.org/10.1093/bioinformatics/btx259.

Van de Peer Y. Abordagens computacionais para revelar duplicações de genomas antigos. Nat Rev Genet. 20045: 752–63. https://doi.org/10.1038/nrg1449.

Schrader L, Schmitz J. O impacto dos elementos transponíveis na evolução adaptativa. Mol Ecol. 201928: 1537–49. https://doi.org/10.1111/mec.14794.

Jiao Y, Wickett NJ, Ayyampalayam S, Chanderbali AS, Landherr L, Ralph PE, et al. Poliploidia ancestral em plantas com sementes e angiospermas. Natureza. 2011473: 97–100.

Li Z, Baniaga AE, Sessa EB, Scascitelli M, Graham SW, Rieseberg LH, et al. Duplicações iniciais do genoma em coníferas e outras plantas com sementes. Sci Adv. 20151: e1501084. https://doi.org/10.1126/sciadv.1501084.

Ruprecht C, Lohaus R, Vanneste K., Mutwil M, Nikoloski Z, Van de Peer Y, et al. Revisitando a poliploidia ancestral nas plantas. Sci Adv. 20173: e1603195. https://doi.org/10.1126/sciadv.1603195.

Lynch M, Conery JS. O destino evolucionário e consequências de genes duplicados. Ciência. 2000290: 1151–5. https://doi.org/10.1126/science.290.5494.1151.

Faddeeva-Vakhrusheva A, Kraaijeveld K, Derks MFL, Anvar SY, Agamennone V, Suring W, et al. Lidando com a vida no solo: o genoma do springtail partenogenético Folsomia candida. BMC Genomics. 201718: 493–506. https://doi.org/10.1186/s12864-017-3852-x.

Mahmudi O, Sjöstrand J, Sennblad B, Lagergren J. Análise de reconciliação probabilística de todo o genoma entre vertebrados. BMC Bioinformatics. 201314 (Suplemento 15): S10. https://doi.org/10.1186/1471-2105-14-S15-S10.

Rabier C-E, Ta T, Ané C. Detectando e localizando duplicações do genoma inteiro em uma filogenia: uma abordagem probabilística. Mol Biol Evol. 201431: 750–62. https://doi.org/10.1093/molbev/mst263.

Hahn MW, Han MV, Han S-G. Evolução da família de genes em 12 genomas de Drosophila. PLoS Genet. 20073: e197. https://doi.org/10.1371/journal.pgen.0030197.

Taylor JS, Raes J. Duplicação e divergência: a evolução de novos genes e velhas ideias. Annu Rev Genet. 200438: 615–43.

Simillion C, Vandepoele K, Van Montagu MCE, Zabeau M, Van de Peer Y. O passado de duplicação oculto de Arabidopsis thaliana. Proc Natl Acad Sci U S A. 200299: 13627–32. https://doi.org/10.1073/pnas.212522399.

Mandáková T, Lysak MA. Diploidização pós-poliploide e diversificação por meio de mudanças disploides. Curr Opin Plant Biol. 201842: 55–65. https://doi.org/10.1016/J.PBI.2018.03.001.

Lysak MA, Berr A, Pecinka A, Schmidt R, McBreen K, Schubert I. Mecanismos de redução do número de cromossomos em Arabidopsis thaliana e espécies relacionadas de Brassicaceae. Proc Natl Acad Sci U S A. 2006103: 5224–9. https://doi.org/10.1073/pnas.0510791103.

Liu D, Hunt M, Tsai IJ. Inferindo sintaxe entre conjuntos de genoma: uma avaliação sistemática. BMC Bioinformatics. 201819: 26. https://doi.org/10.1186/s12859-018-2026-4.

Lyons E, Pedersen B, Kane J, Freeling M. O valor de genomas não-modelo e um exemplo usando SynMap dentro de CoGe para dissecar a hexaploidia que antecede os rosídeos. https://doi.org/10.1007/s12042-008-9017-y.

Pace RM, Grbić M, Nagy LM. Composição e organização genômica de agrupamentos de artrópodes Hox. Evodevo. 20167: 1-11. https://doi.org/10.1186/s13227-016-0048-4.

Harrison MC, Jongepier E, Robertson HM, Arning N, Bitard-Feildel T, Chao H, et al. Os genomas hemimetábolos revelam as bases moleculares da eussocialidade dos cupins. Nat Ecol Evol. 20182: 557–66. https://doi.org/10.1038/s41559-017-0459-1.

Terrapon N, Li C, Robertson HM, Ji L, Meng X, Booth W, et al. Traços moleculares de organização social alternativa em um genoma de cupins. Nat Commun. 20145: 3636. https://doi.org/10.1038/ncomms4636.

Richards S, Gibbs RA, Gerardo NM, Moran N., Nakabachi A, Stern D, et al. Sequência do genoma do pulgão Acyrthosiphon pisum. PLoS Biol. 20108: e1000313. https://doi.org/10.1371/journal.pbio.1000313.

Duboule D. A ascensão e queda dos aglomerados de genes Hox. Desenvolvimento. 2007134: 2549–60.

Fiston-Lavier A-S, Anxolabehere D, Quesneville H. Um modelo de formação de duplicação segmentar em Drosophila melanogaster. Genome Res. 200717: 1458–70. https://doi.org/10.1101/gr.6208307.

Bailey JA, Liu G, Eichler EE. Um modelo de transposição Alu para a origem e expansão de duplicações segmentares humanas. Am J Hum Genet. 200373: 823–34. https://doi.org/10.1086/378594.

Schrader L, Kim JW, Ence D, Zimin A, Klein A, Wyschetzki K, et al. As ilhas de elementos transponíveis ARTIGO facilitam a adaptação a novos ambientes em uma espécie invasora. Nat Commun. 20145 https://doi.org/10.1038/ncomms6495.

Petersen M, Armisén D, Gibbs RA, Hering L, Khila A, Mayer G, et al. Diversidade e evolução do repertório de elementos transponíveis em artrópodes, com particular referência para insetos. BMC Evol Biol. 201919: 11. https://doi.org/10.1186/s12862-018-1324-9.

Le Rouzic A, Payen T, Hua-Van A. Reconstruindo a história evolutiva dos elementos transponíveis. Genome Biol Evol. 20135: 77–86. https://doi.org/10.1093/gbe/evs130.

Zwaenepoel A, Van de Peer Y. Wgd - ferramentas de linha de comando simples para a análise de antigas duplicações do genoma inteiro. Bioinformática. 201935: 2153–5. https://doi.org/10.1093/bioinformatics/bty915.

Enright AJ, Van Dongen S, Ouzounis CA. Um algoritmo eficiente para detecção em larga escala de famílias de proteínas. Nucleic Acids Res. 200230: 1575–84. https://doi.org/10.1093/nar/30.7.1575.

Katoh K, Standley DM. Software de alinhamento de sequência múltipla MAFFT versão 7: melhorias em desempenho e usabilidade. Mol Biol Evol. 201330: 772–80. https://doi.org/10.1093/molbev/mst010.

Yang Z. PAML 4: análise filogenética por máxima verossimilhança. Mol Biol Evol. 200724: 1586–91. https://doi.org/10.1093/molbev/msm088.

Preço MN, Dehal PS, Arkin AP. FastTree 2 - árvores de verossimilhança aproximadamente máxima para grandes alinhamentos. PLoS One. 20105: e9490. https://doi.org/10.1371/journal.pone.0009490.

Wang Y, Tang H, DeBarry JD, Tan X, Li J, Wang X, et al. MCScanX: um kit de ferramentas para detecção e análise evolutiva de sintenias e colinearidades gênicas. Nucleic Acids Res. 201240: 2–14. https://doi.org/10.1093/nar/gkr1293.

Krzywinski M, Schein J, Birol I, Connors J, Gascoyne R, Horsman D, et al. Circos: uma estética da informação para genômica comparada. Genome Res. 200919: 1639–45. https://doi.org/10.1101/gr.092759.109.

Kumar S, Stecher G, Suleski M, Hedges SB. TimeTree: um recurso para cronogramas, tabelas de horários e tempos de divergência. Mol Biol Evol. 201734: 1812–9.

Emms DM, Kelly S. OrthoFinder: resolvendo vieses fundamentais em comparações de genoma inteiro melhora drasticamente a precisão da inferência de ortogrupo. Genome Biol. 201516: 157. https://doi.org/10.1186/s13059-015-0721-2.

Whelan S, Irisarri I, Burki F. PREQUAL: detecção de caracteres não homólogos em conjuntos de sequências homólogas não alinhadas. Bioinformática. 2018 https://doi.org/10.1093/bioinformatics/bty448.

Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, et al. MrBayes 3.2: inferência filogenética Bayesiana eficiente e escolha de modelo em um grande espaço de modelo. Syst Biol. 201261: 539–42. https://doi.org/10.1093/sysbio/sys029.

Szöllősi GJ, Rosikiewicz W, Boussau B, Tannier E, Daubin V. Exploração eficiente do espaço de árvores genéticas reconciliadas. Syst Biol. 201362: 901–12. https://doi.org/10.1093/sysbio/syt054.

Manni M, Simão FA, Robertson HM, Gabaglio MA, Waterhouse RM, Misof B, et al. O genoma do diplurano cego que vivia no solo e ancestralmente sem asas Campodea augens, um hexápodo de referência para estudar o surgimento de inovações em insetos. Pré-impressão em https://www.biorxiv.org/content/10.1101/585695v3. https://doi.org/10.1101/585695.

Dudchenko O, Batra SS, Omer AD, Nyquist SK, Hoeger M, Durand NC, et al. A montagem de novo do genoma de Aedes aegypti usando Hi-C produz estruturas de comprimento de cromossomo. Ciência. 2017356: 92–5.

Evans JD, Mckenna D, Scully E, Cook SC, Dainat B, Egekwu N, et al. O genoma do pequeno besouro da colmeia (Aethina tumida, Coleoptera: Nitidulidae), um parasita mundial de colônias de abelhas sociais, fornece informações sobre a desintoxicação e a herbivoria. Giga Sci. 20187: 1–16. https://doi.org/10.1093/gigascience/giy138.

Weinstock GM, Robinson GE, Gibbs RA, Worley KC, Evans JD, Maleszka R, et al. Insights sobre insetos sociais a partir do genoma da abelha Apis mellifera. Natureza. 2006443: 931–49.

Mine S, Sumitani M, Aoki F, Hatakeyama M, Suzuki MG. Identificação e caracterização funcional do gene determinante do sexo doublesex na mosca-serra, Athalia rosae (Hymenoptera: Tenthredinidae). Appl Entomol Zool. 201752: 497–509.

Chen W, Hasegawa DK, Kaur N., Kliot A, Pinheiro PV, Luan J, et al. O esboço do genoma da mosca-branca Bemisia tabaci MEAM1, uma praga global de cultivo, fornece novos insights sobre a transmissão do vírus, adaptação do hospedeiro e resistência a inseticidas. BMC Biol. 201614: 110. https://doi.org/10.1186/s12915-016-0321-y.

Xia Q, Wang J, Zhou Z, Li R, Fan W, Cheng D, et al. O genoma de um inseto modelo lepidóptero, o bicho-da-seda Bombyx mori. Insect Biochem Mol Biol. 200838: 1036–45.

Driscoll TP, Verhoeve VI, Gillespie JJ, Johnston JS, Guillotte ML, Rennoll-Bankert KE, et al. Pulgas de gatos em fluxo: duplicação generalizada de genes, plasticidade do tamanho do genoma e infecção por Wolbachia paradoxal. Pré-impressão em https://www.biorxiv.org/content/10.1101/2020.04.14.038018v1. https://doi.org/10.1101/2020.04.14.038018.

Hoskins RA, Carlson JW, Wan KH, Park S, Mendez I, Galle SE, et al. A sequência de referência de liberação 6 do genoma de Drosophila melanogaster. Genome Res. 201525: 445–58.

Rotenberg D, Baumann AA, Ben-Mahmoud S, Christiaens O, Dermauw W, Ioannidis P, et al. Percepções habilitadas pelo genoma sobre a biologia dos tripes como pragas agrícolas. Pré-impressão em https://www.biorxiv.org/content/10.1101/2020.02.12.941716v1.full. https://doi.org/10.1101/2020.02.12.941716.

Wu C, Jordan MD, Newcomb RD, Gemmell NJ, Bank S, Meusemann K, et al. A análise do genoma do colêmbolos gigante da Nova Zelândia (Holacanthella duospinosa) lança luz sobre a evolução dos hexápodes. BMC Genomics. 201718: 1-19. https://doi.org/10.1186/s12864-017-4197-1.

Marca P, Lin W, Johnson BR. O esboço do genoma da bengala invasiva, Medauroidea extradendata, revela extensas expansões da família de genes específicos de linhagem de enzimas degradantes da parede celular em Phasmatodea. Genes G3, genomas. Genet. 20188: 1403–8.

Faddeeva-Vakhrusheva A, Derks MFL, Anvar SY, Agamennone V, Suring W, Smit S, et al. A evolução da família de genes reflete a adaptação aos estressores ambientais do solo no genoma da colêmbola Orchesella cincta. Genome Biol Evol. 20168: 2106–17. https://doi.org/10.1093/gbe/evw134.

Johnston JS, Yoon KS, Strycharz JP, Pittendrigh BR, Clark JM. Os piolhos do corpo e da cabeça (Anoplura: Pediculidae) têm os menores genomas de qualquer inseto hemimetábolo relatado até o momento. J Med Entomol. 200744: 1009–12. https://doi.org/10.1093/jmedent/44.6.1009.

Grishin NV, Shen J, Cong Q, Kinch LN, Borek D, Otwinowski Z. Genoma completo de Pieris Rapae, um alienígena resiliente, uma praga do repolho e uma fonte de proteínas anticâncer. F1000Research. 20165: 2631. https://doi.org/10.12688/f1000research.9765.1.

Kim HS, Murphy T, Xia J, Caragea D, Park Y, Beeman RW, et al. BeetleBase em 2010: revisões para fornecer informações genômicas abrangentes para Tribolium castaneum. Nucleic Acids Res. 200938: D437–42. https://doi.org/10.1093/nar/gkp807.

Battelle B-A, Ryan JF, Kempler KE, Saraf SR, Marten CE, Warren WC, et al. Repertório de opsina e padrões de expressão em caranguejos-ferradura: evidências do genoma de Limulus polyphemus (Arthropoda: Chelicerata). Genome Biol Evol. 20168: 1571–89. https://doi.org/10.1093/gbe/evw100.


Notas de rodapé

↵ 2 Endereço atual: Departamento de Biologia, Seattle Pacific University, Seattle, WA 98119.

Contribuição dos autores: T.C.B. e B.G. pesquisa projetada T.C.B., J.R.T., K.A.P., E.O.N., S.C.T., D.N.M. e J.G. realizou pesquisas T.C.B., F.W.S., J.R.W., Q.L., C.D.J. e M.Y. dados analisados ​​J.R.T., E.O.N. e S.C.T. material isolado para sequenciamento J.R.W. e C.D.J. realizou o sequenciamento e montagem da Pacific Biosciences Q.L. e meu. realizou a anotação do genoma D.N.M. e J.G. executou o sequenciamento e montagem da Illumina e o T.C.B. e B.G. escreveu o jornal.

Os autores declaram não haver conflito de interesses.

Este artigo é uma submissão direta do PNAS.

Deposição de dados: Este projeto Whole Genome Shotgun foi depositado no banco de dados DDBJ / EMBL / GenBank (número de acesso LMYF00000000). A versão descrita neste documento é a versão LMYF01000000.


Assista o vídeo: Genoma, Cromossomo, DNA e Gene (Fevereiro 2023).