Em formação

Genômica * - Biologia

Genômica * - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Genômica

O estudo dos ácidos nucléicos começou com a descoberta do DNA, progrediu para o estudo de genes e pequenos fragmentos, e agora explodiu para o campo da genômica. Genômica é o estudo de genomas inteiros, incluindo o conjunto completo de genes, sua sequência e organização de nucleotídeos e suas interações dentro de uma espécie e com outras espécies. Os avanços na genômica foram possibilitados pela tecnologia de sequenciamento de DNA. Assim como a tecnologia da informação levou ao Google Maps, permitindo-nos obter informações detalhadas sobre locais ao redor do globo, as informações genômicas são usadas para criar mapas semelhantes do DNA de diferentes organismos.

Mapeando genomas

O mapeamento do genoma é o processo de encontrar a localização dos genes em cada cromossomo. Os mapas criados são comparáveis ​​aos mapas que usamos para navegar nas ruas. UMA mapa genético é uma ilustração que lista genes e sua localização em um cromossomo. Os mapas genéticos fornecem uma visão geral (semelhante a um mapa de rodovias interestaduais) e usam marcadores genéticos (semelhantes a marcos). Um marcador genético é um gene ou sequência em um cromossomo que mostra ligação genética com uma característica de interesse. O marcador genético tende a ser herdado com o gene de interesse. Uma medida da distância entre eles é a frequência de recombinação durante a meiose; os primeiros geneticistas chamavam isso de análise de ligação.

Mapas físicos entrar nos detalhes íntimos de regiões menores dos cromossomos (semelhante a um mapa detalhado). Um mapa físico é uma representação da distância física, em nucleotídeos, entre genes ou marcadores genéticos. Ambos os mapas de ligação genética e mapas físicos são necessários para construir uma imagem completa do genoma. Ter um mapa completo do genoma torna mais fácil para os pesquisadores estudar genes individuais. Os mapas do genoma humano ajudam os pesquisadores em seus esforços para identificar genes humanos causadores de doenças relacionadas a doenças como câncer, doenças cardíacas e fibrose cística, para citar alguns. Além disso, o mapeamento do genoma pode ser usado para ajudar a identificar organismos com características benéficas, como micróbios com a capacidade de limpar poluentes ou mesmo prevenir a poluição. Pesquisas envolvendo o mapeamento do genoma de plantas podem levar a métodos agrícolas que geram maiores rendimentos agrícolas ou ao desenvolvimento de plantas que se adaptam melhor às mudanças climáticas.

Figura 1. Este é um mapa físico do cromossomo X humano.

Crédito: modificação do trabalho por NCBI, NIH

Os mapas genéticos fornecem o contorno e os mapas físicos fornecem os detalhes. É fácil entender por que os dois tipos de técnicas de mapeamento do genoma são importantes para mostrar o quadro geral. As informações obtidas de cada técnica são usadas em combinação para estudar o genoma. O mapeamento genômico é usado com diferentes organismos modelo que são usados ​​para pesquisa. O mapeamento do genoma ainda é um processo contínuo e, à medida que técnicas mais avançadas são desenvolvidas, mais avanços são esperados. O mapeamento do genoma é semelhante a completar um quebra-cabeça complicado usando todos os dados disponíveis. As informações de mapeamento geradas em laboratórios de todo o mundo são inseridas em bancos de dados centrais, como o National Center for Biotechnology Information (NCBI). Esforços são feitos para tornar as informações mais acessíveis aos pesquisadores e ao público em geral. Assim como usamos sistemas de posicionamento global em vez de mapas de papel para navegar pelas estradas, o NCBI nos permite usar uma ferramenta de visualização do genoma para simplificar o processo de mineração de dados.

Sequenciamento do genoma completo

Embora tenha havido avanços significativos nas ciências médicas nos últimos anos, os médicos ainda estão confusos com muitas doenças e os pesquisadores estão usando o sequenciamento do genoma inteiro para chegar ao fundo do problema. Sequenciamento do genoma completo é um processo que determina a sequência de DNA de um genoma inteiro. O sequenciamento do genoma completo é uma abordagem de força bruta para a solução de problemas quando há uma base genética no cerne de uma doença. Vários laboratórios agora fornecem serviços para sequenciar, analisar e interpretar genomas inteiros.

Em 2010, o sequenciamento do genoma inteiro foi usado para salvar um menino cujos intestinos apresentavam múltiplos abscessos misteriosos. A criança passou por várias operações de cólon sem alívio. Finalmente, toda uma sequência do genoma revelou um defeito em uma via que controla a apoptose (morte celular programada). Um transplante de medula óssea foi usado para superar essa doença genética, levando à cura do menino. Ele foi a primeira pessoa a ser diagnosticada com sucesso usando o sequenciamento do genoma completo.

Os primeiros genomas a serem sequenciados, como os pertencentes a vírus, bactérias e leveduras, eram menores em termos de número de nucleotídeos do que os genomas de organismos multicelulares. Os genomas de outros organismos modelo, como o rato (Mus musculus), a mosca da fruta (Drosophila melanogaster), e o nematóide (Caenorhabditis elegans) agora são conhecidos. Grande parte da pesquisa básica é realizada em organismos modelo porque a informação pode ser aplicada a outros organismos. Um organismo modelo é uma espécie que é estudada como modelo para compreender os processos biológicos em outras espécies que podem ser representados pelo organismo modelo. Por exemplo, as moscas da fruta são capazes de metabolizar o álcool como os humanos, então os genes que afetam a sensibilidade ao álcool foram estudados em moscas da fruta em um esforço para entender a variação na sensibilidade ao álcool em humanos. Ter genomas inteiros sequenciados ajuda nos esforços de pesquisa nesses organismos modelo.

Figura 2. Muitas pesquisas básicas são feitas com organismos modelo, como o camundongo, Mus musculus; a mosca da fruta, Drosophila melanogaster; o nematóide, Caenorhabditis elegans; a levedura, Saccharomyces cerevisiae; e a erva daninha comum, Arabidopsis thaliana.

Crédito: "mouse": modificação da obra de Florean Fortescuecredit; "nematóides": modificação do trabalho por "snickclunk" / Flickr; "erva daninha comum": modificação do trabalho de Peggy Greb, USDA; dados de barra de escala de Matt Russell

A primeira sequência do genoma humano foi publicada em 2003. O número de genomas inteiros que foram sequenciados aumenta constantemente e agora inclui centenas de espécies e milhares de genomas humanos individuais.

Aplicando genômica

A introdução de projetos de sequenciamento de DNA e de sequenciamento de genoma completo, particularmente o Projeto Genoma Humano, expandiu a aplicabilidade das informações de sequência de DNA. A genômica agora está sendo usada em uma ampla variedade de campos, como metagenômica, farmacogenômica e genômica mitocondrial. A aplicação mais comumente conhecida da genômica é entender e encontrar curas para doenças.

Prevendo risco de doença em nível individual

A previsão do risco de doença envolve a triagem e a identificação de indivíduos atualmente saudáveis ​​por meio da análise do genoma em nível individual. A intervenção com mudanças no estilo de vida e medicamentos pode ser recomendada antes do início da doença. No entanto, essa abordagem é mais aplicável quando o problema surge de uma mutação de um único gene. Esses defeitos representam apenas cerca de cinco por cento das doenças encontradas nos países desenvolvidos. A maioria das doenças comuns, como as cardiopatias, é multifatorial ou poligênica, que se refere a uma característica fenotípica determinada por dois ou mais genes, e também a fatores ambientais, como a dieta alimentar. Em abril de 2010, cientistas da Universidade de Stanford publicaram a análise do genoma de um indivíduo saudável (Stephen Quake, um cientista da Universidade de Stanford, que teve seu genoma sequenciado); a análise previu sua propensão a adquirir várias doenças. Uma avaliação de risco foi feita para analisar a porcentagem de risco de terremoto para 55 condições médicas diferentes. Foi encontrada uma rara mutação genética que mostrou que ele corria o risco de um ataque cardíaco repentino. Ele também teria um risco de 23% de desenvolver câncer de próstata e 1,4% de desenvolver a doença de Alzheimer. Os cientistas usaram bancos de dados e várias publicações para analisar os dados genômicos. Embora o sequenciamento genômico esteja se tornando mais acessível e as ferramentas analíticas cada vez mais confiáveis, as questões éticas que cercam a análise genômica em nível populacional ainda precisam ser abordadas. Por exemplo, esses dados poderiam ser usados ​​legitimamente para cobrar mais ou menos pelo seguro ou para afetar as classificações de crédito?

Estudos de associação de todo o genoma

Desde 2005, é possível realizar um tipo de estudo denominado estudo de associação do genoma, ou GWAS. Um GWAS é um método que identifica diferenças entre indivíduos em polimorfismos de nucleotídeo único (SNPs) que podem estar envolvidos em causar doenças. O método é particularmente adequado para doenças que podem ser afetadas por uma ou mais alterações genéticas em todo o genoma. É muito difícil identificar os genes envolvidos em tal doença usando informações de história familiar. O método GWAS se baseia em um banco de dados genético que está em desenvolvimento desde 2002, denominado International HapMap Project. O Projeto HapMap sequenciou os genomas de várias centenas de indivíduos de todo o mundo e identificou grupos de SNPs. Os grupos incluem SNPs que estão localizados próximos uns dos outros nos cromossomos, de modo que tendem a permanecer juntos durante a recombinação. O fato de o grupo permanecer junto significa que identificar um SNP do marcador é tudo o que é necessário para identificar todos os SNPs no grupo. Existem vários milhões de SNPs identificados, mas identificá-los em outros indivíduos que não tiveram seu genoma completo sequenciado é muito mais fácil porque apenas os SNPs marcadores precisam ser identificados.

Em um projeto comum para um GWAS, dois grupos de indivíduos são escolhidos; um grupo tem a doença e o outro não. Os indivíduos em cada grupo são pareados em outras características para reduzir o efeito de variáveis ​​de confusão que causam diferenças entre os dois grupos. Por exemplo, os genótipos podem ser diferentes porque os dois grupos são, em sua maioria, retirados de diferentes partes do mundo. Uma vez que os indivíduos são escolhidos, e normalmente seu número é de mil ou mais para o estudo funcionar, amostras de seu DNA são obtidas. O DNA é analisado usando sistemas automatizados para identificar grandes diferenças na porcentagem de SNPs específicos entre os dois grupos. Freqüentemente, o estudo examina um milhão ou mais SNPs no DNA. Os resultados do GWAS podem ser usados ​​de duas maneiras: as diferenças genéticas podem ser usadas como marcadores de suscetibilidade à doença em indivíduos não diagnosticados, e os genes específicos identificados podem ser alvos para pesquisas sobre a via molecular da doença e potenciais terapias. Um desdobramento da descoberta de associações de genes com doenças foi a formação de empresas que fornecem a chamada "genômica pessoal", que identificará os níveis de risco para várias doenças com base no complemento SNP de um indivíduo. A ciência por trás desses serviços é controversa.

Como o GWAS procura associações entre genes e doenças, esses estudos fornecem dados para outras pesquisas sobre as causas, em vez de responder a perguntas específicas. Uma associação entre uma diferença genética e uma doença não significa necessariamente que haja uma relação de causa e efeito. No entanto, alguns estudos forneceram informações úteis sobre as causas genéticas das doenças. Por exemplo, três estudos diferentes em 2005 identificaram um gene para uma proteína envolvida na regulação da inflamação no corpo que está associada a uma cegueira causadora de doenças chamada degeneração macular relacionada à idade. Isso abriu novas possibilidades para pesquisas sobre a causa desta doença. Um grande número de genes foram identificados como associados à doença de Crohn usando GWAS, e alguns deles sugeriram novos mecanismos hipotéticos para a causa da doença.

Farmacogenômica

Farmacogenômica envolve a avaliação da eficácia e segurança dos medicamentos com base nas informações da sequência genômica de um indivíduo. As informações da sequência do genoma pessoal podem ser usadas para prescrever medicamentos que serão mais eficazes e menos tóxicos com base no genótipo do paciente individual. O estudo das mudanças na expressão gênica pode fornecer informações sobre o perfil de transcrição gênica na presença da droga, o que pode ser usado como um indicador precoce do potencial de efeitos tóxicos. Por exemplo, genes envolvidos no crescimento celular e morte celular controlada, quando perturbados, podem levar ao crescimento de células cancerosas. Estudos de todo o genoma também podem ajudar a encontrar novos genes envolvidos na toxicidade de drogas. As assinaturas de genes podem não ser totalmente precisas, mas podem ser testadas antes que os sintomas patológicos apareçam.

Metagenômica

Tradicionalmente, a microbiologia tem sido ensinada com a visão de que os microrganismos são mais bem estudados em condições de cultura pura, o que envolve o isolamento de um único tipo de célula e sua cultura em laboratório. Como os microrganismos podem passar por várias gerações em questão de horas, seus perfis de expressão gênica se adaptam ao novo ambiente de laboratório muito rapidamente. Por outro lado, muitas espécies resistem a serem cultivadas isoladamente. A maioria dos microrganismos não vive como entidades isoladas, mas em comunidades microbianas conhecidas como biofilmes. Por todas essas razões, a cultura pura nem sempre é a melhor forma de estudar os microrganismos. Metagenômica é o estudo dos genomas coletivos de várias espécies que crescem e interagem em um nicho ambiental. A metagenômica pode ser usada para identificar novas espécies mais rapidamente e para analisar o efeito dos poluentes no meio ambiente. As técnicas de metagenômica agora também podem ser aplicadas a comunidades de eucariotos superiores, como peixes.

Figura 3. A metagenômica envolve o isolamento de DNA de várias espécies dentro de um nicho ambiental. O DNA é cortado e sequenciado, permitindo que sequências inteiras do genoma de várias espécies sejam reconstruídas a partir das sequências de pedaços sobrepostos.

Criação de novos biocombustíveis

O conhecimento da genômica dos microrganismos está sendo usado para encontrar melhores maneiras de aproveitar os biocombustíveis de algas e cianobactérias. As principais fontes de combustível hoje são carvão, petróleo, madeira e outros produtos vegetais, como o etanol. Embora as plantas sejam recursos renováveis, ainda há a necessidade de encontrar mais fontes alternativas de energia renovável para atender às demandas de energia da nossa população. O mundo microbiano é um dos maiores recursos para genes que codificam novas enzimas e produzem novos compostos orgânicos, e permanece praticamente inexplorado. Este vasto recurso genético tem potencial para fornecer novas fontes de biocombustíveis.

Figura 4. Combustíveis renováveis ​​foram testados em navios e aeronaves da Marinha no primeiro Fórum de Energia Naval.

Crédito: modificação da obra de John F. Williams, da Marinha dos EUA

Genômica mitocondrial

As mitocôndrias são organelas intracelulares que contêm seu próprio DNA. O DNA mitocondrial sofre mutações em um ritmo rápido e é freqüentemente usado para estudar relações evolutivas. Outra característica que torna o estudo do genoma mitocondrial interessante é que, na maioria dos organismos multicelulares, o DNA mitocondrial é passado da mãe durante o processo de fertilização. Por esse motivo, a genômica mitocondrial é freqüentemente usada para rastrear a genealogia.

Genômica em análise forense

Informações e pistas obtidas a partir de amostras de DNA encontradas em cenas de crime têm sido usadas como evidências em processos judiciais, e marcadores genéticos têm sido usados ​​em análises forenses. A análise genômica também se tornou útil neste campo. Em 2001, foi publicado o primeiro uso da genômica na área forense. Foi um esforço colaborativo entre instituições de pesquisa acadêmica e o FBI para resolver os misteriosos casos de antraz transportados pelos Correios dos Estados Unidos. A bactéria do antraz foi transformada em um pó infeccioso e enviada para a mídia de notícias e dois senadores dos EUA. O pó infectou o pessoal administrativo e os funcionários dos correios que abriram ou manusearam as cartas. Cinco pessoas morreram e 17 ficaram doentes com a bactéria. Usando a genômica microbiana, os pesquisadores determinaram que uma cepa específica de antraz foi usada em todas as correspondências; eventualmente, a fonte foi rastreada até um cientista em um laboratório nacional de biodefesa em Maryland.

Figura 5. Bacillus anthracis é o organismo que causa o antraz.

Crédito: modificação da obra pelo CDC; dados de barra de escala de Matt Russell

Genômica na agricultura

A genômica pode reduzir os testes e falhas envolvidos na pesquisa científica até certo ponto, o que poderia melhorar a qualidade e a quantidade dos rendimentos das colheitas na agricultura. Ligar características a genes ou assinaturas de genes ajuda a melhorar o melhoramento genético para gerar híbridos com as qualidades mais desejáveis. Os cientistas usam dados genômicos para identificar características desejáveis ​​e, em seguida, transferem essas características para um organismo diferente para criar um novo organismo geneticamente modificado, conforme descrito no módulo anterior. Os cientistas estão descobrindo como a genômica pode melhorar a qualidade e a quantidade da produção agrícola. Por exemplo, os cientistas podem usar características desejáveis ​​para criar um produto útil ou aprimorar um produto existente, como tornar uma cultura sensível à seca mais tolerante com a estação seca.

Figura 6. As plantas agrícolas transgênicas podem ser feitas para resistir a doenças. Essas ameixas transgênicas são resistentes ao vírus da varíola da ameixa.

Crédito: Scott Bauer, USDA ARS

Proteômica

As proteínas são os produtos finais dos genes que desempenham a função codificada pelo gene. As proteínas são compostas de aminoácidos e desempenham papéis importantes na célula. Todas as enzimas (exceto ribozimas) são proteínas e atuam como catalisadores que afetam a taxa de reações. As proteínas também são moléculas reguladoras e algumas são hormônios. Proteínas de transporte, como a hemoglobina, ajudam a transportar oxigênio para vários órgãos. Os anticorpos que se defendem contra partículas estranhas também são proteínas. No estado de doença, a função da proteína pode ser prejudicada por causa de mudanças no nível genético ou por causa do impacto direto em uma proteína específica.

Um proteoma é o conjunto completo de proteínas produzidas por um tipo de célula. Proteomas podem ser estudados usando o conhecimento de genomas porque os genes codificam para mRNAs, e os mRNAs codificam proteínas. O estudo da função dos proteomas é denominado proteômica. A proteômica complementa a genômica e é útil quando os cientistas desejam testar suas hipóteses baseadas em genes. Embora todas as células de um organismo multicelular tenham o mesmo conjunto de genes, o conjunto de proteínas produzidas em diferentes tecidos é diferente e depende da expressão gênica. Assim, o genoma é constante, mas o proteoma varia e é dinâmico dentro de um organismo. Além disso, os RNAs podem ser alternativamente spliced ​​(cortados e colados para criar novas combinações e novas proteínas), e muitas proteínas são modificadas após a tradução. Embora o genoma forneça um blueprint, a arquitetura final depende de vários fatores que podem alterar a progressão dos eventos que geram o proteoma.

Genomas e proteomas de pacientes que sofrem de doenças específicas estão sendo estudados para entender a base genética da doença. A doença mais proeminente sendo estudada com abordagens proteômicas é o câncer (Figura 7). Abordagens proteômicas estão sendo usadas para melhorar o rastreamento e a detecção precoce do câncer; isso é conseguido identificando proteínas cuja expressão é afetada pelo processo da doença. Uma proteína individual é chamada de biomarcador, enquanto um conjunto de proteínas com níveis de expressão alterados é chamado de assinatura de proteína. Para que um biomarcador ou assinatura de proteína seja útil como candidato para o rastreamento e detecção precoce de um câncer, ele deve ser secretado em fluidos corporais, como suor, sangue ou urina, de modo que rastreios em grande escala possam ser realizados de forma não invasiva .

O problema atual com o uso de biomarcadores para a detecção precoce do câncer é a alta taxa de resultados falso-negativos. Um resultado falso negativo é um resultado de teste negativo que deveria ser positivo. Em outras palavras, muitos casos de câncer não são detectados, o que torna os biomarcadores não confiáveis. Alguns exemplos de biomarcadores de proteína usados ​​na detecção de câncer são CA-125 para câncer de ovário e PSA para câncer de próstata. As assinaturas de proteínas podem ser mais confiáveis ​​do que os biomarcadores para detectar células cancerosas. A proteômica também está sendo usada para desenvolver planos de tratamento individualizados, que envolvem a previsão de se um indivíduo responderá ou não a medicamentos específicos e os efeitos colaterais que o indivíduo pode ter. A proteômica também está sendo usada para prever a possibilidade de recorrência da doença.

Figura 7. Esta máquina está se preparando para fazer uma análise de padrão proteômico para identificar cânceres específicos para que um prognóstico preciso do câncer possa ser feito.

Crédito: Dorie Hightower, NCI, NIH

O Instituto Nacional do Câncer desenvolveu programas para melhorar a detecção e o tratamento do câncer. O Clinical Proteomic Technologies for Cancer e a Early Detection Research Network são esforços para identificar assinaturas de proteínas específicas para diferentes tipos de câncer. O Programa de Proteômica Biomédica é projetado para identificar assinaturas de proteínas e desenvolver terapias eficazes para pacientes com câncer.

Resumo da seção

O mapeamento do genoma é semelhante à resolução de um grande e complicado quebra-cabeça com peças de informação provenientes de laboratórios de todo o mundo. Os mapas genéticos fornecem um esboço para a localização dos genes dentro de um genoma e estimam a distância entre os genes e os marcadores genéticos com base na frequência de recombinação durante a meiose. Mapas físicos fornecem informações detalhadas sobre a distância física entre os genes. As informações mais detalhadas estão disponíveis por meio do mapeamento de sequência. As informações de todas as fontes de mapeamento e sequenciamento são combinadas para estudar um genoma inteiro.

O sequenciamento do genoma completo é o mais recente recurso disponível para o tratamento de doenças genéticas. Alguns médicos estão usando o sequenciamento do genoma completo para salvar vidas. A genômica tem muitas aplicações industriais, incluindo desenvolvimento de biocombustíveis, agricultura, produtos farmacêuticos e controle de poluição.

A imaginação é a única barreira para a aplicabilidade da genômica. A genômica está sendo aplicada à maioria dos campos da biologia; pode ser usado para medicina personalizada, previsão de riscos de doenças em um nível individual, o estudo de interações medicamentosas antes da realização de ensaios clínicos e o estudo de microrganismos no ambiente em oposição ao laboratório. Também está sendo aplicado à geração de novos biocombustíveis, avaliação genealógica usando mitocôndrias, avanços na ciência forense e melhorias na agricultura.

Proteômica é o estudo de todo o conjunto de proteínas expressas por um determinado tipo de célula sob certas condições ambientais. Em um organismo multicelular, diferentes tipos de células terão proteomas diferentes, e estes variam com as mudanças no ambiente. Ao contrário de um genoma, um proteoma é dinâmico e está em fluxo constante, o que o torna mais complicado e mais útil do que o conhecimento apenas dos genomas.


Genética, Genômica e Biologia de Sistemas

O Comitê de Genética, Genômica e Biologia de Sistemas (GGSB) é um programa de concessão de doutorado interdisciplinar que reúne mais de 60 biólogos de vários departamentos acadêmicos. O programa GGSB visa treinar bolsistas de doutorado para carreiras como cientistas independentes em pesquisa e educação biomédica básica e aplicada. GGSB oferece um programa de estudos básicos conducente ao Doutor em Filosofia em Genética. Nosso programa de treinamento de PhD combina uma base em análise genética moderna com o treinamento em métodos atuais para formular e abordar questões biológicas no contexto de sistemas complexos. Esses sistemas são estudados em contextos fisiológicos, de desenvolvimento e evolutivos. Os mais de 60 professores de treinamento da GGSB representam vários departamentos diferentes da Universidade de Chicago. A presença de ciências básicas e clínicas na Divisão de Ciências Biológicas aumenta a ampla abordagem interdisciplinar do GGSB para ensino e pesquisa. O programa GGSB oferece um ambiente estimulante no qual se busca um treinamento rigoroso e de alta qualidade com flexibilidade na elaboração de programas para atender às necessidades individuais. Nosso objetivo é fornecer um ambiente intelectualmente estimulante, colegial e de apoio para que os alunos progridam suavemente desde o treinamento em pesquisa até a independência em pesquisa.


O que é um genoma?

O conjunto completo de DNA de um organismo é denominado genoma. Praticamente cada célula do corpo contém uma cópia completa de aproximadamente 3 bilhões de pares de bases de DNA, ou letras, que compõem o genoma humano.

Com sua linguagem de quatro letras, o DNA contém as informações necessárias para construir todo o corpo humano. Um gene tradicionalmente se refere à unidade de DNA que carrega as instruções para fazer uma proteína específica ou um conjunto de proteínas. Cada um dos estimados 20.000 a 25.000 genes no genoma humano codifica uma média de três proteínas.

Localizados em 23 pares de cromossomos agrupados no núcleo de uma célula humana, os genes direcionam a produção de proteínas com o auxílio de enzimas e moléculas mensageiras. Especificamente, uma enzima copia as informações do DNA de um gene em uma molécula chamada ácido ribonucléico mensageiro (mRNA). O mRNA viaja para fora do núcleo e para o citoplasma da célula, onde o mRNA é lido por uma pequena máquina molecular chamada ribossomo, e a informação é usada para ligar pequenas moléculas chamadas aminoácidos na ordem certa para formar uma proteína específica.

As proteínas compõem as estruturas do corpo, como órgãos e tecidos, além de controlar as reações químicas e transportar sinais entre as células. Se o DNA de uma célula sofre mutação, uma proteína anormal pode ser produzida, o que pode interromper os processos normais do corpo e levar a uma doença como o câncer.

O conjunto completo de DNA de um organismo é denominado genoma. Praticamente cada célula do corpo contém uma cópia completa de aproximadamente 3 bilhões de pares de bases de DNA, ou letras, que compõem o genoma humano.

Com sua linguagem de quatro letras, o DNA contém as informações necessárias para construir todo o corpo humano. Um gene tradicionalmente se refere à unidade de DNA que carrega as instruções para fazer uma proteína específica ou um conjunto de proteínas. Cada um dos estimados 20.000 a 25.000 genes no genoma humano codifica uma média de três proteínas.

Localizados em 23 pares de cromossomos agrupados no núcleo de uma célula humana, os genes direcionam a produção de proteínas com o auxílio de enzimas e moléculas mensageiras. Especificamente, uma enzima copia as informações do DNA de um gene em uma molécula chamada ácido ribonucléico mensageiro (mRNA). O mRNA viaja para fora do núcleo e para o citoplasma da célula, onde o mRNA é lido por uma pequena máquina molecular chamada ribossomo, e a informação é usada para ligar pequenas moléculas chamadas aminoácidos na ordem certa para formar uma proteína específica.

As proteínas compõem as estruturas do corpo, como órgãos e tecidos, além de controlar as reações químicas e transportar sinais entre as células. Se o DNA de uma célula sofre mutação, uma proteína anormal pode ser produzida, o que pode interromper os processos normais do corpo e levar a uma doença como o câncer.


O objetivo do ramo é demonstrar que as descobertas e oportunidades de pesquisas derivadas de tecnologias genéticas e genômicas podem ser traduzidas em diagnósticos, tratamentos e prevenção aprimorados de doenças humanas. Usando os excelentes recursos dos laboratórios intramurais do NHGRI, do NIH Clinical Center e das colaborações intramurais do NIH, a filial está envolvida na pesquisa básica, translacional e clínica, trazendo as mais recentes tecnologias genômicas e genéticas para o estudo de doenças humanas.

Nossos investigadores desenvolvem e avaliam rapidamente novas abordagens translacionais e tecnologias avançadas. Além disso, as colaborações com o NIH Clinical Center, o NIH Intramural Sequencing Center e o NIH Chemical Genomics Center apoiam projetos que expandem a amplitude de laboratórios de um único investigador. As instalações principais do NHGRI são componentes igualmente importantes de todos os esforços de pesquisa do ramo, dando aos nossos pesquisadores acesso às tecnologias de bioinformática, animais transgênicos, citometria de fluxo, genômica e citogenética de última geração. Esses recursos permitiram que nossos pesquisadores desenvolvessem ensaios clínicos para terapia gênica de imunodeficiência e desenvolvimento pré-clínico de terapia gênica para distúrbios metabólicos. Além disso, nossos pesquisadores descobriram genes de doenças e identificaram pequenas moléculas para tratar doenças hereditárias e malignidades.

A orientação e preparação de trainees para suas futuras carreiras é uma prioridade para o ramo. O corpo docente da filial oferece uma experiência de aprendizado de base ampla para os trainees, que é ampliada e integrada aos programas de treinamento e seminário intramuros do NHGRI e NIH. Nossos pesquisadores participam de atividades de extensão e oportunidades de aprendizagem, fornecem estágios de verão e orientam alunos de grupos sub-representados

O objetivo do ramo é demonstrar que as descobertas e oportunidades de pesquisas derivadas de tecnologias genéticas e genômicas podem ser traduzidas em diagnósticos, tratamentos e prevenção aprimorados de doenças humanas. Usando os excelentes recursos dos laboratórios intramurais do NHGRI, do NIH Clinical Center e das colaborações intramurais do NIH, a filial está envolvida na pesquisa básica, translacional e clínica, trazendo as mais recentes tecnologias genômicas e genéticas para o estudo de doenças humanas.

Nossos investigadores desenvolvem e avaliam rapidamente novas abordagens translacionais e tecnologias avançadas. Além disso, as colaborações com o NIH Clinical Center, o NIH Intramural Sequencing Center e o NIH Chemical Genomics Center apoiam projetos que expandem a amplitude de laboratórios de um único investigador. As instalações centrais do NHGRI são componentes igualmente importantes de todos os esforços de pesquisa do ramo, dando aos nossos pesquisadores acesso às tecnologias de bioinformática, animais transgênicos, citometria de fluxo, genômica e citogenética de última geração. Esses recursos permitiram que nossos pesquisadores desenvolvessem ensaios clínicos para terapia gênica de imunodeficiência e desenvolvimento pré-clínico de terapia gênica para distúrbios metabólicos. Além disso, nossos pesquisadores descobriram genes de doenças e identificaram pequenas moléculas para tratar doenças hereditárias e malignidades.

A orientação e preparação de trainees para suas futuras carreiras é uma prioridade para o ramo. O corpo docente da filial fornece uma experiência de aprendizado de base ampla para os trainees, que é estendida e integrada com os programas de treinamento e seminário intramuros do NHGRI e NIH. Nossos pesquisadores participam de atividades de extensão e oportunidades de aprendizagem, fornecem estágios de verão e orientam alunos de grupos sub-representados


Centro de Genômica e Biologia de Sistemas

o Centro de Genômica e Biologia de Sistemas, localizado em um "centro de ciências" de última geração com 62.000 pés quadrados, está no coração do campus da NYU em Washington Square. Além de sua fachada histórica de Greenwich Village, há "laboratórios de loft" de última geração, abertos e interconectados, onde cientistas, incluindo professores, pesquisadores e alunos interagem para alavancar o extraordinário potencial da genômica e da biologia de sistemas na pesquisa e na educação

Os programas de pesquisa do Centro adotam o estudo da genômica e da biologia de sistemas como a próxima fronteira em uma era pioneira das ciências biológicas. Isso envolve as habilidades combinadas de genômico, computacional, e biólogos evolucionários que trabalham e estudam no Centro. O corpo docente também colabora com pesquisadores do Courant Institute of Mathematical Sciences, da Faculdade de Letras e Ciências departamentos de física e Química, NYU School of Medicine, NYU Polytechnic School of Engineering, NYU College of Global Public Health, NYU Center for Data Science e NYU Center for Urban Science and Progress, bem como com pesquisadores de outras instituições importantes de Nova York e em todo o mundo. As sinergias intelectuais trazidas por essas colaborações internas e externas, nos permitem desenvolver abordagens únicas para genômica e biologia de sistemas.

Trabalhando com organismos de todos os ramos principais da árvore da vida, os pesquisadores do Centro abordam como os genomas codificam redes genéticas regulatórias, responda às mudanças no ambiente ou durante desenvolvimento, como genes evoluir, e como isso gera diversidade dentro e entre as espécies. Esses princípios estão sendo aplicados a questões globais em saúde humana, sustentabilidade alimentar, bioenergia, e as ambiente.


Genômica

Genômica é um fórum para descrever o desenvolvimento de tecnologias em escala de genoma e sua aplicação a todas as áreas de investigação biológica.

Como uma revista que evoluiu com o campo que leva seu nome, Genômica centra-se no desenvolvimento e aplicação de métodos de ponta, abordando os fundamentos.

Genômica é um fórum para descrever o desenvolvimento de tecnologias em escala de genoma e sua aplicação a todas as áreas de investigação biológica.

Como uma revista que evoluiu com o campo que leva seu nome, Genômica concentra-se no desenvolvimento e aplicação de métodos de ponta, abordando questões fundamentais com potencial de interesse para um público amplo. Nosso objetivo é publicar pesquisas da mais alta qualidade e fornecer aos autores uma revisão e publicação rápida, justa e precisa dos manuscritos que se enquadram em nosso escopo. Os tópicos dentro do escopo da Genômica incluem, mas não estão limitados a:

  • Genômica incluindo projetos de genoma, sequenciamento de genoma e tecnologias genômicas e novas estratégias. Relatórios simples de genomas de uma única mitocondrial, de cloroplasto e de variantes de cepas bacterianas não são mais adequados.
  • Genômica funcional, incluindo perfil transcricional, análise de mRNA, análise de microRNA e análise de não codificantes e outros RNAs usando tecnologias estabelecidas e emergentes (como expressão digital de genes). Manuscritos que analisam apenas dados de sequência existentes não são mais adequados, a menos que sejam adicionados novos dados de sequência ou a introdução de um novo algoritmo para análise. O algoritmo deve ser disponibilizado publicamente por meio de uma página da web ou como código.
  • Genômica evolutiva e comparativa, incluindo filogenômica.
  • Desenvolvimento de tecnologia e metodologia genômica, com foco em aplicações novas e interessantes com potencial de impacto significativo no campo e tecnologias emergentes.
  • Biologia computacional, bioinformática e bioestatística, incluindo métodos integrativos, biologia de rede e o desenvolvimento de novas ferramentas e técnicas.
  • Genética moderna em escala genômica, incluindo estudos de genes complexos, genômica populacional, estudos de associação, variação estrutural e interação gene-ambiente, assim como epigenômica, incluindo metilação do DNA, modificação de histonas, estrutura da cromatina, impressão e remodelação da cromatina.
  • Análise regulatória genômica, incluindo elementos de DNA, regiões de controle de locus, isoladores, potenciadores, silenciadores e mecanismos de regulação gênica.
  • Abordagens genômicas para compreender o mecanismo da patogênese da doença e sua relação com fatores genéticos, incluindo metagenômico e o modo e o ritmo da evolução do gene e da sequência do genoma.
  • Medical Genomics, Personal Genomics e outras aplicações para a saúde humana.
  • Aplicação de técnicas genômicas em organismos modelo que podem ser de interesse de um público amplo.
  • Experimentos de RNA-seq sem três ou mais réplicas biológicas não serão aceitos para artigos baseados em expressão diferencial.
  • Systems Genomics, incluindo pesquisas de ponta em biologia de sistemas computacionais, modelagem discreta e contínua e inteligência artificial que ajudam a inferir novos insights a partir de conjuntos de dados genômicos complexos, dinâmicos e de alto rendimento.

Genômica publica principalmente artigos de pesquisa originais, mas também aceita propostas de revisões completas e mini-revisões. Todas as submissões para Genômica estão sujeitos a uma revisão rigorosa por pares e nosso objetivo é aceitar apenas os 25-30% principais dos manuscritos submetidos. Entre em contato com o Escritório Editorial com propostas de revisão ou quaisquer perguntas sobre o escopo da revista ou a adequação de um manuscrito para publicação.


Biologia Espacial: Uma Nova Dimensão para Genômica

Josh Ryu, PhD
Cofundador e Diretor de Tecnologia
Rebus Biosystems

Julia Kennedy-Darling, PhD
Chefe do CODEX R & ampD
Akoya Biosciences

Yoni Bock
Vice-presidente associado,
Reagentes R & ampD, Vizgen

Data de transmissão: 16 de junho de 2021
Tempo: 14:00 ET

Seja analisando a expressão gênica ou a produção de proteínas, o novo campo empolgante da biologia espacial (ou ômicas espaciais) vai além da genômica unicelular tradicional. Além de informar quais genes e proteínas são expressos, a biologia espacial revela onde eles estão localizados. Essas informações espaciais são extremamente importantes ao descobrir a biologia de ambientes complexos, como um pulmão infectado com SARS-CoV-2 ou ao diferenciar as complexidades entre um tumor cancerígeno e seu microambiente.

Kary Mullis, a inventora do PCR, certa vez observou que “a ciência produz, de forma consistente, uma nova safra de verdades milagrosas e dispositivos deslumbrantes a cada ano”. Embora seja verdade, poucas novas tecnologias podem corresponder à importância dos pilares do laboratório - como PCR e sequenciamento de última geração - que revolucionaram a pesquisa científica. A biologia espacial, no entanto, mostra uma enorme promessa de ser contada entre esses revolucionários.

Neste episódio do GEN Live, estamos empolgados em ter líderes de equipes de jovens empresas espaciais se juntando a nós para discutir a nova fronteira da biologia "espacial", o quão longe o campo avançou em um curto espaço de tempo e os avanços que ele promete para o futuro .

Os hóspedes incluem:
Josh Ryu, PhD, cofundador e Diretor de Tecnologia da Rebus Biosystems
Julia Kennedy-Darling, PhD, Chefe de CODEX R & ampD, Akoya Biosciences
Yoni Bock, vice-presidente associado, R & ampD de Reagentes, Vizgen

Co-anfitriões:
Julianna LeMieux, PhD
Kevin Davies, PhD
Alex Philppidis
John Sterling


Bem-vindo ao GCB!

A missão do Grupo de Pós-Graduação em Genômica e Biologia Computacional (GCB) é treinar a próxima geração de cientistas quantitativos com uma compreensão integrada e profunda das bases biológicas da saúde e da doença.

  • Administrar um programa de treinamento abrangente que dá aos alunos uma ampla base nas ciências biológicas e quantitativas, juntamente com experiência prática em genômica computacional e experimental
  • Fornecer aos trainees uma base de conhecimento por meio de cursos, seminários, retiros e interações com cientistas visitantes
  • Apresentando os trainees à atmosfera altamente dinâmica e colaborativa da comunidade de genômica e biologia computacional da Penn.

Próximos eventos GCB

Mais recente de @UPennGCB

RT @moorejh: Estou recrutando um novo pós-doutorado em bioinformática na @penn para desenvolver e aplicar métodos de aprendizado de máquina ao & hellip genômico https://t.co/Mj4guX0AjD

RT @autobencoder: Você está pensando em se candidatar a um doutorado em biologia computacional? Você conhece alguém que é? Se sim, escrevi uma postagem t & hellip https://t.co/yjtGineHpg

e cópia Os curadores da Universidade da Pensilvânia | Site melhor visualizado em um navegador compatível. | Relatar problemas de acessibilidade e obter ajuda | Política de privacidade | Design do site: Equipe da Web do DART.


Conteúdo

Para entender a genômica funcional, é importante primeiro definir a função. Em seu artigo [1] Graur et al. definir a função de duas maneiras possíveis. Estes são "efeito selecionado" e "Papel causal". A função "Efeito selecionado" refere-se à função para a qual uma característica (DNA, RNA, proteína, etc.) é selecionada. A função "papel causal" refere-se à função para a qual um traço é suficiente e necessário. A genômica funcional geralmente testa a definição de função do "papel causal".

O objetivo da genômica funcional é entender a função de genes ou proteínas, eventualmente todos os componentes de um genoma. O termo genômica funcional é frequentemente usado para se referir a muitos abordagens técnicas estudar a de um organismo genes e proteínas, incluindo as "propriedades bioquímicas, celulares e / ou fisiológicas de cada produto gênico" [2], enquanto alguns autores incluem o estudo de elementos não genéticos em sua definição. [3] A genômica funcional também pode incluir estudos de variação genética hora extra (como o desenvolvimento de um organismo) ou espaço (como as regiões do corpo), bem como interrupções funcionais, como mutações.

A promessa da genômica funcional é gerar e sintetizar o conhecimento genômico e proteômico para a compreensão das propriedades dinâmicas de um organismo. Isso poderia fornecer uma imagem mais completa de como o genoma especifica a função em comparação com estudos de genes únicos. A integração de dados genômicos funcionais costuma fazer parte das abordagens da biologia de sistemas.

A genômica funcional inclui aspectos relacionados à função do próprio genoma, como mutação e polimorfismo (como análise de polimorfismo de nucleotídeo único (SNP)), bem como a medição de atividades moleculares. O último compreende uma série de "-ômica", como transcriptômica (expressão gênica), proteômica (produção de proteína) e metabolômica. A genômica funcional usa principalmente técnicas multiplex para medir a abundância de muitos ou todos os produtos gênicos, como mRNAs ou proteínas em uma amostra biológica. Uma abordagem genômica funcional mais focada pode testar a função de todas as variantes de um gene e quantificar os efeitos dos mutantes usando o sequenciamento como uma leitura da atividade. Juntas, essas modalidades de medição se esforçam para quantificar os vários processos biológicos e melhorar nossa compreensão das funções e interações de genes e proteínas.

No nível do DNA, Editar

Mapeamento de interação genética Editar

Systematic pairwise deletion of genes or inhibition of gene expression can be used to identify genes with related function, even if they do not interact physically. Epistasis refers to the fact that effects for two different gene knockouts may not be additive that is, the phenotype that results when two genes are inhibited may be different from the sum of the effects of single knockouts.

DNA/Protein interactions Edit

Proteins formed by the translation of the mRNA (messenger RNA, a coded information from DNA for protein synthesis) play a major role in regulating gene expression. To understand how they regulate gene expression it is necessary to identify DNA sequences that they interact with. Techniques have been developed to identify sites of DNA-protein interactions. These include ChIP-sequencing, CUT&RUN sequencing and Calling Cards. [4]

DNA accessibility assays Edit

Assays have been developed to identify regions of the genome that are accessible. These regions of open chromatin are candidate regulatory regions. These assays include ATAC-seq, DNase-Seq and FAIRE-Seq.

At the RNA level Edit

Microarrays Edit

Microarrays measure the amount of mRNA in a sample that corresponds to a given gene or probe DNA sequence. Probe sequences are immobilized on a solid surface and allowed to hybridize with fluorescently labeled “target” mRNA. The intensity of fluorescence of a spot is proportional to the amount of target sequence that has hybridized to that spot, and therefore to the abundance of that mRNA sequence in the sample. Microarrays allow for identification of candidate genes involved in a given process based on variation between transcript levels for different conditions and shared expression patterns with genes of known function.

SAGE Edit

Serial analysis of gene expression (SAGE) is an alternate method of analysis based on RNA sequencing rather than hybridization. SAGE relies on the sequencing of 10–17 base pair tags which are unique to each gene. These tags are produced from poly-A mRNA and ligated end-to-end before sequencing. SAGE gives an unbiased measurement of the number of transcripts per cell, since it does not depend on prior knowledge of what transcripts to study (as microarrays do).

RNA sequencing Edit

RNA sequencing has taken over microarray and SAGE technology in recent years, as noted in 2016, and has become the most efficient way to study transcription and gene expression. This is typically done by next-generation sequencing. [5]

A subset of sequenced RNAs are small RNAs, a class of non-coding RNA molecules that are key regulators of transcriptional and post-transcriptional gene silencing, or RNA silencing. Next generation sequencing is the gold standard tool for non-coding RNA discovery, profiling and expression analysis.

Massively Parallel Reporter Assays (MPRAs) Edit

Massively parallel reporter assays is a technology to test the cis-regulatory activity of DNA sequences. [6] [7] MPRAs use a plasmid with a synthetic cis-regulatory element upstream of a promoter driving a synthetic gene such as Green Fluorescent Protein. A library of cis-regulatory elements is usually tested using MPRAs, a library can contain from hundreds to thousands of cis-regulatory elements. The cis-regulatory activity of the elements is assayed by using the downstream reporter activity. The activity of all the library members is assayed in parallel using barcodes for each cis-regulatory element. One limitation of MPRAs is that the activity is assayed on a plasmid and may not capture all aspects of gene regulation observed in the genome.

STARR-seq Edit

STARR-seq is a technique similar to MPRAs to assay enhancer activity of randomly sheared genomic fragments. In the original publication, [8] randomly sheared fragments of the Drosophila genome were placed downstream of a minimal promoter. Candidate enhancers amongst the randomly sheared fragments will transcribe themselves using the minimal promoter. By using sequencing as a readout and controlling for input amounts of each sequence the strength of putative enhancers are assayed by this method.

Perturb-seq Edit

Perturb-seq couples CRISPR mediated gene knockdowns with single-cell gene expression. Linear models are used to calculate the effect of the knockdown of a single gene on the expression of multiple genes.

At the protein level Edit

Yeast two-hybrid system Edit

A yeast two-hybrid screening (Y2H) tests a "bait" protein against many potential interacting proteins ("prey") to identify physical protein–protein interactions. This system is based on a transcription factor, originally GAL4, [9] whose separate DNA-binding and transcription activation domains are both required in order for the protein to cause transcription of a reporter gene. In a Y2H screen, the "bait" protein is fused to the binding domain of GAL4, and a library of potential "prey" (interacting) proteins is recombinantly expressed in a vector with the activation domain. In vivo interaction of bait and prey proteins in a yeast cell brings the activation and binding domains of GAL4 close enough together to result in expression of a reporter gene. It is also possible to systematically test a library of bait proteins against a library of prey proteins to identify all possible interactions in a cell.

AP/MS Edit

Affinity purification and mass spectrometry (AP/MS) is able to identify proteins that interact with one another in complexes. Complexes of proteins are allowed to form around a particular “bait” protein. The bait protein is identified using an antibody or a recombinant tag which allows it to be extracted along with any proteins that have formed a complex with it. The proteins are then digested into short peptide fragments and mass spectrometry is used to identify the proteins based on the mass-to-charge ratios of those fragments.

Deep mutational scanning Edit

In deep mutational scanning every possible amino acid change in a given protein is first synthesized. The activity of each of these protein variants is assayed in parallel using barcodes for each variant. By comparing the activity to the wild-type protein, the effect of each mutation is identified. While it is possible to assay every possible single amino-acid change due to combinatorics two or more concurrent mutations are hard to test. Deep mutational scanning experiments have also been used to infer protein structure and protein-protein interactions.

Loss-of-function techniques Edit

Mutagenesis Edit

Gene function can be investigated by systematically “knocking out” genes one by one. This is done by either deletion or disruption of function (such as by insertional mutagenesis) and the resulting organisms are screened for phenotypes that provide clues to the function of the disrupted gene*

RNAi Edit

RNA interference (RNAi) methods can be used to transiently silence or knock down gene expression using

20 base-pair double-stranded RNA typically delivered by transfection of synthetic

20-mer short-interfering RNA molecules (siRNAs) or by virally encoded short-hairpin RNAs (shRNAs). RNAi screens, typically performed in cell culture-based assays or experimental organisms (such as C. elegans) can be used to systematically disrupt nearly every gene in a genome or subsets of genes (sub-genomes) possible functions of disrupted genes can be assigned based on observed phenotypes.

CRISPR screens Edit

CRISPR-Cas9 has been used to delete genes in a multiplexed manner in cell-lines. Quantifying the amount of guide-RNAs for each gene before and after the experiment can point towards essential genes. If a guide-RNA disrupts an essential gene it will lead to the loss of that cell and hence there will be a depletion of that particular guide-RNA after the screen. In a recent CRISPR-cas9 experiment in mammalian cell-lines, around 2000 genes were found to be essential in multiple cell-lines. [11] [12] Some of these genes were essential in only one cell-line. Most of genes are part of multi-protein complexes. This approach can be used to identify synthetic lethality by using the appropriate genetic background. CRISPRi and CRISPRa enable loss-of-function and gain-of-function screens in a similar manner. CRISPRi identified

2100 essential genes in the K562 cell-line. [13] [14] CRISPR deletion screens have also been used to identify potential regulatory elements of a gene. For example, a technique called ScanDel was published which attempted this approach. The authors deleted regions outside a gene of interest(HPRT1 involved in a Mendelian disorder) in an attempt to identify regulatory elements of this gene. [15] Gassperini et al. did not identify any distal regulatory elements for HPRT1 using this approach, however such approaches can be extended to other genes of interest.

Functional annotations for genes Edit

Genome annotation Edit

Putative genes can be identified by scanning a genome for regions likely to encode proteins, based on characteristics such as long open reading frames, transcriptional initiation sequences, and polyadenylation sites. A sequence identified as a putative gene must be confirmed by further evidence, such as similarity to cDNA or EST sequences from the same organism, similarity of the predicted protein sequence to known proteins, association with promoter sequences, or evidence that mutating the sequence produces an observable phenotype.

Rosetta stone approach Edit

The Rosetta stone approach is a computational method for de-novo protein function prediction. It is based on the hypothesis that some proteins involved in a given physiological process may exist as two separate genes in one organism and as a single gene in another. Genomes are scanned for sequences that are independent in one organism and in a single open reading frame in another. If two genes have fused, it is predicted that they have similar biological functions that make such co-regulation advantageous.

Because of the large quantity of data produced by these techniques and the desire to find biologically meaningful patterns, bioinformatics is crucial to analysis of functional genomics data. Examples of techniques in this class are data clustering or principal component analysis for unsupervised machine learning (class detection) as well as artificial neural networks or support vector machines for supervised machine learning (class prediction, classification). Functional enrichment analysis is used to determine the extent of over- or under-expression (positive- or negative- regulators in case of RNAi screens) of functional categories relative to a background sets. Gene ontology based enrichment analysis are provided by DAVID and gene set enrichment analysis (GSEA), [16] pathway based analysis by Ingenuity [17] and Pathway studio [18] and protein complex based analysis by COMPLEAT. [19]

New computational methods have been developed for understanding the results of a deep mutational scanning experiment. 'phydms' compares the result of a deep mutational scanning experiment to a phylogenetic tree. [20] This allows the user to infer if the selection process in nature applies similar constraints on a protein as the results of the deep mutational scan indicate. This may allow an experimenter to choose between different experimental conditions based on how well they reflect nature. Deep mutational scanning has also been used to infer protein-protein interactions. [21] The authors used a thermodynamic model to predict the effects of mutations in different parts of a dimer. Deep mutational structure can also be used to infer protein structure. Strong positive epistasis between two mutations in a deep mutational scan can be indicative of two parts of the protein that are close to each other in 3-D space. This information can then be used to infer protein structure. A proof of principle of this approach was shown by two groups using the protein GB1. [22] [23]

Results from MPRA experiments have required machine learning approaches to interpret the data. A gapped k-mer SVM model has been used to infer the kmers that are enriched within cis-regulatory sequences with high activity compared to sequences with lower activity. [24] These models provide high predictive power. Deep learning and random forest approaches have also been used to interpret the results of these high-dimensional experiments. [25] These models are beginning to help develop a better understanding of non-coding DNA function towards gene-regulation.

The ENCODE project Edit

The ENCODE (Encyclopedia of DNA elements) project is an in-depth analysis of the human genome whose goal is to identify all the functional elements of genomic DNA, in both coding and noncoding regions. Important results include evidence from genomic tiling arrays that most nucleotides are transcribed as coding transcripts, noncoding RNAs, or random transcripts, the discovery of additional transcriptional regulatory sites, further elucidation of chromatin-modifying mechanisms.

The Genotype-Tissue Expression (GTEx) project Edit

The GTEx project is a human genetics project aimed at understanding the role of genetic variation in shaping variation in the transcriptome across tissues. The project has collected a variety of tissue samples (> 50 different tissues) from more than 700 post-mortem donors. This has resulted in the collection of >11,000 samples. GTEx has helped understand the tissue-sharing and tissue-specificity of EQTLs. [26]


Funding Opportunities

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.

Investigators interested in submitting applications to NHGRI are encouraged to contact NHGRI program staff before submission to discuss their specific aims and their choice of Funding Opportunity Announcement (FOA). Contact information for NHGRI program staff is at the bottom of this page.

Investigator Initiated Research in Computational Genomics and Data Science (R01, R21, and R43/R44): PAR-18-844, PAR-18-843, and PAR-19-061, invite applications for a broad range of research efforts in computational genomics, data science, statistics, and bioinformatics relevant to one or both of basic or clinical genomic science, and broadly applicable to human health and disease.

Genomic Resource Grants for Community Resource Projects (U24): PAR-20-100 is tightly focused on supporting major genomic resources, including those in informatics. Potential applicants are strongly encouraged to contact NHGRI Program Staff before developing an application.

Parent NIH Solicitations: R01 (PA-20-185 and PA-20-183), Parent R21 (PA-20-195 and PA-20-194), and Parent K25 (PA-20-199) solicitations. These investigator-initiated grants allow researchers to target their specific area of science relevant to NHGRI’s mission (per the NHGRI Funding Policy). Other funding opportunities include PAR-21-075, which focuses on research experiences for students seeking a master’s degree. Additionally, NIH funding opportunities for Small Business Innovation Research (SBIR) and Small Business Technology Transfer (STTR) grants can be found at https://sbir.nih.gov/funding.

Other Relevant NIH Funding Opportunities

NHGRI's Funding Opportunities page links to various NHGRI funding opportunities and provides instructions for signing up for NHGRI's funding opportunities email list.

The webpage of the Biomedical Information Science and Technology Initiative (BISTI) provides links to various informatics-related funding opportunities across NIH and other Federal agencies.


Assista o vídeo: Genômica e evolução do cromossomo Y de Drosophila (Fevereiro 2023).