Em formação

Irlanda 2019 - Aula 15 - Biologia


Introdução à regulação gênica

Regulação tem tudo a ver com a tomada de decisões. tecidos).

Uma vez que o assunto da regulação é um tópico de estudo muito profundo e amplo em biologia, em Bis2a não tentamos cobrir todos os detalhes - eles simplesmente são muitos. Em vez disso, como fizemos para todos os outros tópicos, tentamos nos concentrar em (a) delinear algumas das principais construções lógicas e perguntas que você deve ter ao abordar QUALQUER cenário envolvendo regulamentação, (b) aprender algum vocabulário comum e mecanismos onipresentes e (c) examinar alguns exemplos concretos que ilustram os pontos apresentados em a e b.

Expressão genetica

Introdução

Todas as células controlam quando e quanto cada um de seus genes é expresso. Esta declaração simples - que poderia ser derivada simplesmente da observação do comportamento celular - traz muitas questões que podemos começar a formular usando nossa rubrica Desafio de Design.

Tentando definir "expressão gênica"

A primeira coisa que precisamos fazer, entretanto, é definir o que significa quando dizemos que um gene é "expresso". Se o gene codifica uma proteína, pode-se razoavelmente propor que a "expressão" de um gene significa quanta proteína funcional é produzida. Mas e se o gene não codificar uma proteína, mas sim algum RNA funcional. Então, neste caso, "expresso pode significar quanto do RNA funcional é feito. Outra pessoa pode razoavelmente sugerir que" expressão "se refere apenas à etapa inicial na criação de uma cópia da informação genômica. Por essa definição, pode-se deseja contar quantas transcrições completas estão sendo feitas. É o número de produtos finais codificados pela informação genômica ou é o número de leituras da informação que é importante para descrever adequadamente a "expressão". Infelizmente, na prática, nós muitas vezes descobrimos que a definição depende do contexto da discussão. Lembre-se disso. Para ter certeza de que estamos falando sobre a mesma coisa, em Bis2A tentaremos usar o termo "expressão" principalmente para descrever o criação do (s) produto (s) funcional (is) final (is). Dependendo do caso específico, o produto final pode ser uma proteína ou uma espécie de RNA.

O desafio do projeto de regular a expressão gênica

Para conduzir essa discussão a partir de uma perspectiva de desafio de design, podemos estipular formalmente que o "grande problema" que estamos interessados ​​em subestimar é o de regular a abundância de proteínas em uma célula. Problema: a abundância de cada proteína funcional deve ser regulada. Podemos então começar apresentando subproblemas:

Vamos parar um momento, no entanto, primeiro para recarregar algumas ideias. O processo de expressão do gene requer várias etapas, dependendo de qual será o destino do produto final. No caso de RNAs estruturais e regulatórios (ou seja, tRNA, rRNA, snRNA, etc.), o processo requer que um gene seja transcrito e que qualquer processamento pós-transcricional necessário ocorra. No caso de um gene codificador de proteína, o transcrito também deve ser traduzido em proteína e, se necessário, modificações na proteína também devem ser feitas. Obviamente, tanto a transcrição quanto a tradução são processos de várias etapas e a maioria dessas subetapas também são locais de controle em potencial.

Alguns dos subproblemas podem ser:

  1. É razoável postular que deve haver algum mecanismo (s) para regular a primeira etapa deste processo de várias etapas, o início da transcrição (apenas começando as coisas). Portanto, poderíamos afirmar, "precisamos de um mecanismo para regular o início da transcrição." Também poderíamos transformar isso em uma pergunta e perguntar, "como pode ser realizada a iniciação da transcrição"?
  2. Podemos usar um pensamento semelhante para afirmar "precisamos de um mecanismo para regular o fim da transcrição" ou para perguntar "como a transcrição termina?"
  3. Usando esta convenção, podemos afirmar, "precisamos regular o início da tradução e a interrupção da tradução".
  4. Falamos apenas sobre a síntese de proteínas e RNA. É bastante razoável afirmar também: "Precisamos de mecanismos para regular a degradação do RNA e da proteína".

Focando na transcrição

Neste curso, começamos focando principalmente no exame do primeiro par de problemas / questões, a regulação da iniciação e terminação da transcrição - da informação genômica para um RNA funcional, pronto como está (por exemplo, no caso de um RNA funcional) ou pronto para tradução. Isso nos permite examinar alguns conceitos fundamentais sobre a regulação da expressão gênica e examinar alguns exemplos reais desses conceitos em ação.

Discussão sugerida

Por que é importante regular a expressão do gene, por que não apenas expressar todos os genes o tempo todo?

Crie uma lista de hipóteses com seus colegas de classe sobre as razões pelas quais a regulação da expressão gênica é importante para bactérias e arquéias e para eucariotos. Em vez de bactérias vs. eucariotos, você também pode querer considerar razões contrastantes que a regulação gênica é importante para organismos unicelulares versus organismos multicelulares ou comunidades de organismos unicelulares (como colônias de bactérias).

Subproblemas para a transcrição e a atividade ou RNA polimerase

Vamos considerar um gene codificador de proteína e trabalhar com alguma lógica. Começamos imaginando um caso simples, onde um gene codificador de proteína é codificado por um único trecho contíguo de DNA. Sabemos que, para transcrever esse gene, uma RNA polimerase precisará ser recrutada para o início da região codificadora. A RNA polimerase não é "inteligente" per se. Deve haver algum mecanismo, baseado na lógica química, para ajudar a recrutar a RNA polimerase para o início do gene que codifica a proteína. Da mesma forma, se este processo deve ser regulado, deve haver algum mecanismo, ou mecanismos, para ditar quando uma RNA polimerase deve ser recrutada para o início de um gene, quando não deveria, e / ou E se é recrutado para o DNA mesmo que não deva realmente começar a transcrição e quantas vezes este processo deve acontecer. Observe que a frase anterior tem vários subproblemas / questões distintas (por exemplo, quando a polimerase é recrutada?; Se recrutada, ela deve iniciar a transcrição?; Se ela começa a transcrição, quantas vezes esse processo deve se repetir?). Também podemos inferir razoavelmente que será necessário haver alguns mecanismos para "instruir" (mais antropomorfismos) a polimerase a parar a transcrição. Finalmente, como o papel da transcrição é criar cópias de RNA dos segmentos do genoma, devemos também considerar problemas / questões relacionadas a outros fatores que influenciam a abundância de RNA, como mecanismos de degradação. Deve haver alguns mecanismos e estes provavelmente estarão envolvidos na regulação deste processo.

Um esquema que mostra um gene codificador de proteína e algumas das perguntas ou problemas que precisamos nos perguntar ou, alternativamente, problemas para os quais precisamos saber as soluções se quisermos entender como a regulação da porção transcricional da expressão do gene é regulada. Atribuição: Marc T. Facciotti (obra própria)

Ativação e Repressão da Transcrição

Alguns fundamentos

Vamos considerar um gene codificador de proteína e trabalhar com alguma lógica. É necessário que haja algum mecanismo, com base na lógica química, para ajudar a recrutar a RNA polimerase para o início do gene que codifica a proteína. Da mesma forma, se este processo deve ser regulado, é necessário que haja algum mecanismo, ou mecanismos, para ditar quando uma RNA polimerase deve ser recrutada para o início de um gene, quando não deveria, e / ou se ela é recrutada para o DNA, se deve ou não começar a transcrição e quantas vezes esse processo deve acontecer. quando é que a polimerase é recrutada ?, se recrutada deve iniciar a transcrição ?, se começar a transcrição, quantas vezes este processo deve repetir?). Também podemos inferir razoavelmente que será necessário haver alguns mecanismos para "instruir" (mais antropomorfismos) a polimerase a parar a transcrição.

Recrutando RNA polimerase para locais específicos

Para iniciar a transcrição, a RNA polimerase deve ser recrutada para um segmento de DNA próximo ao início de uma região de DNA que codifica um transcrito funcional. A função da RNA polimerase conforme descrito até agora, no entanto, não é ligar sequências específicas, mas sim mover-se ao longo de qualquer segmento de DNA. Encontrar uma maneira de recrutar a polimerase para um local específico, portanto, parece contraditório ao seu comportamento usual. Explicar essa contradição exige que invoquemos algo novo. Qualquer uma das transcrições pode começar em qualquer lugar e apenas aqueles eventos que levam a uma transcrição produtiva completa fazem qualquer coisa útil ou algo diferente do que a própria RNA polimerase ajuda a recrutar a enzima para o início de um gene. O último, agora assumimos como certo, é de fato o caso.

O recrutamento da RNA polimerase é mediado por proteínas chamadas fatores gerais de transcrição. Nas bactérias, eles têm um nome especial: fatores sigma. Em archaea, eles são chamados de proteína de ligação a TATA e fator de transcrição IIB. Nos eucariotos, os parentes das proteínas arqueas funcionam em conjunto com várias outras para recrutar a RNA polimerase. Os fatores gerais de transcrição têm pelo menos duas funções básicas: (1) são capazes de reconhecer quimicamente uma sequência específica de DNA e (2) são capazes de se ligar à RNA polimerase. Juntas, essas duas funções dos fatores gerais de transcrição resolvem o problema de recrutar uma enzima que, de outra forma, não é capaz de se ligar a um sítio específico do DNA. Em alguns textos, os fatores gerais de transcrição (e particularmente as variedades do fator sigma) são considerados parte da RNA polimerase. Embora certamente façam parte do complexo quando ajudam a direcionar a RNA polimerase, eles não continuam com a RNA polimerase após o início da transcrição.

O sítio de DNA para o qual uma RNA polimerase é recrutada tem um nome especial. É chamado de promotor. Embora as sequências de DNA de diferentes promotores não precisem ser exatamente iguais, diferentes sequências de promotores normalmente têm algumas propriedades químicas especiais em comum. Obviamente, uma propriedade é que eles são capazes de se associar a uma RNA polimerase. Além disso, o promotor geralmente tem uma sequência de DNA que facilita a dissociação do DNA de fita dupla, de modo que a polimerase pode começar a ler e transcrever a região codificadora. (Observação: tecnicamente, poderíamos ter dividido as propriedades do promotor em subproblemas de desafio de design. Neste caso, nós pulamos, mas você ainda deve ser capaz de retroceder e criar as declarações de problemas e / ou questões relevantes assim que descobrir sobre os promotores )

Em quase todos os casos, mas particularmente em sistemas eucarióticos, o complexo de proteínas que se monta com a RNA polimerase nos promotores (normalmente chamado de complexo de pré-iniciação) pode chegar a dezenas de proteínas. Cada uma dessas outras proteínas tem uma função específica, mas isso é muito detalhado para se mergulhar no Bis2A.

Um modelo do complexo de pré-iniciação de E. coli. O fator sigma é colorido em vermelho. O DNA é representado como tubos laranja e estruturas em anel opostas. O resto do complexo de pré-iniciação é rosa. Observe que o DNA possui regiões de dupla hélice e uma estrutura aberta dentro do PIC. Atribuição: Estrutura derivada das coordenadas PDB (4YLN) Marc T. Facciotti (trabalho próprio)

Um modelo abstrato de uma unidade de transcrição genérica mostrada acima com a adição de um promotor e PIC. As perguntas observadas anteriormente que provavelmente não serão abordadas no Bis2a foram desativadas. Facciotti (trabalho próprio)

Discussão sugerida

Como o fator de transcrição geral reconhece uma sequência específica de DNA? Qual pode ser a base química para isso? Em contraste, como pode a interação de uma proteína ou enzima que interage com o DNA de forma não específica diferir? Pense em grupos funcionais e proponha uma hipótese.

Estados de um promotor regulamentado

Uma vez que os promotores recrutam uma RNA polimerase, esses locais e a montagem do complexo de pré-iniciação são locais óbvios para regular as primeiras etapas da expressão gênica. No nível de iniciação da transcrição, frequentemente classificamos o promotor em uma de três classes. O primeiro é chamado constitutivo. Os promotores constitutivos geralmente não são regulados com muita força. Seu estado básico é "ligado". Quando a transcrição constitutiva de um promotor é muito alta (em relação à maioria dos outros promotores), chamaremos coloquialmente esse promotor de promotor "constitutivo forte". Em contraste, se a quantidade de transcrição de um promotor constitutivo for baixa (em relação à maioria dos outros promotores), chamaremos esse promotor de promotor "constitutivo fraco".

Uma segunda maneira de classificar promotores pelo uso do termo ativado ou equivalente, induzido. Esses termos intercambiáveis ​​são usados ​​para descrever promotores que são sensíveis a algum estímulo externo e respondem a esse estímulo aumentando a transcrição. Os promotores ativados têm um estado básico que geralmente exibe pouca ou nenhuma transcrição. A transcrição é então "ativada" em resposta a um estímulo - o estímulo "ativa" o promotor.

Finalmente, o terceiro termo usado para classificar promotores é pelo uso do termo reprimido. Esses promotores também respondem a estímulos, mas o fazem diminuindo a transcrição. O estado básico para esses promotores é algum nível basal de transcrição e o estímulo atua para diminuir ou reprimir a transcrição. A transcrição é "reprimida" em resposta a um estímulo - o estímulo "desliga" o promotor.

Os exemplos dados acima assumiram que um único estímulo atua para regular os promotores. Embora este seja o caso mais simples, muitos promotores podem integrar diferentes tipos de informação e podem ser alternadamente ativados por alguns estímulos e reprimidos por outros estímulos.

Fatores de transcrição ajudam a regular o comportamento de um promotor

Como os promotores são sensíveis a estímulos externos? Mecanicamente, tanto na ativação quanto na repressão, requerem proteínas regulatórias para alterar a saída transcricional do gene que está sendo observado. As proteínas responsáveis ​​por ajudar a regular a expressão são geralmente chamadas fatores de transcrição. As sequências específicas de DNA ligadas por fatores de transcrição são freqüentemente chamadas de operadores e, em muitos casos, os operadores estão muito próximos das sequências promotoras.

É aqui que a nomenclatura se torna potencialmente confusa - particularmente quando se compara pesquisas bacterianas e eucarióticas. No

pesquisa bacteriana

, se o fator de transcrição atua ligando-se ao DNA e à RNA polimerase de uma forma que aumenta a transcrição, é normalmente chamado de ativador. Se, por outro lado, o fator de transcrição atua ligando-se ao DNA para reprimir ou diminuir a transcrição do gene, então é chamado de repressor.

Por que as classificações de ativador e repressor são potencialmente problemáticas? Esses termos, descrevem em funções únicas idealizadas. Embora isso possa ser verdade no caso de alguns fatores de transcrição, na realidade outros fatores de transcrição podem atuar para ativar a expressão gênica em algumas condições, enquanto reprimem em outras condições. Alguns fatores de transcrição simplesmente atuarão para modular a expressão para cima ou para baixo, dependendo do contexto, em vez de desligar a transcrição ou ativá-la completamente. Para contornar parte dessa possível confusão, alguns de seus instrutores preferem evitar o uso dos termos ativador e repressor e, em vez disso, preferem simplesmente discutir a atividade de transcrição de vários fatores de transcrição como uma influência positiva ou negativa na expressão do gene em casos específicos. Se esses termos forem usados, você poderá ouvir seu instrutor dizendo que o fator de transcrição em questão ATUA COMO / COMO um repressor ou que ATUA COMO / COMO um ativador, tomando cuidado para não chamá-lo simplesmente de ativador ou repressor. É mais provável, entretanto, que você os ouça dizer que um fator de transcrição está agindo para influenciar positiva ou negativamente a transcrição.

CUIDADO: Dependendo do seu instrutor, você pode cobrir alguns exemplos biológicos reais de mecanismos regulatórios positivos e negativos. Esses exemplos específicos usarão os nomes comuns dos fatores de transcrição - uma vez que os exemplos serão normalmente extraídos da literatura bacteriana, os nomes dos fatores de transcrição podem incluir os termos "repressor" ou "ativador". Esses nomes são relíquias de quando foram descobertos pela primeira vez. Tente passar mais tempo examinando a lógica de como o sistema funciona do que tentando guardar na memória quaisquer propriedades especiais daquela proteína específica para todos os outros casos com o mesmo rótulo. Ou seja, só porque uma proteína é rotulada como repressora não significa que ela atue exclusivamente como um regulador negativo em todos os casos ou que interaja com sinais externos da mesma forma que no exemplo.

Discussão sugerida

Que tipo de interação você acha que acontece entre os aminoácidos do fator de transcrição e a dupla hélice do DNA? Como os fatores de transcrição reconhecem seu sítio de ligação no DNA?

Moduladores alostéricos de proteínas reguladoras

A atividade de muitas proteínas, incluindo proteínas regulatórias e vários fatores de transcrição, pode ser modulada alostericamente por vários fatores, inclusive pela abundância relativa de pequenas moléculas na célula. Essas pequenas moléculas são frequentemente chamadas de indutores ou co-repressoresou co-ativadores e são frequentemente metabólitos, como lactose ou triptofano, ou pequenas moléculas reguladoras, como cAMP ou GTP. Essas interações permitem que o FT responda às condições ambientais e module sua função de acordo. Isso está ajudando a tomar uma decisão sobre se transcrever um gene ou não, dependendo da abundância do sinal ambiental.

Vamos imaginar um regulador transcricional negativo. No caso mais simples que consideramos até agora, a transcrição do gene com um sítio de ligação para esse fator de transcrição seria baixa quando o FT está presente e alta quando o FT está ausente. Agora podemos adicionar uma pequena molécula a este modelo. Nesse caso, a pequena molécula é capaz de se ligar ao regulador transcricional negativo por meio de conjuntos de ligações complementares de hidrogênio e iônicas. Neste primeiro exemplo, consideraremos o caso em que a ligação da pequena molécula ao FT induz uma mudança conformacional ao FT que reduz severamente sua capacidade de se ligar ao DNA. Se for esse o caso, o regulador negativo - uma vez ligado por sua pequena molécula - seria liberado do DNA. Isso, portanto, aliviaria a influência negativa e levaria ao aumento da transcrição. Essa lógica regulatória pode ser apropriada para ter evoluído no seguinte cenário: uma pequena molécula de alimento está normalmente ausente do ambiente. Portanto, genes que codificam enzimas que degradam / usam aquele alimento devem ser mantidos "desligados" na maior parte do tempo para preservar a energia celular que sua síntese utilizaria. Isso poderia ser realizado pela ação de um regulador negativo. Quando o alimento aparece no meio ambiente, seria apropriado que as enzimas responsáveis ​​por seu processamento fossem expressas. O alimento poderia então agir ligando-se ao regulador negativo, mudando a conformação do FT, causando sua liberação do DNA e ativando a transcrição das enzimas de processamento.

Um modelo abstrato de uma unidade transcricional genérica regulada por um regulador negativo cuja atividade é modulada por uma pequena molécula (representada por uma estrela). Nesse caso, a ligação da pequena molécula faz com que o FT seja liberado do DNA. Facciotti (trabalho próprio)

Podemos considerar um segundo modelo de como um FT de ação negativa pode interagir com uma pequena molécula. Nesse caso, o FT sozinho é incapaz de se ligar ao seu sítio regulatório no DNA. No entanto, quando uma pequena molécula se liga ao FT, ocorre uma mudança conformacional que reorienta os aminoácidos de ligação ao DNA na orientação "correta" para a ligação ao DNA. O complexo TF-molécula pequena agora se liga ao DNA e age para influenciar negativamente a transcrição.

Um modelo abstrato de uma unidade transcricional genérica regulada por um regulador negativo cuja atividade é modulada por uma pequena molécula (representada por uma estrela). Nesse caso, a ligação da pequena molécula faz com que o FT se ligue ao DNA. Facciotti (trabalho próprio)

Observe como a atividade do TF pode ser modulada de maneiras distintas por uma pequena molécula. Dependendo da proteína, a ligação desse sinal externo pode causar a ligação do complexo TF-molécula pequena ao DNA OU a ligação da molécula pequena pode causar a liberação do complexo TF-molécula pequena do DNA. Os mesmos tipos de exemplos podem ser trabalhados para um regulador positivo.

Em ambos os casos propostos acima, a ligação de uma pequena molécula a um TF será dependente de quão fortemente o TF interage com a pequena molécula. Isso dependerá dos tipos e da orientação espacial dos grupos funcionais químicos da proteína, de seus estados de protonação (se aplicável) e dos grupos funcionais complementares na pequena molécula. Não deve ser surpreendente, portanto, saber que a ligação da molécula pequena ao TF será dependente de vários fatores, incluindo, mas não se limitando às concentrações relativas de molécula pequena e TF e pH.

É uma regulação positiva ou negativa?

Resolvendo um ponto comum de confusão

Nesse ponto, não é incomum que muitos alunos do Bis2a fiquem um pouco confusos sobre como determinar se um fator de transcrição está agindo como um regulador positivo ou negativo. Essa confusão geralmente surge após uma discussão sobre os possíveis modos pelos quais o estímulo (ou seja, molécula pequena) pode influenciar a atividade de um fator de transcrição. Isso não é muito surpreendente. Nos exemplos acima, a ligação de uma molécula efetora a um fator de transcrição pode ter um de dois efeitos diferentes: (1) a ligação da molécula efetora pode induzir um fator de transcrição ligado ao DNA a ser liberado de seu sítio de ligação, desreprimindo um promotor, e "ligar" a expressão do gene. (2) a ligação da molécula efetora ao fator de transcrição poderia induzir o FT a se ligar ao seu sítio de ligação ao DNA, reprimindo a transcrição e "desligando" a expressão do gene. No primeiro caso, pode parecer que o TF está agindo positivamente para regular a expressão, enquanto no segundo exemplo pode parecer que o TF está agindo negativamente.

No entanto, em ambos os exemplos acima, o TF está atuando como um regulador negativo. Para determinar isso, observamos o que acontece quando o TF se liga ao DNA (se uma pequena molécula está ligada ao TF ou não). Em ambos os casos, a ligação do FT ao DNA reprime a transcrição. O TF está, portanto, atuando como um regulador negativo. Uma análise semelhante pode ser feita com TFs de ação positiva.

Observe que, em alguns casos, um TF pode atuar como um regulador positivo em um promotor e um regulador negativo em um promotor diferente, portanto, descrever o comportamento do TF em uma base por caso é frequentemente importante (ler muito do nome que foi atribuído pode ser enganoso às vezes). Outra proteína TF pode atuar alternadamente como reguladores positivos ou negativos do mesmo promotor dependendo das condições. Novamente, é aconselhável descrever o comportamento do TF especificamente para cada caso.

Um teste genético para função regulatória positiva ou negativa de um TF

Como determinar se uma proteína reguladora funciona de maneira positiva ou negativa? Um teste genético simples é perguntar "o que acontece com a expressão se a proteína reguladora estiver ausente?" Isso pode ser feito removendo o gene codificador do fator de transcrição do genoma. Se um fator de transcrição atua positivamente, sua presença é necessária para ativar a transcrição. Na sua ausência, não há proteína reguladora, portanto, não há ativação, e o resultado são níveis mais baixos de transcrição de um gene alvo. O oposto é verdadeiro para um fator de transcrição que age negativamente. Na sua ausência, a expressão deve ser aumentada, porque o gene que mantém a expressão baixa não está mais por perto.

Término da transcrição e degradação do RNA

Término da transcrição em bactérias

Depois que um gene é transcrito, a polimerase bacteriana precisa ser instruída a se dissociar do molde de DNA e liberar o mRNA recém-formado. Dependendo do gene que está sendo transcrito, existem dois tipos de sinais de terminação. Um é baseado em proteínas e o outro é baseado em RNA. Rescisão dependente de Rho é controlada pela proteína rho, que segue atrás da polimerase na crescente cadeia de mRNA. Perto do final do gene, a polimerase encontra uma sequência de nucleotídeos G no molde de DNA e ele para. Como resultado, a proteína rho colide com a polimerase. A interação com rho libera o mRNA da bolha de transcrição.

Terminação independente de Rho é controlado por sequências específicas na fita modelo de DNA. À medida que a polimerase se aproxima do final do gene que está sendo transcrito, ela encontra uma região rica em nucleotídeos C – G. O mRNA se dobra sobre si mesmo, e os nucleotídeos C – G complementares se ligam. O resultado é um estável grampo que faz com que a polimerase pare assim que começa a transcrever uma região rica em nucleotídeos A – T. A região U-A complementar do transcrito do mRNA forma apenas uma interação fraca com o DNA molde. Isso, juntamente com a polimerase paralisada, induz instabilidade suficiente para a enzima do núcleo se separar e liberar o novo transcrito de mRNA.

Término da transcrição em eucariotos

O término da transcrição é diferente para as diferentes polimerases. Ao contrário dos procariotos, o alongamento pela RNA polimerase II em eucariotos ocorre de 1.000 a 2.000 nucleotídeos além do final do gene que está sendo transcrito. Esta cauda pré-mRNA é subsequentemente removida por clivagem durante o processamento do mRNA. Por outro lado, as RNA polimerases I e III requerem sinais de terminação. Os genes transcritos pela RNA polimerase I contêm uma sequência específica de 18 nucleotídeos que é reconhecida por uma proteína de terminação. O processo de terminação na RNA polimerase III envolve um grampo de mRNA semelhante à terminação independente de rho da transcrição em procariotos.

Término da transcrição em arquéias

O término da transcrição nas arquéias é muito menos estudado do que nos outros dois domínios da vida e ainda não é bem compreendido. Embora os detalhes funcionais provavelmente se assemelhem a mecanismos que foram vistos em outros domínios da vida, os detalhes estão além do escopo deste curso.

Degradação de RNA

O tempo de vida de diferentes espécies de RNA na célula pode variar dramaticamente, de segundos a horas. O tempo médio de vida do mRNA também pode variar dramaticamente dependendo do organismo. Por exemplo, o tempo de vida médio para mRNA em E. coli é de aproximadamente 5 minutos. A meia-vida do mRNA em leveduras é de aproximadamente 20 minutos e 600 minutos para células humanas. Parte da degradação é "direcionada". Ou seja, alguns transcritos incluem uma sequência curta que os direciona para enzimas degradantes de RNA, acelerando a taxa de degradação. Não é preciso muita imaginação para inferir que esse processo também pode ser ajustado evolutivamente para diferentes genes. Simplesmente perceber que a degradação - e o ajuste da degradação - também pode ser um fator no controle da expressão de um gene é suficiente para o Bis2a.

Término do ajuste

Como todos os outros processos biológicos, o término da transcrição não é perfeito. Às vezes, a RNA polimerase é capaz de ler sequências terminadoras e transcrever genes adjacentes. Isso é particularmente verdadeiro em genomas bacterianos e de archaea, onde a densidade de genes codificadores é alta. Esta leitura transcricional pode ter vários efeitos, mas os dois resultados mais comuns são: (1) Se os genes adjacentes são codificados na mesma fita de DNA que o gene transcrito ativamente, os genes adjacentes também podem ser transcritos. (2) Se os genes adjacentes são transcritos na fita oposta dos genes ativamente transcritos, a leitura da RNA polimerase interfere nas polimerases que transcrevem ativamente o gene vizinho. Não é de surpreender que a biologia, em alguns casos, tenha desenvolvido mecanismos que atuam para minimizar a influência da leitura e tirar proveito dela. Portanto, a "força" de um terminador - e sua eficácia em terminar a transcrição em uma direção específica - são "sintonizados" pela Natureza e "usados" (observe o antropomorfismo entre aspas) para regular a expressão dos genes.

Um modelo abstrato de uma unidade transcricional básica completa e as várias "partes" codificadas no DNA que podem influenciar a expressão do gene. Esperamos que os alunos do Bis2A sejam capazes de recriar uma figura conceitual semelhante de memória. Facciotti (trabalho próprio)

Resumo da regulação gênica

No texto anterior, examinamos várias maneiras de começar a resolver alguns dos desafios de design associados à regulação da quantidade de transcrição que é criada para uma única região de codificação do genoma. Vimos em termos abstratos alguns dos processos responsáveis ​​por controlar a iniciação da transcrição, como eles podem se tornar sensíveis a fatores ambientais e, muito brevemente, os processos que encerram a transcrição e lidam com a degradação ativa do RNA. Evitamos mais Cada um desses processos pode ser quantitativamente ajustado pela natureza para ser "mais forte" ou "mais fraco". É importante perceber que os valores reais de "força" (por exemplo, força do promotor, taxas de degradação, etc.) influenciam o comportamento do processo geral de maneiras potencialmente importantes do ponto de vista funcional.

Exemplos de regulação do gene bacteriano

Esta seção descreve dois exemplos de regulação da transcrição em bactérias. Estes são apresentados como exemplos ilustrativos. Use esses exemplos para aprender alguns princípios básicos sobre os mecanismos de regulação da transcrição. Fique atento na aula, na discussão e nos guias de estudo para extensões dessas idéias e use-as para explicar os mecanismos regulatórios usados ​​para regular outros genes.

Exemplos de regulação gênica em E. coli

O DNA de bactérias e arquéias são geralmente organizados em um ou mais cromossomos circulares no citoplasma. O denso agregado de DNA que pode ser visto em micrografias eletrônicas é chamado de nucleóide. Em bactérias e arqueas, os genes, cuja expressão precisa ser fortemente coordenada (por exemplo, genes que codificam proteínas que estão envolvidas na mesma via bioquímica) são frequentemente agrupados intimamente no genoma. Quando a expressão de múltiplos genes é controlada pelo mesmo promotor e um único transcrito é produzido, essas unidades de expressão são chamadas operons. Por exemplo, na bactéria Escherschia coli todos os genes necessários para utilizar a lactose são codificados lado a lado no genoma. Este arranjo é chamado de lactose (ou laca) operon. Em bactérias e arquéias, costuma acontecer que quase 50% de todos os genes são codificados em operons de dois ou mais genes.

O papel do promotor

The first level of control of gene expression is at the promoter itself. Some promoters recruit RNA polymerase and turn those DNA-protein binding events into transcripts more efficiently than other promoters. This intrinsic property of a promoter, it's ability to produce transcript at a particular rate, is referred to as promoter strength. The stronger the promoter, the more RNA is made in any given time period. Promoter strength can be "tuned" by Nature in very small or very large steps by changing the nucleotide sequence the promoter (e.g. mutating the promoter). This results in families of promoters with different strengths that can be used to control the maximum rate of gene expression for certain genes.

UC Davis Undergraduate Connection:

A group of UC Davis students interested in synthetic biology used this idea to create synthetic promoter libraries for engineering microbes as part of their design project for the 2011 iGEM competition.

Example #1: Trp Operon

Logic for regulating tryptophan biosynthesis

E. coli, like all organisms, needs to either synthesize or consume amino acids to survive. The amino acid tryptophan is one such amino acid. E. colican either import tryptophan from the environment (eating what it can scavenge from the world around it) or synthesize tryptophan de novo using enzymes that are encoded by five genes. These five genes are encoded next to each other in the E. coli genome into what is called the tryptophan (trp) operon (Figure below). If tryptophan is present in the environment, then E. coli does not need to synthesize it and the switch controlling the activation of the genes in the trp operon is switched off. However, when environmental tryptophan availability is low, the switch controlling the operon is turned on, transcription is initiated, the genes are expressed, and tryptophan is synthesized. See the figure and paragraphs below for a mechanistic explanation.

Organization of the trp operon

Five genomic regions encoding tryptophan biosynthesis enzymes are arranged sequentially on the chromosome and are under the control of a single promoter - they are organized into an operon. Just before the coding region is the transcriptional start site. This is, as the name implies, the location where the RNA polymerase starts a new transcript. The promoter sequence is further upstream of the transcriptional start site.

A DNA sequence called an "operator" is also encoded between the promoter and the first trp coding gene. Esse operador is the DNA sequence to which the transcription factor protein will bind.

A few more details regarding TF binding sites

It should be noted that the use of the term "operator" is limited to just a few regulatory systems and almost always refers to the binding site for a negatively acting transcription factor. Conceptually what you need to remember is that there are sites on the DNA that interact with regulatory proteins allowing them to perform their appropriate function (e.g. repress or activate transcription). This theme will be repeated universally across biology whether the "operator" term is used or not.

Moreover, while the specific examples you will be show depict TF binding sites in their known locations, these locations are not universal to all systems. Transcription factor binding sites can vary in location relative to the promoter. There are some patterns (e.g. positive regulators are often upstream of the promoter and negative regulators bind downstream), but these generalizations are not true for all cases. Again, the key thing to remember is that transcription factors (both positive and negatively acting) have binding sites with which they interact to help regulate the initiation of transcription by RNA polymerase.

The five genes that are needed to synthesize tryptophan in E. coli are located next to each other in the trp operon. When tryptophan is plentiful, two tryptophan molecules bind to the transcription factor and allow the TF-tryptophan complex to bind at the operator sequence. This physically blocks the RNA polymerase from transcribing the tryptophan biosynthesis genes. When tryptophan is absent, the transcription factor does not bind to the operator and the genes are transcribed.
Attribution: Marc T. Facciotti (own work)

Regulation of the trp operon

When tryptophan is present in the cell: two tryptophan molecules bind to the trp repressor protein. When tryptophan binds to the transcription factor it causes a conformational change in the protein which now allows the TF-tryptophan complex to bind to the trp operator sequence. Binding of the tryptophan–repressor complex at the operator physically prevents the RNA polymerase from binding, and transcribing the downstream genes. When tryptophan is not present in the cell, the transcription factor does not bind to the operator; therefore, the transcription proceeds, the tryptophan utilization genes are transcribed and translated, and tryptophan is thus synthesized.

Since the transcription factor actively binds to the operator to keep the genes turned off, the trp operon is said to be "negatively regulated" and the proteins that bind to the operator to silence trp expression are negative regulators.

Suggested discussion

Do you think that the constitutive expression levels of the trp operon are high or low? Porque?

Suggestion discussion

Suppose nature took a different approach to regulating the trp operon. Design a method for regulating the expression of the trp operon with a positive regulator instead of a negative regulator. (hint: we ask this kind of question all of the time on exams)

External link

Watch this video to learn more about the trp operon.

Example #2: The laca operon

Rationale for studying the laca operon

In this example, we examine the regulation of genes encoding proteins whose physiological role is to import and assimilate the disaccharide lactose, the laca operon. The story of the regulation of laca operon is a common example used in many introductory biology classes to illustrate basic principles of inducible gene regulation. We choose to describe this example second because it is, in our estimation, more complicated than the previous example involving the activity of a single negatively acting transcription factor. By contrast, the regulation of the laca operon is, in our opinion, a wonderful example of how the coordinated activity of both positive and negative regulators around the same promoter can be used to integrate multiple different sources of cellular information to regulate the expression of genes.

As you go through this example, keep in mind the last point. For many Bis2a instructors it is more important for you to learn the laca operon story and guiding principles than it is for you to memorize the logic table presented below. When this is the case, the instructor will usually make a point to let you know. These instructors often deliberately do NOT include exam questions about the laca operon. Rather they will test you on whether you understood the fundamental principles underlying the regulatory mechanisms that you study using the lac operon example. If it's not clear what the instructor wants you should ask.

The utilization of lactose

Lactose is a disaccharide composed of the hexoses glucose and galactose. It is commonly found in high abundance in milk and some milk products. As one can imagine, the disaccharide can be an important food-stuff for microbes that are able to utilize its two hexoses. coli is able to use multiple different sugars as energy and carbon sources, including lactose and the laca operon is a structure that encodes the genes necessary to acquire and process lactose from the local environment. Lactose, however, has not been frequently encountered by E. coli during its evolution and therefore the genes of the laca operon must typically be repressed (i.e. "turned off") when lactose is absent. Driving transcription of these genes when lactose is absent would waste precious cellular energy. By contrast, when lactose is present, it would make logical sense for the genes responsible for the utilization of the sugar to be expressed (i.e. "turned on"). So far the story is very similar to that of the tryptophan operon described above.

However, there is a catch. Experiments conducted in the 1950's by Jacob and Monod clearly demonstrated that E. coli prefers to utilize all the glucose present in the environment before it begins to utilize lactose. This means that the mechanism used to decide whether or not to express the lactose utilization genes must be able to integrate two types of information (1) the concentration of glucose and (2) the concentration of lactose. While this could theoretically be accomplished in multiple ways, we will examine how the laca operon accomplishes this by using multiple transcription factors.

The transcriptional regulators of the laca operon

O laca repressor - a direct sensor of lactose

As noted, the laca operon normally has very low to no transcriptional output in the absence of lactose. This is due to two factors: (1) the constitutive promoter strength for the operon is relatively low and (2) the constant presence of the LacI repressor protein negatively influences transcription. This protein binds to the operator site near the promoter and blocks RNA polymerase from transcribing the laca operon genes. By contrast, if lactose is present, lactose will bind to the LacI protein, inducing a conformational change that prevents LacI-lactose complex from binding to its binding sites. Therefore, when lactose is present the negative regulatory LacI is not bound to the its binding site and transcription of lactose utilizing genes can proceed.

CAP protein - an indirect sensor of glucose

No E. coli, when glucose levels drop, the small molecule cyclic AMP (cAMP) begins to accumulate in the cell. cAMP is a common signaling molecule that is involved in glucose and energy metabolism in many organisms. When glucose levels decline in the cell, the increasing concentrations of cAMP allow this compound to bind to the positive transcriptional regulator called catabolite activator protein (CAP) - also referred to as CRP. cAMP-CAP complex has many sites located throughout the E. coli genome and many of these sites are located near the promoters of many operons that control the processing of various sugars.

No laca operon, the cAMP-CAP binding site is located upstream of the promoter. Binding of cAMP-CAP to the DNA helps to recruit and retain RNA polymerase to the promoter. The increased occupancy of RNA polymerase to its promoter, in turn, results in increased transcriptional output. In this case the CAP protein is acting as a positive regulator.

Note that the CAP-cAMP complex can, in other operons, also act as a negative regulator depending upon where the binding site for CAP-cAMP complex is located relative to the RNA polymerase binding site.

Putting it all together: Inducing expression of the lac operon

For the laca operon to be activated, two conditions must be met. First, the level of glucose must be very low or non-existent. Second, lactose must be present. Only when glucose is absent and lactose is present will the laca operon be transcribed. When this condition is achieved the LacI-lactose complex dissociates the negative regulator from near the promoter, freeing the RNA polymerase to transcribe the operon's genes. Moreover, high cAMP (indirectly indicative of low glucose) levels trigger the formation of the CAP-cAMP complex. This TF-inducer pair now bind near the promoter and act to positively recruit the RNA polymerase. This added positive influence boosts transcriptional output and lactose can be efficiently utilized. The mechanistic output of other combinations of binary glucose and lactose conditions are descried in the table below and in the figure that follows.

Truth Table for Lac Operon

Transcription of the lac operon is carefully regulated so that its expression only occurs when glucose is limited and lactose is present to serve as an alternative fuel source.
Attribution: Marc T. Facciotti (own work)
Signals that Induce or Repress Transcription of the laca Operon
GlucoseCAP bindsLactoseRepressor bindsTranscription
+--+Não
+-+-Algum
-+-+Não
-++-sim

A more nuanced view of lac repressor function

The description of the lac repressor's function correctly describes the logic of the control mechanism used around the lac promoter. However, the molecular description of binding sites is a bit overly simplified. In reality the lac repressor has three similar, but not identical, binding sites called Operator 1, Operator 2, and Operator 3. Operator 1 is very close to the transcript start site (denoted +1). Operator 2 is located about +400nt into the coding region of the LacZ protein. Operator 3 is located about -80nt before the transcript start site (just "outside" of the CAP binding site).

The lac operon regulatory region depicting the promoter, three lac operators, and CAP binding site. The coding region for the Lac Z protein is also shown relative to the operator sequences. Note that two of the operators are in the protein coding region - there are multiple different types of information simultaneously encoded in the DNA.
Attribution: Marc T. Facciotti (own work)

The lac repressor tetramer (blue) depicted binding two operators on a strand of looped DNA (orange).
Attribution: Marc T. Facciotti (own work) - Adapted from Goodsell (https://pdb101.rcsb.org/motm/39)

Eukaryotic Gene Regulation

Regulation overview

As was previously noted, regulation is all about decision making. Gene regulation, as a general topic, is related to making decisions about the functional expression of genetic material. Whether the final product is an RNA species or a protein, the production of the final expressed product requires processes that take multiple steps. We have spent some time discussing some of these steps (i.e. transcription and translation) and some of the mechanisms that nature uses for sensing cellular and environmental information to regulate the initiation of transcription.

When we discussed the concept of strong and weak promoters we introduced the idea that regulating the amount (number of molecules) of transcript that was produced from a promoter in some unit of time might also be important for function. This should not be entirely surprising. For a protein coding gene, the more transcript that is produced, the greater potential there is to make more protein. This might be important in cases where making a lot of a particular enzyme is key for survival. By contrast, in other cases only a little protein is required and making too much would be a waste of cellular resources. In this case low levels of transcription might be preferred. Promoters of differing strengths can accommodate these varying needs. With regards to transcript number, we also briefly mentioned that synthesis is not the only way to regulate abundance. Degradation processes are also important to consider.

In this section, we add to these themes by focusing on eukaryotic regulatory processes. Specifically, we examine - and sometimes re-examine - some of the multiple steps that are required to express genetic material in eukaryotic organisms in the context of regulation. We want you not only to think about the processes but also to recognize that each step in the process of expression is also an opportunity to fine tune not only the abundance of a transcript or protein but also its functional state, form (or variant), and/or stability. Each of these additional factors may also be vitally important to consider for influencing the abundance of conditionally-specific functional variants.

Structural differences between bacterial and eukaryotic cells influencing gene regulation

The defining hallmark of the eukaryotic cell is the nucleus, a double membrane that encloses the cell's hereditary material. In order to efficiently fits the organism's DNA into the confined space of the nucleus, the DNA is first packaged and organized by protein into a structure called chromatin. This packaging of the nuclear material reduces access to specific parts of the chromatin. Indeed, some elements of the DNA are so tightly packed that the transcriptional machinery cannot access regulatory sites like promoters. This means that one of the first sites of transcriptional regulation in eukaryotes must be the control access to the DNA itself. Chromatin proteins can be subject to enzymatic modification that can influence whether they bind tightly (limited transcriptional access) or more loosely (greater transcriptional access) to a segment of DNA . This process of modification - whichever direction is considered first - is reversible. Therefore DNA can be dynamically sequestered and made available when the "time is right".

The regulation of gene expression in eukaryotes also involves some of the same additional fundamental mechanisms discussed in the module on bacterial regulation (i.e. the use of strong or weak promoters, transcription factors, terminators etc.) but the actual number of proteins involved is typically much greater in eukaryotes than bacteria or archaea.

The post-transcriptional enzymatic processing of RNA that occurs in the nucleus and the export of the mature mRNA to the cytosol are two additional difference between bacterial and eukaryotic gene regulation. We will consider this level of regulation in more detail below.

Depiction of some key differences between the processes of bacterial and eukaryotic gene expression. Note in this case the presence of histone and histone modifiers, the splicing of pre-mRNA, and the export of the mature RNA from the nucleus as key differentiators between the bacterial and eukaryotic systems.
Attribution: Marc T. Facciotti (own work)

DNA Packing and Epigenetic Markers

The DNA in eukaryotic cells is precisely wound, folded, and compacted into chromosomes so that it will fit into the nucleus. It is also organized so that specific segments of the chromosomes can be easily accessed as needed by the cell. Areas of the chromosomes that are more tightly compacted will be harder for proteins to bind and therefore lead to reduced gene expression of genes encoded in those areas. Regions of the genome that are loosely compacted will be easier for proteins to access, thus increasing the likelihood that the gene will be transcribed. Discussed here are the ways in which cells regulate the density of DNA compaction.

DNA packing

The first level of organization, or packing, is the winding of DNA strands around histone proteins. Histones package and order DNA into structural units called nucleosomes, which can control the access of proteins to specific DNA regions. Under the electron microscope, this winding of DNA around histone proteins to form nucleosomes looks like small beads on a string. These beads (nucleosome complexes) can move along the string (DNA) to alter which areas of the DNA are accessible to transcriptional machinery. While nucleosomes can move to open the chromosome structure to expose a segment of DNA, they do so in a very controlled manner.

DNA is folded around histone proteins to create (a) nucleosome complexes. These nucleosomes control the access of proteins to the underlying DNA. When viewed through an electron microscope (b), the nucleosomes look like beads on a string. (credit “micrograph”: modification of work by Chris Woodcock)

Histone Modification

How the histone proteins move is dependent on chemical signals found on both the histone proteins and on the DNA. These chemical signals are chemical tags added to histone proteins and the DNA that tell the histones if a chromosomal region should be "open" or "closed". The figure below depicts modifications to histone proteins and DNA. These tags are not permanent, but may be added or removed as needed. They are chemical modifications (phosphate, methyl, or acetyl groups) that are attached to specific amino acids in the histone proteins or to the nucleotides of the DNA. The tags do not alter the DNA base sequence, but they do alter how tightly wound the DNA is around the histone proteins. DNA is a negatively charged molecule; therefore, changes in the charge of the histone will change how tightly wound the DNA molecule will be. When unmodified, the histone proteins have a large positive charge; by adding chemical modifications like acetyl groups, the charge becomes less positive.

Nucleosomes can slide along DNA. When nucleosomes are spaced closely together (top), transcription factors cannot bind and gene expression is turned off. When the nucleosomes are spaced far apart (bottom), the DNA is exposed. Transcription factors can bind, allowing gene expression to occur. Modifications to the histones and DNA affect nucleosome spacing.

Suggested discussion

Why do histone proteins normally have a large amount of positive charges (histones contain a high number of lysine amino acids). Would removal of the positive charges cause a tightening of loosening of the histone-DNA interaction?

Suggested discussion

Predict the state of the histones in areas of the genome that are transcribed regularly. How do these differ from areas that do not experience high levels of transcription?

DNA Modification

The DNA molecule itself can also be modified. This occurs within very specific regions called CpG islands. These are stretches with a high frequency of cytosine and guanine dinucleotide DNA pairs (CG) often found in the promoter regions of genes. When this configuration exists, the cytosine member of the pair can be methylated (a methyl group is added). This modification changes how the DNA interacts with proteins, including the histone proteins that control access to the region. Highly methylated (hypermethylated) DNA regions with deacetylated histones are tightly coiled and transcriptionally inactive.

Epigenetic changes do not result in permanent changes in the DNA sequence. Epigenetic changes alter the chromatin structure (protein-DNA complex) to allow or deny access to transcribe genes. DNA modification such as methylation on cytosine nucleotides can either recruit repressor proteins that block RNA polymerase's access to transcribe a gene or they can aid in compacting the DNA to block all protein access to that area of the genome. These changes are reversible whereas mutations are not, however, epigenetic changes to the chromosome can also be inherited.
Source: modified from https://researcherblogski.wordpress....r/dudiwarsito/

Regulation of gene expression through chromatin remodeling is called epigenetic regulation. Epigenetic means “around genetics.” The changes that occur to the histone proteins and DNA do not alter the nucleotide sequence and are not permanent. Instead, these changes are temporary (although they often persist through multiple rounds of cell division and can be inherited) and alter the chromosomal structure (open or closed) as needed.

External link

View this video that describes how epigenetic regulation controls gene expression.

Eukaryotic gene structure and RNA processing

Eukaryotic gene structure

Many eukaryotic genes, particularly those encoding protein products, are encoded on the genome discontinuously. That is, the coding region is broken into pieces by intervening non-coding gene elements. The coding regions are termed exons while the intervening non-coding elements are termed íntrons. The figure below depicts a generic eukaryotic gene.

The parts of a typical discontinuous eukaryotic gene. Facciotti (own work)

Parts of a generic eukaryotic gene include familiar elements like a promoter and terminator. Between those two elements, the region encoding all of the elements of the gene that have the potential to be translated (they have no stop codons), like in bacterial systems, is called the open reading frame (ORF). Enhancer and/or silencer elements are regions of the DNA that serve to recruit regulatory proteins. These can be relatively close to the promoter, like in bacterial systems, or thousands of nucleotides away. Also present in many bacterial transcripts, 5' and 3' untranslated regions (UTRs) also exist. These regions of the gene encode segments of the transcript, which, as their names imply, are not translated and sit 5' and 3', respectively, to the ORF. The UTRs typically encode some regulatory elements critical for regulating transcription or steps of gene expression that occur post-transcriptionally.

The RNA species resulting from the transcription of these genes are also discontinuous and must therefore be processed before exiting the nucleus to be translated or used in the cytosol as mature RNAs. In eukaryotic systems this includes RNA splicing, 5' capping, 3' end cleavage and polyadenylation. This series of steps is a complex molecular process that must occur within the closed confines of the nucleus. Each one of these steps provides an opportunity for regulating the abundance of exported transcripts and the functional forms that these transcripts will take. While these would be topics for more advanced courses, think about how to frame some of the following topics as subproblems of the Design Challenge of genetic regulation. If nothing else, begin to appreciate the highly orchestrated molecular dance that must occur to express a gene and how this is a stunning bit of evolutionary engineering.

5' capping

Like in bacterial systems, eukaryotic systems must assemble a pre-initiation complex at and around the promoter sequence to initiate transcription. The complexes that assemble in eukaryotes serve many of the same function as those in bacterial systems but they are significantly more complex, involving many more regulatory proteins. This added complexity allows for a greater degree of regulation and for the assembly of proteins with functions that occur predominantly in eukaryotic systems. One of these additional functions is the "capping" of nascent transcripts.

In eukaryotic protein coding genes, the RNA that is first produced is called the pre-mRNA. The "pre" prefix signifies that this is not the full mature mRNA that will be translated and that it first requires some processing. The modification known as 5'-capping occurs after the pre-mRNA is about 20-30 nucleotides in length. At this point the pre-RNA typically receives its first post-transcriptional modification, a 5'-cap. The "cap" is a chemical modification - a 7-methylguanosine - whose addition to the 5' end of the transcript is enzymatically catalyzed by multiple enzymes called the capping enzyme complex (CEC) a group of multiple enzymes that carry out sequential steps involved in adding the 5'-cap. The CEC binds to the RNA polymerase very early in transcription and carries out a modification of the 5' triphosphate, the subsequent transfer of at GTP to this end (connecting the two nucleotides using a unique 5'-to-5' linkage), the methylation of the newly transferred guanine, and in some transcripts the additional modifications to the first few nucleotides. This 5'-cap appears to function by protecting the emerging transcript from degradation and is quickly bound by RNA binding proteins known as the cap-binding complex (CBC). There is some evidence that this modification and the proteins bound to it play a role in targeting the transcript for export from the nucleus. Protecting the nascent RNA from degradation is not only important for conserving the energy invested in creating the transcript but is clearly involved in regulating the abundance of fully-functional transcript that is produced. Moreover, the role of the 5'-cap in guiding the transcript for export will directly help to regulate not only the amount of transcript that is made but, perhaps more importantly, the amount of transcript that is exported to the cytoplasm that has the potential to be translated.

The structure of a typical 7-methylguanylate cap. Facciotti (own work)

Transcript splicing

Nascent transcripts must be processed into mature RNAs by joining exons and removing the intervening introns. This is accomplished by a multicomponent complex of RNA and proteins called the spliceosome. The spliceosome complex assembles on the nascent transcript and in many cases the decisions about which introns to combine into a mature transcript are made at this point. How these decisions are made is still not completely understood but involves the recognition of specific DNA sequences at the splice sites by RNA and protein species and several catalytic events. It is interesting to note that the catalytic portion of the spliceosome is made of RNA rather than protein. Recall that the ribosome is another example of a RNA-protein complex where the RNA serves as the primary catalytic component. The selection of which splice variant to make is a form of regulating gene expression. In this case rather than simply influencing abundance of a transcript, alternative splicing allows the cell to make decisions about which form of transcript is made.

The alternative splice forms of genes that result in protein products of related structure but of varying function are known as isoforms. The creation of isoforms is common in eukaryotic systems and is known to be important in different stages of development in multicellular organisms and in defining the functions of different cell types. By encoding multiple possible gene products from a single gene whose transcription initiation is encoded from a single transcriptional regulatory site (by making the decision of which end-product to produce post-transcriptionally) obviates the need to create and maintain independent copies of each gene in different parts of the genome and evolving independent regulatory sites. Therefore, the ability to form multiple isoforms from a single coding region is though to be evolutionarily advantageous because it enables some efficiency in DNA coding, minimizes transcriptional regulatory complexity, and may lower the energy burden of maintaining more DNA and protecting it from mutation. Some examples of possible outcomes of alternative splicing can include: the generation of enzyme variants with differential substrate affinity or catalytic rates; signal sequences that target proteins to various sub-cellular compartments can be changed; entirely new functions, via the swapping of protein domains can be created. These are just a few examples.

One additional interesting possible outcome of alternative splicing is the introduction of stop codons that can, through a mechanism that seems to require translation, lead to the targeted decay of the transcript. This means that, in addition to the control of transcription initiation and 5'-capping, alternative splicing can also be considered one of the regulatory mechanisms that may influence transcript abundance. The effects of alternative splicing are therefore potentially broad - from complete loss of function to novel and diversified function to regulatory effects.

A figure depicting some of the different modes of alternative splicing illustrating how different splice variants can lead to different protein forms.
Attribution: Marc T. Facciotti (own work)

3' end cleavage and polyadenylation

One final modification is made to nascent pre-mRNAs before they leave the nucleus - the cleavage of the 3' end and its polyadenylation. This two step process is catalyzed by two different enzymes (as depicted below) and may decorate the 3' end of transcripts with up to nearly 200 nucleotides. This modification enhances the stability of the transcript. Generally, the more As in the polyA tag the longer lifetime that transcript has. The polyA tag also seems to play a role in the export of the transcript from the nucleus. Therefore, the 3' polyA tag plays a role in gene expression by regulating functional transcript abundance and how much is exported from the nucleus for translation.

A two step process is involved in modifying the 3' ends of transcripts prior to nuclear exports. These include cutting transcripts just downstream of a conserved sequence (AAUAAA) and transferring adenylate groups. Both processes are enzymatically catalyzed.
Attribution: Marc T. Facciotti (own work)

MicroRNAs

RNA Stability and microRNAs

In addition to the modifications of the pre-RNA described above and the associated proteins that bind to the nascent and transcripts, there are other factors that can influence the stability of the RNA in the cell. One example are elements called microRNAs. The microRNAs, or miRNAs, are short RNA molecules that are only 21–24 nucleotides in length. The miRNAs are transcribed in the nucleus as longer pre-miRNAs. These pre-miRNAs are subsequently chopped into mature miRNAs by a protein called dicer. These mature miRNAs recognize a specific sequence of a target RNA through complementary base pairing. miRNAs, however, also associate with a ribonucleoprotein complex called the RNA-induced silencing complex (RISC). RISC binds a target mRNA, along with the miRNA, to degrade the target mRNA. Together, miRNAs and the RISC complex rapidly destroy the RNA molecule. As one might expect, the transcription of pre-miRNAs and their subsequent processing is also tightly regulated.

Nuclear export

Nuclear export

Fully processed, mature transcripts, must be exported through the nucleus. Not surprisingly this process involves the coordination of a mature RNA species to which are bound many accessory proteins - some of which have been intimately involved in the modifications discussed above - and a protein complex called the nuclear pore complex (NPC). Transport through the NPC allows flow of proteins and RNA species to move in both directions and is mediated by a number of proteins. This process can be used to selectively regulate the transport of various transcripts depending on which proteins associate with the transcript in question. This means that not all transcripts are treated equally by the NPC - depending on modification state and the proteins that have associated with a specific species of RNA it can be moved either more or less efficiently across the nuclear membrane. Since the rate of movement across the pore will influence the abundance of mature transcript that is exported into the cytosol for translation export control is another example of a step in the process of gene regulation that can be modulated. In addition, recent research has implicated interactions between the NPC and transcription factors in the regulation of transcription initiation, likely through some mechanism whereby the transcription factors tether themselves to the nuclear pores. This last example demonstrates how interconnected the regulation of gene expression is across the multiple steps of this complex process.

Many additional details of the processes described above are known to some level of detail, but many more questions remain to be answered. For the sake of Bis2a it is sufficient to begin forming a model of the steps that occur in the production of a mature transcript in eukaryotic organisms. We have painted a picture with very broad strokes, trying to present a scene that reflect what happens generally in all eukaryotes. In addition to learning the key differentiating features of eukaryotic gene regulation, we would also like for Bis2a students to begin thinking of each of these steps as an opportunity for Nature to regulate gene expression in some way and to be able to rationalize how deficiencies or changes in these pathways - potentially introduced through mutation - might influence gene expression.

While we did not explicitly bring up the Design Challenge or Energy Story here these formalisms are equally adept at helping you to make some sense of what is being described. We encourage you to try making an Energy Story for various processes. We also encourage you to use the Design Challenge rubric to reexamine the stories above: identify problems that need solving; hypothesize potential solutions and criteria for success. Use there formalisms to dig deeper and ask new questions/identify new problems or things that you don't know about the processes is what experts do. Chances are that doing this suggested exercise will lead you to identify a direction of research that someone has already pursued (you'll feel pretty smart about that!). Alternatively, you may raise some brand new question that no one has thought of yet.

Control of Protein Abundance

After an mRNA has been transported to the cytoplasm, it is translated into protein. Control of this process is largely dependent on the RNA molecule. As previously discussed, the stability of the RNA will have a large impact on its translation into a protein. As the stability changes, the amount of time that it is available for translation also changes.

The initiation complex and translation rate

Like transcription, translation is controlled by proteins complexes of proteins and nucleic acids that must associate to initiate the process. In translation, one of the first complexes that must assembles to start the process is referred to as the initiation complex. The first protein to bind to the mRNA that helps initiate translation is called eukaryotic initiation factor-2 (eIF-2). Activity of the eIF-2 protein is controlled by multiple factors. The first is whether or not it is bound to a molecule of GTP. When the eIF-2 is bound to GTP it is considered to be in an active form. The eIF-2 protein bound to GTP can bind to the small 40S ribosomal subunit. When bound, the eIF-2/40S ribosome complex, bringing with it the mRNA to be translated, also recruits the methionine initiator tRNA associates. At this point, when the initiator complex is assembled, the GTP is hydrolyzed into GDP creating an "inactive form of eIF-2 that is released, along with the inorganic phosphate, from the complex. This step, in turn, allows the large 60S ribosomal subunit to bind and to begin translating the RNA. The binding of eIF-2 to the RNA further controlled by protein phosphorylation. When eIF-2 is phosphorylated, it undergoes a conformational change and cannot bind to GTP thus inhibiting the initiation complex from forming - translation is therefore inhibited (see the figure below). In the dephosphorylated state eIF-2 can bind GTP and allow the assembly of the translation initiation complex as described above. The ability of the cell therefore to tune the assembly of the translation invitation complex via a reversible chemical modification (phosphorylation) to a regulatory protein is another example of how Nature has taken advantage of even this seemingly simple step to tuned gene expression.

An increase in phosphorylation levels of eIF-2 has been observed in patients with neurodegenerative diseases such as Alzheimer’s, Parkinson’s, and Huntington’s. What impact do you think this might have on protein synthesis?

Chemical Modifications, Protein Activity, and Longevity

Not to be outdone by nucleic acids, proteins can also be chemically modified with the addition of groups including methyl, phosphate, acetyl, and ubiquitin groups. The addition or removal of these groups from proteins can regulate their activity or the length of time they exist in the cell. Sometimes these modifications can regulate where a protein is found in the cell—for example, in the nucleus, the cytoplasm, or attached to the plasma membrane.

Chemical modifications can occur in response to external stimuli such as stress, the lack of nutrients, heat, or ultraviolet light exposure. In addition to regulating the function of the proteins themselves, if these changes occur on specific proteins they can alter epigenetic accessibility (in the case of histone modification), transcription (transcription factors), mRNA stability (RNA binding proteins), or translation (eIF-2) thus feeding back and regulating various parts of the process of gene expression. In the case of modification to regulatory proteins, this can be an efficient way for the cell to rapidly change the levels of specific proteins in response to the environment by regulating various steps in the process.

The addition of an ubiquitin group has another function - it marks that protein for degradation. Ubiquitin is a small molecule that acts like a flag indicating that the tagged proteins should be targeted to an organelle called the proteasome. This organelle is a large multi-protein complex that functions to cleave proteins into smaller pieces that can then be recycled. Ubiquitination (the addition of a ubiquitin tag), therefore helps to control gene expression by altering the functional lifetime of the protein product.

Proteins with ubiquitin tags are marked for degradation within the proteasome.

In conclusion, we see that gene regulation is complex and that it can be modulated at each step in the process of expressing a functional gene product. Moreover, the regulatory elements that happen at each step can act to influence other regulatory steps both earlier and later in the process of gene expression (i.e. the process of chemically altering a transcription factor can influence the regulation of its own transcription many steps earlier in the process). These complex sets of interactions form what are known as gene regulatory networks. Understanding the structure and dynamics of these networks is critical for understanding how different cells function, the basis for numerous diseases, developmental processes, and how cells make decisions about how to react to the many factors that are in constant flux both inside and outside.


Assista o vídeo: Viagem ao Coração da Irlanda (Janeiro 2022).