Mètodes Teòrics i Experimentals per a l'Estudi de Macromolècules
Clasificado en Química
Escrito el en catalán con un tamaño de 2,23 MB
Mètodes Teòrics per a l'Estudi de Macromolècules
Mètodes de predicció de propietats primàries
A partir de la seqüència, podem determinar: pI, massa molecular (M), corba de titulació, coeficient d'extinció.
Perfils d'Hidrofobicitat
A partir de la hidrofobicitat mitjana de cada aminoàcid (aa) i els seus coeficients de partició, s'obté informació sobre regions internes i externes, així com regions transmembrana.
SWISSPROT: Serveix per reconèixer llocs de glicosilació, sulfatació, predicció de determinants antigènics, etc.
Predicció de funcionalitat per similitud de seqüència
Si dues seqüències tenen una estructura similar, hi ha possibilitats de tenir una funcionalitat similar.
Tècniques de Similitud Global
Alineen la seqüència problema amb tota la base de dades.
- BLAST, PSIBLAST, CLUSTAL, TCOFFEE: Generen un llistat de proteïnes semblants.
- PSIBLAST: Busca homòlegs d'homòlegs.
Tècniques de Similitud per Característiques
Basades en seqüències curtes d'aminoàcids.
- PROSITE: Detecta la presència de seqüències curtes significatives per a la funció.
Tècniques de predicció d'estructura secundària
- RNAFOLD: Determina estructures de seqüències de RNA (loops, longituds òptimes, etc.).
Model de Chou i Fasman
Hi ha tres tipus d'estructura secundària de proteïnes: alfa-hèlix, beta-fulla i gir. S'estudia la base de dades i es mira en quina estructura secundària es troba cada residu. Es calculen probabilitats i es deriven propensions (tendència intrínseca d'un residu a pertànyer a una estructura secundària donada). Les probabilitats obtingudes es promitgen en finestres de 5 o 6 residus per derivar l'estructura del fragment.
- JPRED, AGADIR: Donen informació 2D, no 3D. No són útils per a proteïnes intrínsecament desordenades (IDP).
Tècniques de predicció de fragments transmembrana
Les proteïnes de membrana són molt difícils de cristal·litzar. Aquestes tècniques combinen algoritmes d'homologia amb mètodes de predicció d'estructura secundària i perfils d'hidrofobicitat. Exemples: SOSUI i TMHMM.
Tècniques de predicció de dominis estructurals
Utilitzen tècniques d'homologia per alineament múltiple. Amb PFAM, podem conèixer la funcionalitat.
Tècniques de predicció d'estructura terciària per homologia
- SWISMODEL/MODELLER: Alineen la seqüència de la proteïna problema amb una o diverses proteïnes d'estructura coneguda. Les cadenes principals de la proteïna problema i de les proteïnes de referència se sobreposen, satisfent els criteris de manteniment de la topologia d'enllaç de la proteïna, i s'orienten les cadenes laterals en la mesura del possible.
Aquesta tècnica és poderosa si l'homologia és alta. Les cadenes laterals tenen menys qualitat que la cadena principal. Les regions de loop no són ben modelades. Quan baixem del 30% d'homologia, entrem a la zona de penombra (twilight-zone), on el model és poc clar. Per sota del 20%, la tècnica no és aplicable. Només és fiable a nivell de domini.
Tècniques de predicció d'estructura terciària per threading
S'utilitza quan la identitat de seqüència és molt baixa (per sota del 20%) o per a l'assignació de funció a proteïnes que no tenen homòlegs. THREADER assignarà a la proteïna un plegament que serà un dels reportats a les bases de dades d'estructures com CATH o SCOP. Aquestes bases de dades classifiquen les proteïnes del PDB definint diferents tipus de plegament de manera jeràrquica. Col·loquen la cadena de la proteïna problema en cadascun dels folds i avaluen l'estabilitat; el més estable serà el fold candidat.
Mètodes de predicció ab initio a partir de potencials estadístics
A partir de potencials estadístics que donen una idea de la preferència d'un residu per un determinat entorn. ROSSETTA és aplicable a proteïnes petites i globulars, i permet conèixer l'estructura de proteïnes in silico (no existents a la natura). Els potencials estadístics es deriven d'observar la distribució global i relativa d'aminoàcids en proteïnes (PDB), obtenint un conjunt de funcions que descriuen les posicions relatives més comunes de parelles de residus. PROSA interpreta potencials per determinar l'estabilitat d'un determinat residu en el seu entorn proteic (s'utilitza amb dades de raigs X i RMN).
Predicció de Proteïnes Intrínsecament Desordenades (IDP)
La predicció es basa en el fet que contenen pocs residus hidrofòbics i molts carregats, amb poca variació d'aminoàcids. Exemples: IUPRED, DISPROT i DISEMBL.
AlphaFold2 i les Tècniques d'Intel·ligència Artificial
- AlphaFold2: Utilitza alineaments múltiples i la informació estructural del PDB.
Alineaments Múltiples
Proporcionen dos tipus d'informació:
- Similitud global i local.
- Existència de mutacions correlacionades que donen informació sobre residus en contacte.
Aquesta informació alimenta una xarxa neuronal espacial, que interpreta elements de seqüència relacionats amb motius estructurals.
Informació Estructural
Crea moltes relacions en l'espai entre tríades de residus, derivades dels alineaments múltiples i la informació estructural del PDB.
Mètodes Microscòpics de Simulació
- Mecànica Quàntica (QM): Descriu el sistema atòmicament, introduint graus de llibertat de nuclis i electrons segons la física quàntica.
- Mecànica Clàssica (MM): Descriu el sistema atòmicament considerant només la posició dels àtoms, segons la mecànica newtoniana.
- Híbrid QM/MM: Una part del sistema es tracta quànticament i l'altra clàssicament, útil per a simulacions de reactivitat enzimàtica (on el centre actiu es tracta quànticament).
Mecànica Clàssica: Camp de Força
L'energia del sistema s'expressa mitjançant equacions simples de camp de força, escollides a partir d'evidències experimentals. Cada tipus d'enllaç tindrà una constant de força (K) i una distància òptima (I0).
Interaccions d'Enllaç
1. Stretching
Resistència de dos àtoms enllaçats a variar la seva distància. Es descriu amb un terme harmònic de Hooke.
2. Bending
Resistència de tres àtoms consecutius a variar el seu angle d'equilibri. Es descriu amb termes parabòlics harmònics de Hooke.
3. Torsió
Energètica de rotació respecte als enllaços químics. Es descriu amb una sèrie de Fourier amb termes de diferent periodicitat.
Interaccions de No Enllaç
Interaccions entre àtoms separats per més de tres enllaços covalents.
1. Interaccions Electrostàtiques
Interaccions entre les distribucions de càrrega dels diferents àtoms de la molècula.
2. Interaccions de Van der Waals
Eviten la fusió de dos àtoms no units de diferent càrrega i representen les interaccions atractives a petita distància degudes a les forces dispersives.
Parametrització
Per poder realitzar càlculs de camp de força, necessitem conèixer els paràmetres que defineixen els diferents tipus d'interacció:
- Stretchings i Bendings: Es determinen mitjançant càlculs quàntics (IR, raigs X, etc.).
- Torsions: A partir de dades quàntiques (RMN). També es poden utilitzar mètodes quàntics on es calcula la densitat de càrrega i s'integra sobre els nuclis, o experimentalment per densitats electròniques de raigs X.
- Van der Waals: Quànticament per perfils d'interacció entre dues molècules, o experimentalment per dades d'empaquetament cristal·lí.
Mètodes que Empleen la Mecànica Clàssica
Mecànica Molecular (MM)
Busca la disposició espacial dels nuclis més estables, amb un mínim d'energia.
Dinàmica Molecular (MD)
La informació sobre l'energia es processa per obtenir les forces que actuen sobre cada àtom, les quals determinen les trajectòries de cada àtom, és a dir, les seves posicions al llarg del temps. No són aplicables a reaccions químiques o processos descrits per la naturalesa quàntica de les molècules. Per a molècules petites o per estudiar reaccions químiques, s'utilitzen mètodes quàntics. Per a sistemes grans que no pateixen reaccions químiques, s'utilitza la MD.
Tècniques de Mecànica Molecular
Es basen en trobar la conformació de mínima energia i la seva energia. També s'utilitzen per mesurar energies d'interacció entre dues molècules que interaccionen amb una proteïna. No es poden introduir efectes de temperatura, ja que el càlcul es fa a T=0K. No podem estar segurs que el mínim d'energia trobat sigui absolut, ja que depenem de les coordenades inicials.
Tècniques de Dinàmica Molecular
Permeten obtenir una visió de les trajectòries del sistema al llarg del temps. Es calculen les acceleracions dels àtoms per obtenir les seves posicions al llarg del temps, tenint en compte les temperatures i el temps. L'etapa d'integració ha de ser més petita que el moviment més ràpid del sistema (les vibracions d'enllaç), que és de l'escala del femtosegon (10-15 s). Si volem simular 1 nanosegon, hem de fer aproximadament 106 integracions.
Mètodes Físics de Baixa Resolució
Degut a l'alt cost computacional, s'han desenvolupat nous mètodes que proporcionen informació de dinàmica de manera més senzilla:
- Dinàmica Coarse-Grain: Realitza els mateixos càlculs que la MD, però condensa àtoms en grups per reduir els graus de llibertat del sistema. En tenir partícules més pesades, es mouen més lentament i es pot augmentar l'etapa d'integració.
- Elastic Network Models: Representen la flexibilitat de les proteïnes i les seves oscil·lacions al voltant de la posició d'equilibri en un plegament. Assumeixen que una proteïna reaccionarà respecte a la pertorbació de la seva conformació d'equilibri. També assumeixen el principi de 'no frustració', segons el qual cada residu es troba en un entorn favorable i reaccionarà si aquest es vol modificar. La reacció és de tipus harmònic i permet veure com canvia la posició d'un residu respecte als seus veïns dins d'un cutoff.
Plegament de Proteïnes
- Proteïnes amb estructura 3D definida.
- Proteïnes plegades amb un nombre finit de conformacions alternatives.
- Proteïnes Intrínsecament Desordenades (IDP).
- Molten Globule Protein (MGP): Elements d'estructura molt definits s'organitzen de manera variable.
Rotamases, disulfur-isomerases i xaperones catalitzen el plegament in vivo i milloren la cinètica.
Paradoxa de Levinthal
Les proteïnes triguen molt a plegar-se.
Forces que Condicionen el Plegament
L'energia lliure de plegament (ΔGfold) ha de ser negativa, i s'ha d'augmentar el desordre (entropia).
Processos que Marquen l'Estabilitat de les Proteïnes
1. Interaccions d'Enllaç
La forma nativa de les proteïnes presenta totes les distàncies i gairebé tots els angles pròxims als valors d'equilibri. Els enllaços amida es troben en posició trans, excepte en les prolines. Les rotamases faciliten el canvi de prolines de conformació cis a trans, tot i que no estableixen un equilibri. Els ponts disulfur (di-S) estabilitzen l'estructura (facilitats per les proteïnes disulfur-isomerases).
2. Interaccions No Enllaçants
- Interaccions no específiques: Forces de Van der Waals i interaccions electrostàtiques febles (contribueixen poc a l'estabilitat).
- Ponts d'hidrogen: Interaccions electrostàtiques d'intensitat moderada, molt direccionals i clau en fenòmens de reconeixement i formació d'estructura secundària.
- Interaccions iòniques: Ponts salins, entre cadenes laterals de residus carregats.
Experiment d'Anfinsen
Demostra que les interaccions no enllaçants són les que guien el plegament. S'afegeix urea (trenca interaccions no enllaçants) i betamercaptoetanol (trenca ponts disulfur). La mostra es divideix en dues alíquotes:
- Es retira primer la urea i després el betamercaptoetanol.
- Es retira primer el betamercaptoetanol i després la urea.
La proteïna només es renaturalitza en la primera alíquota. Per tant, les interaccions no enllaçants són les rellevants a l'hora de plegar una proteïna:
- Els ponts salins NO ho són, perquè no totes les proteïnes en tenen i no estan afavorits en aigua, ja que costa molt dessolvatar els ions.
- Els ponts d'hidrogen NO ho són, perquè són intensos i direccionals, i el nombre d'enllaços H (proteïna-proteïna i proteïna-aigua) no varia gaire abans i després de plegar-se.
És el conjunt d'interaccions el que governa el plegament, no una de concreta.
Cinètica del Plegament
1. Model de Dos Estats
La proteïna existeix en estat natiu i desplegat (com a molt s'accepta el molten globule com a intermediari).
2. Model de Múltiples Estats
Presència d'intermediaris que poden ser:
- In the path: Estructures parcialment plegades que necessiten un aport extra d'energia per arribar a la forma nativa.
- Out of the path: En proteïnes que han de formar enllaços disulfur o isomeritzacions d'enllaços peptídics. L'intermediari queda atrapat en un mínim d'energia, per la qual cosa es necessita un aport d'energia per retornar a la ruta del plegament.
3. Teoria del Plegament en un Estat (Downhill Folding)
La proteïna només existeix en la forma nativa, i les formes desplegades són formes d'excitació del mínim. El plegament és un procés espontani sense barrera d'activació. Es dona en proteïnes d'hèlix alfa i petites que es pleguen en etapes de temps molt curtes.
Models de Plegament
- Model de Trencaclosques: Diferents molècules es pleguen de manera diferent i només convergeixen les rutes en l'estat natiu.
- Model de la Carcassa (Framework): Elements clau d'estructura secundària difonen fins a donar la forma nativa.
- Model de Col·lapse Hidrofòbic: La proteïna col·lapsa ràpidament pels seus residus hidrofòbics, donant una estructura compacta que després es reorganitza per donar la forma nativa.
- Model de Nucleació-Condensació: Es forma un nucli difús no estable, sense estructura secundària, sobre el qual col·lapsa la proteïna, formant-se l'estructura secundària i terciària gairebé simultàniament.
- El model més recent és l'Entropy Funnel (Embut Entròpic): El plegament s'entén com un moviment per un paisatge energètic. No hi ha una única ruta, sinó moltes que van convergent, formant-se diferents interaccions natives. A mesura que s'avança, es va reduint l'amplitud de l'espai conformacional de la cadena i es va millorant l'energia potencial. Es pot imaginar un embut on la proteïna va caient amb cada vegada menys llibertat conformacional, però amb més estabilitat energètica. Permet englobar diferents aspectes del plegament, com la presència de xaperones, i obtenir una explicació a la paradoxa de Levinthal, ja que es va reduint l'espai conformacional.
Components Estructurals dels Àcids Nucleics
Propietats Fisicoquímiques
- Sucres i Fosfats: Tenen un paper estructural.
- Bases: Tenen un paper més funcional. Són polars amb moments dipolars; concentren molta càrrega negativa (carbonílics) i H unit a N amb càrrega positiva.
- Protonació: Els grups fosfat poden estar en diferents estats de protonació, i les bases també (p. ex., protonació de la citosina per a l'estructura de la triple hèlix).
- Atacs Nucleofílics: Poden donar dues reaccions majoritàries: l'abstracció d'un protó (normalment unit a N) i la substitució nucleofílica.
- Hidratació: Les bases tendeixen a agregar-se en aigua per interaccions de stacking, com veurem. És difícil dissoldre algunes bases per interaccions de stacking i ponts d'hidrogen entre elles. Interaccionen molt bé amb l'aigua.
- Tautomerisme: La forma ceto-amino és més estable que la enol-imino. Això altera el patró de ponts d'hidrogen de les bases, podent donar lloc a mutacions.
Conformació
Moviments respecte a l'enllaç glicosídic, de C4'-C5', rotacions respecte als enllaços del grup fosfat i moviments conformacionals de l'anell furanòsic.
1. Rotacions Respecte a l'Enllaç Exocíclic C4'-C5'
2. Rotació Respecte a l'Enllaç Glicosídic
La preferència per la conformació anti es deu a una menor repulsió estèrica, però es pot revertir posant un grup voluminós en la posició 8. L'adenosina apareix fonamentalment en anti, però amb 8-Br-adenosina apareix en conformació syn. Els valors de pH també afecten la preferència; un pH entre O5' i N2 de la guanosina pot estabilitzar la conformació syn.
3. Conformació de l'Anell Furanòsic
L'anell pot adoptar conformacions Envelope (E), amb 1 àtom fora del pla, o Twist (T), amb 2 àtoms fora del pla (pseudorotació). L'angle de fase (P) indica quin àtom o àtoms estan fora del pla, i el Puckering (Tm) indica com de fora estan (38-40º). E o T s'utilitzen per denominar si és Envelope o Twisted. El superíndex indica quin àtom està cap amunt (endo) o avall (exo). Les conformacions N i S són les més afavorides i estables (conformers C3'-endo i C2'-endo). Les transicions N-S no es donen per un intermediari pla, sinó per la zona O4'-endo, mai per la zona W (inestable).
La conformació a la zona S sol ser C2'-endo amb un angle de fase sobre 160-164º. La conformació a la zona N és C3'-endo amb un angle de fase de 15-20º. La conformació anti es pot trobar tant en puckering S com N, però en conformació syn només es troba puckering S.
Quan es forma un aparellament de Hoogsteen, la purina (A o G) ha de rotar 180º, ja sigui pel seu enllaç glicosídic o per una rotació completa del nucleòtid. Per formar un Hoogsteen invers, la pirimidina (T o C) ha de rotar.
El mode d'interacció G-C és el més favorable energèticament. L'aparellament A-T per Hoogsteen és lleugerament més estable que el de Watson-Crick. Els aparellaments erronis són més estables.
Interaccions entre Bases
El stacking és una interacció per la qual dues bases es disposen gairebé paral·leles una sobre l'altra a una distància de 3.4 Å. Manté l'estructura del DNA. Hi ha l'intra-strand stacking (apilament d'una base amb la de sota i la de dalt) i l'inter-strand stacking (apilament d'una base amb les de sota o dalt de la cadena complementària). Cada cadena té 4 interaccions de stacking. El stacking entre G és el més estable, i el que involucra T és el menys estable.
Paper de l'Aigua
Els dímers de bases en l'aigua no formen ponts d'hidrogen per l'efecte distorsionador de l'aigua. L'aigua afecta menys el stacking perquè les parts que interaccionen són les més apolars, que interaccionen menys amb l'aigua.
- RESUM:
- Al buit o fase gas: interacció per pont H >> stacking.
- En solució: interacció stacking >> pont H.
Paràmetres Conformacionals per Descriure el DNA
El sentit positiu de l'eix X és el del vector que va del minor groove al major groove.
Moviments de Translació
- De parells de bases respecte a l'eix.
- D'una base respecte a l'altra.
- D'un parell respecte a l'altre.
Formes Dextrogires (A, B, C, D, T)
Família B
La forma més habitual del DNA. Presenta 8-10 parells de bases (bp) per volta. Les bases es troben gairebé a l'eix i la inclinació és molt petita. El major groove és més ample que el minor groove i més profund. El rise és de 3 a 3.3 Å. El puckering del sucre es troba a la zona S (C2'-endo) i l'enllaç glicosídic a la zona -anti-clinal (uns -100º). És més flexible que l'A-DNA; la conformació concreta pot dependre de la seqüència, però l'A-DNA és més rígid.
Família A
Menys estilitzada, amb 11 residus per volta. Les bases estan inclinades respecte a la perpendicular de l'eix, amb una inclinació de 20º. El parell de bases es troba desplaçat cap al major groove uns 4.7 Å, la qual cosa crea un forat al centre. El rise és molt petit, per tant, hi ha poca flexibilitat. El puckering del sucre és N (C3'-endo) i la rotació respecte a l'enllaç glicosídic és -ap. El major groove és molt estret però molt profund. L'A-DNA es troba en seqüències riques en CG en condicions de baixa humitat. L'RNA i els híbrids RNA·DNA es troben en forma A.
Forma Levògira Z
Hèlix de 12 nucleòsids per volta, levògira. El puckering en els sucres és C2'-endo en anti i C3'-endo en syn. El minor groove és molt profund però molt estret. El major groove gairebé desapareix per la seva superfície convexa, amb el C5 de la citosina i els C8 i N7 de la guanina exposats. Es troba en seqüències de CGCGCGCGC. Es pot interconvertir en formes B en presència de drogues o fàrmacs.
Si la tercera cadena és pirimidina, es forma per Hoogsteen i són paral·leles. Si és purina, es forma per Hoogsteen invers i són antiparal·leles.
Raigs X
Requeriments
Cristalls de proteïnes, font de raigs X i experiments addicionals per resoldre el problema de la fase.
Cristalls de Proteïnes
Les molècules han de tenir posicions regulars (formar un cristall). Els cristalls contenen majoritàriament solvent, la qual cosa evita en el 99% dels casos que les proteïnes es deformin entre elles. La proteïna es purifica i es concentra en petites gotes barrejada amb un solvent que sol ser poc soluble. A poc a poc, el solvent es va bescanviant (per evaporació) i les proteïnes poden formar cristalls en ajuntar-se. Si no està cristal·litzada, en fer incidir els raigs X, aquests difracten en totes direccions sense detectar cap senyal.
Obtenció de Difracció i Mapa de Densitat Electrònica
Els cristalls són rotats per obtenir patrons de difracció en diferents angles, la qual cosa fa possible la reconstrucció 3D. L'operació matemàtica per obtenir el mapa de densitat electrònica a partir del patró de difracció s'anomena Transformada de Fourier i requereix conèixer l'amplitud i la fase de la radiació a cada punt. La informació experimental prové de la intensitat dels pics de difracció en diferents posicions i la seva orientació. Els cristalls es fan girar per obtenir totes les orientacions possibles. La intensitat del pic reflecteix l'amplitud de l'ona de radiació que arriba a aquest punt, però no dóna informació sobre la seva fase. Calen experiments independents per determinar la fase. Els pics de difracció que apareixen a angles més grans són els que proporcionen major resolució, que es mesura en Å i és la distància mínima entre dos punts que es poden distingir en un mapa de densitat electrònica. És una mesura del nivell de detall. Amb resolucions baixes (5 a 3 Å) no és possible situar àtoms individuals de forma acurada; amb resolucions més altes (2-0.5 Å) es mostren densitats electròniques que corresponen a posicions individuals d'àtoms.
El Problema de la Fase
- Reemplaçament Molecular (MR): S'obtenen les fases a partir d'estructures resoltes similars a la nostra proteïna, com poden ser homòlogues.
- Dispersió Anòmala a Diferents Longituds d'Ona (MAD): S'irradien els àtoms amb diferents longituds d'ona particulars de raigs X, induint un canvi de fase en cadascuna de les reflexions (dispersió anòmala). S'utilitzen proteïnes on les metionines s'han substituït per selenometionines.
- Comparació amb Derivats Isomorfs amb Metalls Pesats (MIR): Implica introduir un grup reactiu que contingui un metall pesat sense canviar l'estructura de la proteïna ni la cel·la unitat, és a dir, les estructures han de ser isomorfes. Comparant l'estructura nativa i la que conté metalls pesats en posicions conegudes, podem extreure'n les fases.
Criteris de Qualitat de l'Estructura
R i Rfree mesuren la discrepància relativa global entre les amplituds obtingudes experimentalment (Fobs) i les calculades. Rfree utilitza aproximadament 1000 reflexions seleccionades aleatòriament que no s'han utilitzat per determinar l'estructura. S'espera que les estructures ben refinades tinguin un R baix.
- RMSD (Root Mean Square Deviation): Indica en quin grau el model difereix dels paràmetres geomètrics considerats típics, com per exemple el valor de la longitud d'enllaç quan es comparen diferents models. Les estructures de bona qualitat tenen un RMSD de 0.02 Å.
LES ESTRUCTURES S'HAN DE VALIDAR.
Interpretació del Mapa de Densitat Electrònica
Els hidrògens a les estructures no se solen observar degut al seu núvol electrònic.
- Desordre Dinàmic: Conseqüència d'una mobilitat elevada o vibracions d'àtoms o fragments dins de cada cel·la unitària del cristall per la interconversió entre diferents estructures en el cristall. En la resolució de l'estructura de la proteïna, aquestes regions no apareixeran representades, ja que deixen de contribuir a la difracció de raigs X (p. ex., loops o extrems terminals de proteïnes).
- Desordre Estàtic: Degut a diferents conformacions adoptades per un fragment estructural (p. ex., un grup lateral) en diferents cel·les del cristall. Apareixen representats residus en les seves conformacions.
Sovint, la part en contacte amb el dissolvent de la proteïna conté regions amb un elevat grau de flexibilitat degut a la interacció amb aigua per ponts d'hidrogen. Si les regions desordenades són molt extenses, poden arribar a impedir la cristal·lització de la proteïna. Una estratègia habitual és eliminar les regions potencialment poc ordenades. Això fa que moltes estructures de proteïnes que són intrínsecament desordenades, en els models de raigs X, només continguin dominis globulars.
Les cadenes laterals de Glu, Gln, Asp i Asn són molt difícils de distingir, ja que la densitat electrònica de l'oxigen (O) i el nitrogen (N) són semblants, i el nombre de protons units no es pot determinar amb claredat.
Ressonància Magnètica Nuclear (RMN)
La Ressonància Magnètica Nuclear (RMN) es basa en l'observació de senyals de nuclis atòmics de la molècula que volem estudiar quan se sotmet a un camp magnètic i s'irradia amb ones de ràdio. Només els nuclis atòmics amb un spin intrínsec són adequats:
- 1H: Abundant, molt sensible, poca dispersió.
- 13C: Cal enriquir la mostra en aquest isòtop.
- 15N: Cal enriquir la mostra en aquest isòtop.
- 31P: Abundant, sensible, per a àcids nucleics.
Per expressar la proteïna i que contingui els isòtops de carboni i nitrogen, la proteïna s'expressa en bacteris o cultius cel·lulars que es fan créixer en un medi enriquit en aquests isòtops (p. ex., 15NH4Cl i 13C-glucosa). Cada senyal detectada en un espectre de RMN ens dóna informació de l'entorn on es troba aquest nucli. L'espectre d'una molècula és el conjunt de freqüències a les quals ressonen els seus nuclis.
Espectre HSQC (Heteronuclear Single Quantum Coherence)
L'HSQC és utilitzat freqüentment en espectroscòpia RMN de proteïnes. L'espectre resultant és de dues dimensions (2D), amb un eix amb freqüències de ressonància de protons (δ-1H) i l'altre d'un heteronucli que pot ser δ-15N o δ-13C. L'espectre conté un pic per cada protó unit a l'heteronucli en consideració. Són molt útils, ja que els nuclis de carboni i nitrogen tenen més dispersió de senyals i permeten minimitzar el solapament dels senyals dels protons units a ells utilitzant aquest tipus d'espectres bidimensionals. L'experiment 15N-HSQC és el més usat en RMN de proteïnes. Cada residu de la proteïna, excepte la prolina, té un protó amida connectat a un nitrogen en l'enllaç peptídic. El 15N-HSQC dóna la informació de la correlació entre el nitrogen i el protó amida; per cada grup NH, apareix un pic en l'espectre. Les prolines no deixen senyal, ja que no tenen grup amida. L'assignació seqüencial és el procés pel qual s'identifica quin és el nucli que contribueix a cadascun dels senyals observables en els espectres de RMN. Per fer-ho, s'identifiquen els senyals que pertanyen a residus veïns.
A les proteïnes plegades, l'entorn de cada residu és molt diferent i els espectres mostren molta dispersió. A les proteïnes desplegades, cada residu veu la mitjana de molts entorns diferents i, aquesta mitjana, és molt semblant per a diferents residus, i els espectres mostren poca dispersió, especialment entre els protons.
L'experiment HSQC pot ser també útil per detectar la interfície d'unió en interaccions proteïna-proteïna, a més d'interaccions amb lligands com fàrmacs. Comparant l'espectre HSQC d'una proteïna lliure i una unida a un lligand, es poden observar canvis en el desplaçament químic d'alguns pics, relacionant-los amb la superfície de contacte amb el lligand, on la unió ha pertorbat l'entorn dels àtoms i el seu desplaçament químic.
Bescanvi H/D
En el cas de la RMN, el nucli de deuteri (D, 2H) no es deixa veure en un espectre de protó. El protó del grup amida es bescanvia amb els protons de les molècules d'aigua presents al dissolvent. Els protons amida s'aniran bescanviant a poc a poc pels àtoms de deuteri. Observant el bescanvi a diferents temps, com més tardi a fer-se el bescanvi (desaparèixer el senyal), més endins de l'estructura es trobarà el residu (regió hidrofòbica). La velocitat intrínseca de bescanvi disminueix amb la temperatura i quan el pH és al voltant de 4-5.
Desplaçaments Secundaris
L'estructura secundària afecta la posició dels senyals: les diferències respecte al random coil són els desplaçaments secundaris i proporcionen un mètode per identificar regions d'estructura secundària. La diferència entre el valor observat en una proteïna plegada i el que s'esperaria a partir del tipus de residu en una proteïna sense estructura, dóna informació sobre l'estructura secundària. Els desplaçaments secundaris dels Cα adopten valors positius en hèlix alfa, mentre que en fulla beta són negatius. Els desplaçaments secundaris dels Cβ adopten valors negatius en hèlix alfa i valors positius en fulla beta. Aquesta observació és la base del Chemical Shift Index (CSI), que utilitza els desplaçaments químics i els seus desplaçaments secundaris per identificar el tipus i localització de les estructures secundàries al llarg de la proteïna. Fixeu-vos en la figura de sota.
Scalar Couplings o J-Couplings
Els J-couplings o acoblaments són interaccions manifestades a través de parells de nuclis que es troben a prop en l'estructura covalent, és a dir, units a través d'enllaços. Es basa en el fet que la informació codificada en l'estat excitat d'un nucli es pot transmetre des d'un nucli al següent, per exemple, del nucli 15N al 13Cα, establint connexions entre els nuclis. Els acoblaments es denoten com nJAX, on A i X són els nuclis que interactuen i n és el nombre d'enllaços entre aquests dos àtoms. Un tipus molt utilitzat és el 3JHN-Hα, el qual proporciona informació sobre l'angle phi (φ) de la cadena principal. L'equació de Karplus ens relaciona la constant d'acoblament 3J observada amb l'angle diedre phi.
NOESY
L'experiment fonamental per a obtenir l'estructura tridimensional d'una proteïna per RMN és el NOESY. Gràcies als senyals NOE, podem derivar moltes distàncies entre diferents protons dels diferents residus de la proteïna. Cada distància és una restricció de distància que s'haurà de complir en el model. Si s'ajunten totes les restriccions de distància de cadascun dels protons de cada residu, es pot generar un model tridimensional de la proteïna.
Microscòpia Electrònica
En la microscòpia electrònica convencional, els electrons són accelerats. La longitud d'ona depèn del voltatge d'acceleració; a 300 kV, la longitud d'ona és de 0.02 Å (longituds atòmiques). El feix d'electrons és sovint enfocat amb lents electromagnètiques i es forma una imatge directa de la mostra.
Els voltatges baixos redueixen la resolució de la imatge observada. No obstant això, la interacció del feix d'electrons amb la densitat electrònica de la mostra és 10.000 vegades més intensa que la dels raigs X. Per tant, s'obté més sensibilitat, la qual cosa permet l'estudi de microcristalls (menys molècules en el cristall), cristalls bidimensionals (d'un gruix d'una o dues molècules, especialment per a proteïnes de membrana) i fins i tot molècules individuals (sense cristalls).
L'impacte de la radiació d'alta energia causa danys a les molècules en cristalls, destrucció química de la molècula i desplaçaments que destrueixen la simetria del cristall. Això s'observa ja amb raigs X d'alta intensitat (com els obtinguts en el sincrotró) i en microscòpia electrònica. Per protegir la mostra, aquesta es congela. En el cas de la microscòpia electrònica, el moviment causat per l'impacte dels electrons es pot reconstruir i corregir.
Aquest dany es pot reduir de dues maneres:
- Tinció Negativa: La mostra se submergeix en una solució d'un metall pesat que absorbeix els electrons i deixa la imatge negativa de l'espai ocupat per la proteïna, on no hi ha metall.
- Crio-Microscòpia Electrònica (Cryo-EM): És la solució actualment. La mostra se submergeix molt ràpidament en un bany a molt baixa temperatura (nitrogen líquid, età líquid, heli líquid). L'aigua queda vitrificada, però conserva les interaccions presents en solució. El problema és la manca de contrast.
Els darrers avenços que han permès una millora en la resolució d'estructures són els detectors corregits pel moviment causat per l'impacte dels electrons. Això permet l'estudi directe de partícules individuals (sense cristalls).
La mostra consta d'uns nanolitres de proteïna purificada que s'aplica a una reixa de metall, sobre la qual hi ha una petita capa de carboni amorf amb forats. La reixa se submergeix en età líquid, formant així una fina capa de la proteïna en moltes orientacions. Es capturen imatges a través dels forats, obtenint projeccions 2D dels complexos individuals. Nombroses projeccions 2D són combinades en una única reconstrucció 3D, ja que es coneixen les seves orientacions relatives.
Aquesta tècnica permet l'observació directa de proteïnes o complexos supramoleculars en condicions quasi natives. No requereix cristal·lització (però també pot utilitzar-se). La resolució actual és propera al nivell atòmic. És útil per resoldre estructures de complexos grans (més de 200 kDa). No és aplicable a molècules petites. Exemples d'estructures que es poden resoldre són enzims grans, complexos enzimàtics, estructures supramoleculars com els ribosomes, etc.