Simulazione del comportamento strutturale e dinamico di sequenze


Che cosa vogliamo simulare?

Si vuole simulare il comportamento della dinamica di sequenze di DNA immerse in un fluido non neutro a temperatura costante, implementando i modelli nell' ambiente software SIMP/STEP, dedicato alla simulazione di automi cellulari.
Si prendono in considerazione singoli filamenti di doppia elica e si impone che vengano rispettate le leggi della fisica classica e condizioni aggiuntive che chiamiamo di "connettività" e "volume escluso", si attribuisce ai monomeri velocità di movimento diverse e specifiche, determinate in relazione alla temperatura media di fusione di coppie di basi in cis.
L' implementazione permette di effettuare misurazioni del movimento del baricentro delle stringhe nel caso di figure chiuse (rombo) e di figure aperte (rombo aperto); confrontando tra loro i risultati ottenuti si può affermare che le estremità libere influiscono sul movimento e si può valutare quantitativamente quest'effetto.
Studiare il movimento di "filamenti di DNA" è importante sia per approfondire la conoscenza delle proprietà interne della doppia elica, sia per capire come le diverse conformazioni da essi assunte influiscano sul cambiamento delle proprietà di interazione della molecola con l'esterno.
Inoltre, si studiano stringhe aperte per determinare in che modo la qualità dei monomeri terminali influenzi il movimento globale della molecola. L'emergere di queste proprietà legate alle estremità richiede, quindi, una complessità minima del sistema. Al di sotto di una lunghezza minima la proprietà ''effetto di estremità'' non compare.


Studi e risultati ottenuti

L'approccio con il quale è stato affrontato lo studio delle simulazioni è fenomenologico ed è basato sulla creazione di programmi per computer che simulano il comportamento di insiemi di unità. Le caratteristiche di queste unità collegate in stringhe sono programmate per simulare, in modo semplificato e modellizzato, le proprietà di base del DNA.
L'idea di base consiste nel simulare il comportamento dei singoli componenti adottando le seguenti scelte:

  • Si tiene conto della struttura primaria del DNA e vengono differenziati tra loro i i monomeri;

  • Ci si basa sulla struttura secondaria e si utilizzano i risultati di una analisi di Gotoh e Tagashira in cui viene descritta la variazione della temperatura di fusione locale della struttura a doppia elica, così si modula la velocità di reazione delle basi cioè il movimento nello spazio;

  • Si trascura la struttura terziaria in quanto la simulazione è in due dimensioni.


  • Inoltre rappresentiamo la doppia elica come serie di monomeri intrinsecamente collegati (la base A con la base T, e la base G con la C), ma escludiamo la possibilità di separazione tra i due filamenti.
    Il movimento di "filamenti di DNA" è stabilito determinando la velocità dei monomeri in relazione alle condizioni chimico-fisiche dell'ambiente in cui si trovano: l'effetto di queste condizioni è direttamente valutabile dalla misura della destabilizzazione della struttura della doppia elica e quest'ultima viene correlata quantitativamente con la temperatura media di fusione della doppia elica, cioè con la temperatura che mediamente è necessaria per dividere la doppia elica in due filamenti: risultati sperimentali stabiliscono che quanto più tale temperatura è alta, tanto più le molecole si muovono lentamente nella reazione all'ambiente circostante.
    Lo studio strutturale si basa sull' osservazione del comportamento dinamico dei filamenti, si selezionano per lo studio alcune variabili globali che possano rivelare l' emergenza di proprietà strutturali derivanti non dal comportamento delle singole componenti, ma dalla loro interazione e dal fenomeno osservato nella sua interezza.
    Le variabili che abbiamo scelto sono la distanza tra le due estremità per stringhe aperte di diversa lunghezza e il movimento del baricentro del sistema nel caso di figure chiuse e aperte studiandone il comportamento nel tempo.
    Quello che risulta emergere dalle simulazioni sono le differenze tra:

  • un sistema aperto e uno chiuso

  • stringhe corte e stringhe lunghe

  • un sistema simmetrico e uno asimmetrico

  • I sistemi algoritmici si basano su:

  • principi di simulazione in parallelo del movimento di stringhe dovuti a Bar-Yam

  • la relativa implementazione realizzata da Margolus in ambiente CAM-8

  • le possibilità e l'elasticità fornite dall' integrazione tra il linguaggio Python e il sistema SIMP/STEP, realizzato per il sistema operativo Linux, integrazione ottimale tra software e hardware;

  • confronti e test con stringhe reali di DNA

  • Nonostante il modello realizzato sia solo un prototipo schematizzato e semplificato, alcune delle caratteristiche e dei risultati emersi dalle simulazioni risultano particolarmente rivelatori, in quanto forniscono una possibile interpretazione a problematiche genetiche ancora oggi irrisolte quali: i rapporti tra struttura locale del DNA e struttura globale; influenza delle estremità ("telomeri") sulle proprietà fisiche globali della molecola di DNA e rapporto tra organizzazione topologica della molecola e struttura locale.


    Implementazione dei modelli

    Nell'ambiente SIMP/STEP il numero di bit messo a disposizione non è molto elevato, infatti si ha un numero massimo di 20 bit da suddividere tra tutti i piani necessari per la simulazione. Nei modelli implementati sono stati definiti dei piani necessari all'implementazione

  • m0, mb0 la combinazione dei quali sta ad indicare la presenza o l'assenza e il tipo del monomero sul piano0.

  • m1, mb1 la combinazione dei quali sta ad indicare la presenza o l'assenza e il tipo del monomero sul piano1

  • mk0, mk1 usati per marcare i monomeri in cui si effettueranno le misure.

  • NORD, SUD ,EST, OVEST contengono l'informazione sulla presenza (1) o assenza (0) dei vicini sul piano 0; il vicinato che si assume è quello di Von Neumann di raggio 1.

  • NORD0, SUD0, EST0, OVEST0 contengono l'informazione dei vicini due celle più a nord, sud, est ed ovest sul piano 0; il vicinato che si assume è quello di Von Neumann di raggio 2.

  • rand0 e rand1 sono i piani random a due stati per assegnare la direzione del movimento: 0-0 NORD, 0-1 SUD, 1-0 EST e 1-1 OVEST.

  • randmov2, randmov3 e randmov4 sono i piani random a due stati per assegnarele probabilità di movimento.

  • Nelle simulazioni, le LUT, che regolano la dinamica delle stringhe polimeriche per il controllo delle regole di "connettività" e "volume escluso", sono quattro:

  • Marca;

  • DirMuovi

  • Deposita;

  • ScambiaInfo

  • Negli algoritmi sono presenti altre funzioni, FanInfo, FanRand e FanOut che servono per inviare informazioni ai monomeri vicini o per ripulire i segnali per il passo successivo.


    Conclusioni

    La molecola del DNA è estremamente complessa.
    La sua lunghezza può essere di decine di milioni di unità nucleotidiche, limitate soltanto da fattori legati ad efficienza di organizzazione genetica e di competizione replicativa.
    I meccanismi alla base di questa complessità strutturale sono di difficile studio e sono in genere analizzati su basi esclusivamente genetiche e chimico-fisiche.
    La modellizzazione bioinformatica è stata finora limitata dalla scarsità di strumenti adeguati e dalla mancata diffusione di modelli come gli automi cellulari.
    Gli automi cellulari forniscono un approccio metodologico in grado di stabilire una base modellistica matematica.
    È in questo quadro di riferimento che il DNA viene considerato una "stringa" nell' accezione informatica di sequenza finita di elementi (caratteri) e che perde il suo significato genetico strutturale ma ne acquista uno informatico.
    In questo tentativo di ricostruzione semantica, l'uso delle metodologie proprie degli automi cellulari ci ha permesso di ricreare in forma di modelli informatici le proprietà di base del DNA: la differenza di comportamento tra molecole lunghe e molecole corte, tra molecole chiuse (topologicamente definibili) e molecole aperte (che non lo sono), tra molecole asimmetriche e molecole dotate di simmetria interna.
    Il fatto che queste proprietà in qualche modo ovvie e di controllo sistemico siano state qui modellizzate pone le basi per lo studio di proprietà più complesse quali quelle topologiche e quelle di relazione intermolecolare.
    Il fatto che il metodo sviluppato abbia rivelato l'emergenza di proprietà legate alle estremità delle stringhe e ne abbia definito il presupposto di complessità è la prova della validità del metodo adottato.

    Ultimo aggiornamento: 8 ottobre 2003

    Torna alla pagina principale