Università degli Studi di Milano

Corso di laurea specialistica in Informatica
a.a. 2005/06


Bioinformatica


Docenti: Giulio Pavesi (I modulo) e Giorgio Valentini (II modulo).


 

Cenni di biologia molecolare

 

  1. DNA, RNA e proteine. L’espressione dei geni, dal DNA alle proteine.

 

  1. Relazioni tra molecole e relazioni tra sequenze. Annotazione di genomi. Cenni di genomica comparata. Introduzione alle banche dati biologiche.

 

Modulo I: Analisi di bio-sequenze

 

  1. Misurare l’evoluzione: distanza di Hamming, distanza di edit normale e “pesata”. Allineamento di sequenze e programmazione dinamica.

 

  1. Allineamento multiplo di sequenze: complessità e soluzioni euristiche. Allineamenti progressivi. Profili di allineamento.

 

  1. Allineamenti veloci ed “euristici”. Strutture di indicizzazione di testi e di sequenze. Alberi dei suffissi.

 

  1. Cenni di probabilità e statistica applicati all’analisi di sequenze. Entropia, entropia relativa e information content. P-value ed E-value. Test di significatività: z-score, Chi-quadro.

 

  1. Analisi del DNA non codificante. Modelli probabilistici di ordine superiore. Hidden markov models. Grammatiche context-free.

 

Modulo II: Analisi dell’espressione genica   (Materiale didattico)

 

1.       Biotecnologie per la misurazione dell’ espressione genica e livelli di analisi dei dati di espressione

 

2.       Metodi di clustering per l’ analisi non supervisionata dell’ espressione genica

a.       Metodi di clustering gerarchico

    1. Metodi della famiglia c-mean
    2. Metodi di ensemble clustering

 

  1. Metodi supervisionati di apprendimento automatico per la classificazione funzionale di geni e tessuti con dati di DNA microarray (6 h)
    1. Classificazione funzionale di geni tramite Support Vector Machine
    2. Diagnosi bio-molecolare tramite metodi di ensemble: Bagging e boosting ensemble, Random subspace ensemble, ECOC ensemble.

 

  1. Metodi di selezione delle feature per la ricerca di geni correlati a stati funzionali
    1. Metodi statistici univariati
    2. Metodi di forward selection e backward elimination

 

  1. Reti di regolazione genica
    1. Analisi di serie temporali: metodi basati su sistemi di equazioni lineari e metodi basati su Reti Bayesiane.
    2. Analisi basate su knock-out multipli: Modellazione di reti “ridondanti” e “parsimoniose”

 

 

 

L’esame consisterà nell’approfondimento, teorico o applicativo, di uno degli argomenti trattati nel corso.