Università degli Studi di Milano
Corso di laurea specialistica in
Informatica
a.a. 2005/06
Bioinformatica
Docenti:
Giulio Pavesi (I modulo) e Giorgio
Valentini (II modulo).
Cenni di
biologia molecolare
- DNA,
RNA e proteine. L’espressione dei geni, dal DNA alle proteine.
- Relazioni
tra molecole e relazioni tra sequenze. Annotazione di genomi. Cenni di
genomica comparata. Introduzione alle
banche dati
biologiche.
Modulo
I: Analisi di bio-sequenze
- Misurare
l’evoluzione: distanza di Hamming,
distanza di edit
normale e “pesata”. Allineamento di sequenze e programmazione dinamica.
- Allineamento
multiplo di sequenze: complessità e soluzioni euristiche. Allineamenti progressivi.
Profili di
allineamento.
- Allineamenti
veloci ed “euristici”. Strutture di indicizzazione
di testi e di sequenze. Alberi dei
suffissi.
- Cenni
di probabilità e statistica applicati
all’analisi di sequenze. Entropia, entropia relativa e information content.
P-value ed E-value.
Test di significatività:
z-score, Chi-quadro.
- Analisi
del DNA non codificante. Modelli probabilistici di
ordine superiore. Hidden markov
models. Grammatiche context-free.
Modulo
II: Analisi
dell’espressione genica (Materiale didattico)
1.
Biotecnologie
per la misurazione dell’ espressione
genica e livelli di analisi dei dati di
espressione
2.
Metodi
di clustering per l’ analisi non
supervisionata dell’ espressione genica
a.
Metodi
di clustering gerarchico
- Metodi
della famiglia c-mean
- Metodi
di ensemble clustering
- Metodi
supervisionati di apprendimento automatico
per la classificazione funzionale di geni e tessuti con dati di DNA
microarray (6 h)
- Classificazione
funzionale di geni tramite Support Vector Machine
- Diagnosi
bio-molecolare tramite metodi di ensemble:
Bagging e boosting
ensemble, Random subspace
ensemble, ECOC ensemble.
- Metodi di selezione delle feature per la ricerca di geni correlati a stati
funzionali
- Metodi
statistici univariati
- Metodi
di forward selection
e backward elimination
- Reti
di regolazione genica
- Analisi
di serie temporali: metodi
basati su sistemi di equazioni lineari e metodi basati su Reti
Bayesiane.
- Analisi
basate su knock-out multipli: Modellazione di reti “ridondanti” e
“parsimoniose”
L’esame
consisterà nell’approfondimento, teorico o applicativo, di uno degli
argomenti
trattati nel corso.
|