Corso di laurea in Fisica, curriculum bioinformatico

Universita' di Genova, a.a. 2003/04

Bioinformatica funzionale 1

Docente:  Giorgio Valentini       e-mail : valentini@dsi.unimi.it


Home
Programma
Materiale didattico




Programma

Parte I: Introduzione alla biologia genomica ed alle biotecnologie per l’analisi dell’espressione genica

1. Introduzione alla biologia genomica

La cellula procariota ed eucariota. I cromosomi ed il genoma umano.
La divisione cellulare (mitosi e meiosi). Struttura del DNA e sua replicazione.
Struttura delle proteine. Biosintesi delle proteine: i processi di trascrizione e traduzione. Reti metaboliche e reti geniche.

2. Biotecnologie per la misurazione dell’ espressione genica

DNA microarray: cDNA microarray e chip a oligonucleotidi.
Sperimentazione con DNA microarray: progettazione, analisi delle immagini e misure dell’espressione genica

3. Pre-processing negli esperimenti con DNA microarray

Variazione biologica e sistematica dell’espressione genica.
Insiemi di geni da utilizzare per la normalizzazione dei dati. Grafici di intensità logaritmica e grafici di intensità MA. Tecniche di normalizzazione: normalizzazione di una singola slide, di coppie e di slide multiple.

Parte II: Metodi bioinformatici per l’analisi dei dati di espressione genica

1. Analisi dell’espressione di geni singoli

Metodi statistici bayesiani per inferire cambiamenti nell’espressionegenica: modelli gaussiani per dati di microarray, stime bayesiane parametriche ed iperparametriche.

2. Analisi dell’espressione di geni multipli

Interazioni, co-regolazioni, ricerca di expression signatures e di sottogruppi di campioni correlati al livello di espressione genica. Discriminazione di classi funzionali di geni e di fenotipi.

2.1 Metodi di apprendimento non supervisionato per la ricerca di insiemi
di geni funzionalmente correlati.
Clustering gerarchico, K-means, Fuzzy c-means, EM Mixture model, metodi di biclustering.

2.2 Metodi di apprendimento supervisionato per la classificazione di
dati di espressione genica.
Discriminanti lineari, quadratici e logistici. Alberi di decisione. Percettroni multistrato. Support Vector Machine. Ensemble di classificatori.

2.3 Metodi di apprendimento automatico per la selezione dei geni.
Filter method basati su statistiche univariate. Metodi wrapper: forward selection e backward elimination, recursive feature elimination.

3. Analisi funzionale delle reti geniche

Modelli computazionali delle reti di regolazione: reti booleane e modelli grafici probabilistici.

4. Esempi tratti dalla letteratura.

4.1  Analisi di dati di DNA microarray per la discriminazione di classi funzionali di geni nel lievito tramite SVM.

4.2 Classificazione funzionale multiclasse di differenti tipologie di tumori con metodi di ensemble.

4.3 Ricerca di sottoclassi patologiche nel Linfoma DLBCL tramite metodi di apprendimento automatico non supervisionato e supervisionato.