Metodi
didattici
Durante il corso si
alterneranno lezioni frontali e discussioni di articoli di interesse
rilevante in campo
bioinformatico.
Si prevede inoltre
che gli studenti alla fine del corso progettino
ed implementino algoritmi di
biologia computazionale.
Propedeuticità
consigliate
Web: struttura, analisi,
classificazione (II parte del corso sui modelli di apprendimento
statistico e sugli algoritmi di apprendimento); Sistemi intelligenti.
La frequenza dei precedenti corsi, non
è vincolante per poter sostenere l'esame di Bioinformatica, ma
è fortemente consigliata.
Prerequisiti:
Nozioni
elementari di analisi matematica e statistica; nozioni
di base sui linguaggi di programmazione.
Tali conoscenze sono normalmente acquisite durante i corsi di laurea
triennali di Informatica, ma opportuni richiami verranno forniti quando
necessario durante il corso.
Prove d'esame:
Progettazione ed implementazione
di un algoritmo per l'analisi di dati bio-molecolari, e discussione
orale di letteratura scientifica, relativa ad
uno o piu' argomenti trattati durante il corso.
Materiale
didattico
Introduzione alla biologia
molecolare (risorse on-line):
- Alvis Brazma et al., A brief
introduction to molecular biology, genomics and
microarray
- Lawrence Hunter, Molecular
Biology for Computer Scientists (capitolo 1 tratto da Artificial Intelligence and
Molecular Biology, AAAI, 1993)
- Voce
Genetics
di wikipedia. Dalla pagina web si possono seguire altri link
ipertestuali a DNA, RNA, proteine, trascrizione, traduzione, codice
genetico, regolazione dell'espressione, ...
Materiale
didattico per il I modulo
Materiale
didattico per il II modulo
- Nozioni minime di
biologia molecolare per il corso di bioinformatica (pdf, 4 slide
per
pagina)
- Codice
genetico, trascrizione e traduzione (pdf)
- I dati ed i
problemi della bioinformatica (pdf, 4 slide per pagina)
- Nozioni minime
di machine learning per il corso di bioinformatica (pdf, 2 slide
per pagina)
- Introduzione
ai metodi kernel (pdf,
2 slide per pagina)
- Support
Vector Machine (pdf)
- Support Vector
Machine (pdf, 2 slide per pagina)
- Metodi
kernel in bioinformatica (pdf, 2 slide per pagina)
- Classificazione
funzionale di tessuti e geni con metodi di apprendimento automatico
(pdf)
- Metodi
statistici per l'analisi dell'espressione differenziale di geni singoli
(pdf, 2
slide
per pagina)
- Misure
di similarità e standardizzazione dei dati per algoritmi di
clustering (pdf,
2 slide per pagina)
- Gene Ontology
(pdf, 4 slide per pagina)
- Introduzione ai metodi
di ensemble
Articoli che verrano discussi durante il corso o che
potranno essere utilizzati per approfondimenti:
- J.Thompson, D. Higgins, T. Gibson, CLUSTAL
W: improving the sensitivity of progressive multiple sequence alignment
through sequence weighting, position-specific gap penalties and weight
matrix choice, Nucleic Acids
Research, 22(22), 4673-4680, 1994.
- G.Pavesi, G.Mauri and G.Pesole, In
silico representation and discovery of transcription factor binding
sites, Briefings in
Bioinformatics, 5(3), 2004.
- M. Brown, et al., Knowledge-base
analysis of microarray gene expression data by using Support
Vector Machines, PNAS,
vol.97(1), pp. 262-267, 2000
- T. S.
Furey, N. Cristianini, N. Duffy, D. W.
Bednarski, M. Schummer,
and D. Haussler Support
vector machine classification and validation of cancer tissue samples
using microarray expression data Bioinformatics, Oct
2000; 16: 906 - 914.
- P. Pavlidis, J. Weston , J. Cai and
W.S. Noble, Learning
gene functional classification from multiple data, J. Comput. Biol., vol.9,
pp.401-411, 2002
- G.R.G. Lanckriet, T. De Bie, N. Cristianini, M.I. Jordan
and W.S. Noble, A
statistical framework for genomic data fusion, Bioinformatics, vol.20, pp.
2626-2635, 2004.
- Z. Barutcuoglu, R. Schapire and O. Troyanskaya, Hierarchical
multi-label prediction of gene function, Bioinformatics, 22(7), pp. 830-836,
2006.
- C. Lottaz and R. Spang, Molecular
decomposition of complex clinical phenotypes using biologically
structured analysis of microarray data, Bioinformatics, 21(9), pp.
1971-1978, 2005.
- F. Tai, and W. Pan., Incorporating
prior knowledge of predictors into penalized classifiers with multiple
penalty terms, Bioinformatics,
23(14), pp. 1775-1782, 2007.
- A.Bertoni,
G.Valentini, Model
order
selection
for
biomolecular data clustering, BMC
Bioinformatics, vol.8, Suppl.3, 2007.
Bibliografia
P.Baldi and S. Brunak Bioinformatics: a machine learning approach,
MIT Press, 2001.
B. Scholkopf, K. Tsuda and J.P. Vert Kernel Methods in Computational Biology,
MIT Press, 2004.
C. Bishop, Pattern
Recognition and Machine Learning, Springer, 2006.
|