Prerequisiti:
Nozioni
elementari di analisi matematica e statistica.
Corsi consigliati: Metodi Statistici per
l'Apprendimento e Sistemi intelligenti
Modalità d' esame:
I. Implementazione ed applicazione
di
un algoritmo per l'analisi di dati bio-molecolari, oppure discussione
orale di letteratura scientifica, relativa ad un argomento trattato
durante il corso.
II. Discussione orale sugli argomenti trattati durante il corso.
La letteratura scientifica da discutere e la data dell'esame dell'esame
devono essere concordate con i docenti.
Bibliografia
D. Gusfield, Algorithms
on Strings, Trees and Sequences: Computer Science and Computational
Biology, Cambridge Press, 1997.
G. Yona
Introduction to Computational Proteomics Chapman & Hall/CRC, 2011.
C. Bishop, Pattern
Recognition and Machine Learning, Springer, 2006.
Materiale didattico
- A
brief
introduction to molecular biology, genomics and
microarray
- Voce
Genetics
di wikipedia. Dalla pagina web si possono seguire altri link
ipertestuali a DNA, RNA, proteine, trascrizione, traduzione, codice
genetico, regolazione dell'espressione, ...
- Gene Ontology
(pdf, 4 slide per pagina)
- Pairwise
alignment (pdf)
- Multiple
alignment (pdf)
- Suffix
trees (pdf)
- Allineamento
locale multiplo e Motif Discovery (pdf)
- Burrows
Wheeler Transform (pdf)
- I dati ed i
problemi della bioinformatica (pdf, 4 slide per pagina)
- Introduzione
ai metodi kernel (pdf,
2 slide per pagina)
- Support
Vector Machine (pdf)
- Support Vector
Machine (pdf, 2 slide per pagina)
- Metodi
kernel in bioinformatica (pdf, 2 slide per pagina)
- Classificazione
funzionale di tessuti e geni con metodi di apprendimento automatico
(pdf)
- Algoritmo backpropagation
(pdf)
- Classificazione supervisionata di tessuti e geni e metodi di validazione
(pdf)
- Machine Learning methods for gene/protein function prediction
(pdf)
- Metodi di clustering e loro applicazioni in bioinformatica
(pdf)
Articoli
- J.Thompson, D. Higgins, T. Gibson, CLUSTAL
W: improving the sensitivity of progressive multiple sequence alignment
through sequence weighting, position-specific gap penalties and weight
matrix choice, Nucleic Acids
Research, 22(22), 4673-4680, 1994.
- G.Pavesi, G.Mauri and G.Pesole, In
silico representation and discovery of transcription factor binding
sites, Briefings in
Bioinformatics, 5(3), 2004.
- P. Larranaga et al. Machine
learning in bioinformatics, Briefings in Bioinformatics 7(1):86-112, 2006
- Javed Khan et al., Classification
and diagnostic prediction of cancers using gene expression profiling
and artificial neural networks, Nature Medicine
7, 673 - 679, 2001.
- Andreas Ruepp et al, The
FunCat, a functional annotation scheme for systematic classification of
proteins from whole genomes, Nucleic
Acid Research 32(18):5539-5545,
2004.
- M Ashburner et al., Gene
Ontology: tool for the unification of biology, Nature Genetics
25, 25 - 29 2000.
- M. Brown, et al., Knowledge-base
analysis of microarray gene expression data by using Support
Vector Machines, PNAS,
vol.97(1), pp. 262-267, 2000
- T. S.
Furey, N. Cristianini, N. Duffy, D. W.
Bednarski, M. Schummer,
and D. Haussler Support
vector machine classification and validation of cancer tissue samples
using microarray expression data Bioinformatics, Oct
2000; 16: 906 - 914.
- P. Pavlidis, J. Weston , J. Cai and
W.S. Noble, Learning
gene functional classification from multiple data, J. Comput. Biol., vol.9,
pp.401-411, 2002
- G.R.G. Lanckriet, T. De Bie, N. Cristianini, M.I. Jordan
and W.S. Noble, A
statistical framework for genomic data fusion, Bioinformatics, vol.20, pp.
2626-2635, 2004.
- Z. Barutcuoglu, R. Schapire and O. Troyanskaya, Hierarchical
multi-label prediction of gene function, Bioinformatics, 22(7), pp. 830-836,
2006.
- S. C. Madeira , A. L. Oliveira, Biclustering
Algorithms for Biological Data Analysis: A Survey, IEEE ACM Trans. on Bioinformatics and
Computational Biology, 1(1), 2004.
- A.Bertoni,
G.Valentini, Model
order
selection
for
biomolecular data clustering, BMC
Bioinformatics, vol.8, Suppl.3, 2007.
- B. Langmead, C. Trapnell, M.
Pop and S. L. Salzberg Ultrafast
and memory-efficient alignment of short DNA sequences to the human
genome, Genome Biology,
10:R25, 2009
- M. Re, G. Valentini,
Simple ensemble methods are competitive with state-of-the-art data integration methods
for gene function prediction,
Journal of Machine Learning Research, W&C Proceedings,,
vol.8: Machine Learning in Systems Biology, pp. 98-111, 2010
- G. Valentini, True Path Rule hierarchical
ensembles for genome-wide gene function prediction,
IEEE ACM Transactions on
Computational Biology and Bioinformatics, vol.8 n.3 pp. 832-847, 2011.
IEEE
CS Digital library
- N. Cesa-Bianchi, M. Re, G. Valentini, Synergy of multi-label hierarchical ensembles, data fusion,
and cost-sensitive methods for gene functional inference,
Machine Learning, (in press), on-line available on
Springer link
-
R. Sharan, I. Ulitsky and R. Shamir, Network-based prediction of protein function ,
Molecular Systems Biology 3:88, 2007.
|