BIOINFORMATICA

Il focus principale del gruppo di bioinformatici è lo studio, l’applicazione, lo sviluppo e l’ottimizzazione di strumenti per l’analisi dei dati biologici e genomici prodotti dagli scienziati di INGM e dai loro collaboratori. La facility lavora in stretto contatto con i ricercatori dell’Istituto e fornisce accesso ad analisi ed elaborazioni di dati biologici a tutti i gruppi di ricerca. Essa supporta la ricerca di base e traslazionale con analisi di routine per esigenze standard o su misura; inoltre fornisce e facilita l’accesso a metodi analitici nuovi e sempre aggiornati.

Il gruppo lavora in un open space dedicato in stretto contatto con altri bioinformatici, studenti e dottorandi che afferiscono ai vari gruppi di ricerca. Ogni singolo membro del gruppo si dedica completamente a uno specifico progetto e/o lavora in collaborazione su più di un progetto, a seconda delle esigenze di Istituto, del carico di lavoro e delle richieste dei capi laboratorio.

Le nostre conoscenze sono ampie e abbracciano la biologia, la biologia dei sistemi, l’informatica, la biostatistica; la natura trasversale del gruppo ci permette di avere una visione dei dati e del loro contesto biomedico e clinico sempre nuova e di insieme.
Il personale dei Sistemi Informativi assicura al gruppo di bioinformatici l’accesso costante all’infrastruttura di calcolo ad alte prestazioni (HPC) e alla connettività di Istituto.

Attività

  • Supporto per il disegno sperimentale di progetti che prevedono l’utilizzo e/o la genesi di dati, esplorazione di dati, pulizia dei dati.
  • Profilazione a medio ed elevato processamento per l’espressione genica: RTqPCR arrays e microarrays.
  • Analisi NGS (Next generation sequencing): sequenziamenti di RNA, esoma (DNA), panneli genici, ChIPseq.
  • Analisi di RNA non codificanti, microRNA cellulari e circolanti.
  • Analisi multivariatadi dati di trascrittomica, proteomica; selezione e prioritizzazione di biomarcatori; statistica descrittiva e inferenziale.
  • Analisi funzionali per la contestualizzazione biologica, ontologie, metodi per l’analisi dei pathway molecolari ed entità biologiche.
  • Analisi funzionali avanzate: analisi di impatto su pathways, utilizzo delle metriche di network, determinazione di moduli funzionali.
  • Disegno, progettazione e programmazione di applicazioni per la soluzione di problemi computazionali applicati alla biologia e alla genomica.

Team

Nome / NameRuolo / RoleEmail
Riccardo L. Rossi, PhDFacility Managerrossi@ingm.org
Roberta Alfieri, PhDPost Doc, Bioinformaticianalfieri@ingm.org
Shruti Sinha, PhD
Post Doc, Bioinformaticiansinha@ingm.org
Sara Valsoni, PhDPost Doc, Bioinformaticianvalsoni@ingm.org
Gabriele VenturaStudentventura@ingm.org

Strumenti

I bioinformatici di INGM possono contare su un cluster ad alte prestazioni (HPC) con più di 300 cpu, 1.5 TB di memoria RAM e circa 100 TB di spazio disco. La struttura è stata organizzata e viene manutenuta dal personale dei Sistemi Informativi in collaborazione con i bioinformatici. L’infrastruttura è collegata da connettività ad altissima velocità ed è equipaggiata con sistemi di sicurezza e di backup per la protezione dei dati prodotti.

Tutti i calcoli e le analisi computazionalmente intensive vengono lanciati sul cluster e gestiti tramite il sistema di code Torque/PBS e una serie di macchine virtuali. Sia il cluster che le macchine virtuali utilizzano come sitema operativo Ubuntu Linux. I task computazionali minori e meno intensivi vengono eseguite anche su workstation (Xeon PCs, Windows OS) e/o laptops (iOS), che sono utilizzati anche come terminali per il cluster.

Applicazioni / Software

  • miRiadne (http://www.miriadne.org/)
    miRiadne è una applicazione web per la ri-annotazione di liste o datasets di microRNA. Annotazioni obsolete (dovute a versione non aggiornate del miRbase o delle piattaforme di profiling) possono essere convertite in annotazioni aggiornate.
  • CombiROC (http://www.combiroc.eu)
    CombiROC  è una applicazione web per la generazione e l’analisi interattiva di curve ROC di pannelli di marcatori multipli.
  • myVCF (http://myvcf.readthedocs.io/en/latest/)
    myVCF  è una applicazione desktop per la gestione delle mutazione da profili high-throughput da progetti di sequenziamento che generino file VCF. Essa permette all’utente privo di conoscenze bioinformatiche di esplorare, interrogare, visualizzare ed esportare dati mutazionali in modo semplice e diretto.

Pubblicazioni

INGM RESEARCH IS SUPPORTED BY