STRUMENTI STATISTICI E INFORMATICI PER L'ANALISI DEI DATI

Anno accademico 2025/2026 - Docente: FRANCESCO PAPPALARDO

Risultati di apprendimento attesi

Al termine del corso, gli studenti saranno in grado di applicare metodi statistici avanzati per l'analisi e l'interpretazione di dati complessi nel campo della chimica e tecnologia farmaceutiche. Saranno capaci di progettare esperimenti scientifici adeguati, utilizzando disegni sperimentali come quelli fattoriali, e di utilizzare software statistici avanzati come R e Python per l'analisi e la visualizzazione dei dati. Inoltre, sapranno implementare analisi multivariate per la riduzione della dimensionalità e la classificazione dei dati, eseguire regressioni lineari e non lineari, e ottimizzare processi sintetici. Comprenderanno e applicheranno modelli farmacocinetici e farmacodinamici avanzati, validando metodi analitici secondo le linee guida ICH. Saranno in grado di gestire database utilizzando SQL e applicheranno conoscenze di intelligenza artificiale e medicina in silico per l'analisi predittiva e la personalizzazione delle terapie. Infine, condurranno progetti di ricerca completi, dalla formulazione dell'ipotesi alla presentazione dei risultati, rispettando le normative vigenti e i principi etici nella gestione e nell'analisi dei dati.

Modalità di svolgimento dell'insegnamento

Mediante lezioni frontali ed esercitazioni pratiche alla fine di ogni unità di apprendimento (quando previste).

Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.


Secondo quanto riportato nel RDA, Art. 12 - Crediti Formativi Universitari (CFU), nel carico standard di 25 ore di impegno complessivo dello/a studente/ssa, corrispondente a un credito, possono rientrare:

a) 7 ore dedicate a lezioni frontali o attività didattiche equivalenti e le restanti allo studio individuale;

b) almeno 12 e non più di 15 ore dedicate a esercitazioni in aula o attività assistite equivalenti (laboratori) e le restanti allo studio e alla rielaborazione personale

Prerequisiti richiesti

  • Conoscenze solide in chimica organica, analitica e fisica.
  • Nozioni di base di statistica e matematica.
  • Competenze informatiche di base.
  • Frequenza lezioni

    Frequenza obbligatoria secondo le norme del regolamento didattico del CdS in CTF come riportato nel link: http://www.dsf.unict.it/corsi/lm-13_ctf/regolamento-didattico

    Contenuti del corso

    Modulo 1: Introduzione alla Statistica nel Contesto Farmaceutico

    • Importanza dell'analisi statistica nella ricerca e sviluppo di farmaci.
    • Richiami fondamentali di statistica descrittiva

    Modulo 2: Analisi dei Dati

    • Disegni fattoriali completi e frazionari.
    • Distribuzioni di probabilità (binomiale, Poisson, Normale, Gaussiane ed altre)
    • Misure del rischio
    • Statistica inferenziale e Tests di ipotesi
    • Analisi della Varianza (ANOVA)
      • ANOVA a una via e a due vie.
    • Regressione Lineare e Non Lineare
      • Modelli di regressione multipla.

    Modulo 3: Analisi Multivariata

    • Analisi delle Componenti Principali (PCA)
      • Riduzione della dimensionalità dei dati.
    • Metodi di Classificazione e Clustering
      • Analisi Discriminante Lineare (LDA).
      • Algoritmi di clustering (K-means, gerarchico).

    Modulo 4: Strumenti Informatici per l'Analisi e la Visualizzazione dei Dati

    • Software Statistici Avanzati
      • Utilizzo di R  per l'analisi statistica.
    • Fogli di Calcolo Avanzati
      • Analisi dei dati con Excel: Solver, Data Analysis ToolPak.

    Modulo 5: Applicazioni Statistiche in Chimica e Tecnologia Farmaceutiche

    • Farmacocinetica e Farmacodinamica Avanzata
    • Validazione dei Metodi Analitici  secondo le linee guida ICH.

    Modulo 6: Quantitative Systems Pharmacology

    • In Silico Trials
    • Approcci modellistici alle Scienze Farmaceutiche e della Vite
    • Analisi predittiva e personalizzazione delle terapie.

    Modulo 7: Progetto Finale e Applicazioni Pratiche

    • Laboratori pratici
      • Analisi di dataset reali provenienti da studi farmaceutici.
    • Progetto di ricerca
      • Sviluppo di un progetto individuale o di gruppo.
      • Presentazione e discussione dei risultati.

    Testi di riferimento

    Il materiale sarà disponibile su studium o nella pagina del docente e/o fornite a lezione

    Programmazione del corso

     ArgomentiRiferimenti testi
    1Tutti gli argomenti del programma - Dispense fornite dal docente

    Verifica dell'apprendimento

    Modalità di verifica dell'apprendimento

    Mediante prova scritta e prova orale. Le date di esami sono pubblicate sul sito del Dipartimento di Scienze del Farmaco e della Salute: https://www.dsf.unict.it/it/corsi/lm-13_ctf/orario-delle-lezioni


    La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere. 

    A garanzia di pari opportunità e nel rispetto delle leggi vigenti, gli studenti interessati possono chiedere un colloquio personale in modo da programmare eventuali misure compensative e/o dispensative, in base agli obiettivi didattici ed alle specifiche esigenze. 

    E' possibile rivolgersi anche al docente referente CInAP (Centro per l’integrazione Attiva e Partecipata - Servizi per le Disabilità e/o i DSA) del nostro Dipartimento, prof.ssa Santina Chiechio

    Le date di esami sono pubblicate sul sito del Dipartimento di Scienze del Farmaco e della Salute https://www.dsf.unict.it/sites/default/files/2025-07-24-calendario%20esami%20CTF.pdf

    Esempi di domande e/o esercizi frequenti

    1) Quale delle seguenti affermazioni descrive meglio l'Analisi delle Componenti Principali (PCA)?

    A) È un metodo di regressione per predire una variabile dipendente basata su variabili indipendenti.

    B) È una tecnica di classificazione supervisionata per assegnare campioni a categorie predefinite.

    C) È una tecnica di riduzione della dimensionalità che trasforma variabili correlate in un set di componenti non correlate.

    D) È un algoritmo di clustering utilizzato per raggruppare dati simili senza etichette predefinite.


    2) In farmacocinetica, quale modello compartimentale descrive meglio un farmaco che si distribuisce rapidamente e uniformemente nell'organismo dopo l'assorbimento?

    A) Modello monocompartimentale.

    B) Modello bicompartimentale.

    C) Modello tricompartimentale.

    D) Modello non compartimentale.