Skip to main content

Perchè usiamo i tag - Il Progetto: Percorsi ontology-based

Le origini e gli obiettivi del progetto

Una "ontologia" è una rappresentazione formale della conoscenza di un particolare dominio. Con lo sviluppo del progetto "Percorsi ontology-based" si sono analizzati i contenuti delle pagine del portale al fine di proporre un sistema di navigazione semplice e veloce che aiutasse il cittadino a ricercare informazioni presenti sul portale, ma non esplicitamente navigabili perché considerate tacitamente presenti in altri contenuti. Si è esplicitata, con tale lavoro, la conoscenza contenuta nelle pagine. Dal progetto è nata la navigazione per tag delle pagine del menù "Per il cittadino". I tag, etichette descrittive del contenuto di una pagina, sono un'utile scorciatoia in grado di collegare pagine diverse del portale, a prescindere dal menù nel quale sono inserite. In questo modo l'utente può navigare sia nel modo "classico", attraverso il menù di navigazione, sia seguendo i percorsi suggeriti dai tag, che conducono ad argomenti correlati. Il sistema implementato consente -ad esempio- all'utente di selezionare una parte del corpo (un tag di anatomia), di ritrovare con un solo click tutte le pagine in cui si parla della parte anatomica scelta e di filtrare i risultati della ricerca per "prestazione".

L'approccio scientifico, ma allo stesso tempo basato sulla scelta di un linguaggio semplice per l'utente finale, adottato per il progetto, ha permesso di valorizzare la conoscenza e le informazioni contenute nel portale AOSP, puntando nel contempo a migliorare l'esperienza di navigazione dei cittadini. I servizi sviluppati dal progetto sono infatti focalizzati sulla figura del cittadino; sono tuttavia possibili sviluppi futuri incentrati sulla figura del medico e dell'impresa.

I servizi sviluppati

Il progetto "Percorsi ontology based" ha sviluppato un articolato sistema di tagging, consentendo all'utente un nuovo tipo di navigazione tra i contenuti dotati di tag. Classificare, ritrovare e associare contenuti sono tra le potenzialità dei tag. Un importante vantaggio dei tag è che diversi percorsi di ricerca portano allo stesso risultato e la probabilità di trovare esattamente quello che si sta cercando aumenta. Inoltre i tag servono per ritrovare facilmente i contenuti e selezionando un tag si ottiene un elenco filtrato di elementi che contengono quella etichetta: in questo modo contenuti che afferiscono a rami diversi della gerarchia "tradizionale" del sito, perciò topologicamente "lontani", vengono aggregati, "avvicinati", portando ad una fruizione del sito più stimolante e valorizzante. Il progetto ha quindi consentito di rendere più efficace l'esperienza di navigazione dell'utente, per il quale sono stati sviluppati i seguenti servizi:

  • Tag cloud, dove sono evidenziati gli argomenti più trattati nelle "pagine del cittadino". Tag cloud è una "nuvola" formata dai tag, visualizzati con grandezza diversa, proporzionale all'importanza dell'etichetta stessa. La dimensione del tag dipende da quanto frequentemente l'etichetta è stata associata alle pagine del portale. La tag cloud, quindi, fornisce in maniera immediata un elenco degli argomenti più rilevanti delle pagine del sito.
  • Navigazione per categorie di argomenti: sono gli argomenti trattati nelle pagine "Per il cittadino" e che sono resi noti al cittadino tramite il sistema dei tag.
  • Navigazione gerarchica tra i termini delle categorie/argomenti: la lista completa dei tag/termini per ogni argomento e scegliendone uno si ottiene un elenco filtrato di tutte le pagine che contengono quel tag/termine
  • Tag cloud per argomento, dove sono evidenziati i termini più presenti nelle pagine del portale per un determinato argomento
  • Percorso semantico: partendo da un qualsiasi tag di Anatomia ottengo, in base alle pagine che trattano un determinato argomento di Anatomia, tutte le Prestazioni correlate a quella parte del corpo, con la possibilità di filtrare ulteriormente il risultato della ricerca attraverso un tag di Prestazioni. Questa navigazione permette un passaggio semantico importante: partendo da un dominio semplice come quello del corpo umano si riesce a fare un "salto" di conoscenza e arrivare ad un dominio tecnico: partendo da una informazione semplice, l'utente trova le prestazioni correlate alla parte del corpo scelta.

La metodologia

Il progetto ha coinvolto sia gli esperti di dominio AOSP, sia i knowledge expert di CINECA. In una prima fase, si è svolta una macro-analisi dei contenuti del sito, grazie alla quale si è individuata l'area "Prestazioni" come possibile argomento d'interesse non esplicitato nel percorso "Per il Cittadino". Difatti le informazioni sulle prestazioni sono riportate in varie sezioni e pagine differenti del portale AOSP, ma non esiste un canale di accesso dedicato a questo argomento (ad esempio, se ne parla nei Dipartimenti). Si è quindi pensato di sviluppare un servizio che permetta al cittadino di esplorare la conoscenza del portale e ricercare informazioni attraverso un sistema di navigazione "parallelo", che presenta argomenti non esplicitati dalla struttura di navigazione del sito. Il progetto ha seguito quindi un complesso lavoro di analisi e definizione degli step necessari per individuare gli argomenti chiave delle pagine selezionate e per strutturarli nelle micro-ontologie. L'area "Per il cittadino" contiene infatti oltre 700 pagine ricche di informazioni; obiettivo del progetto era riuscire ad individuare in maniera corretta, precisa e comprensibile per l'utente finale un sistema efficace di accesso alla conoscenza, rispondente alle esigenze dei cittadini ma allo stesso tempo basato su un approccio scientifico e su ontologie compatibili con gli standard del settore medico-ospedaliero. A tal fine i knowledge expert di CINECA hanno proposto l'analisi dei contenuti del portale attraverso strumenti di NLP e ontologie. Si è recuperata la vecchia ontologia del portale AOSP, e la terminologia scelta è stata confrontata con thesauri e vocabolari riconosciuti nel settore medico: International Classification of Diseases (ICD9) e MeSH (Medical Subject Headings). Sono state quindi selezionate le pagine su cui effettuare il "mapping", un'indicizzazione di terminologia sulle pagine di un portale. Tutto il lavoro di sviluppo è stato effettuato in un ambiente di test curato da CINECA, su cui sono state caricate le ontologie. Selezionate le pagine rilevanti su cui effettuare il mapping, quest'ultimo è stato personalizzato per le pagine AOSP e per le tipologie di contenuti. I knowledge expert CINECA e gli esperti di dominio AOSP hanno quindi effettuato insieme una prima analisi del mapping e, attraverso il raggruppamento della terminologia e l'individuazione delle categorie significative da parte degli esperti SOM, hanno individuato le categorie di termini più interessanti da esplicitare nei servizi per il cittadino. Le cinque categorie individuate scegliendo un lessico comprensibile per il cittadino sono: Anatomia, Assistenza sanitaria, Centri di riferimento, Discipline mediche, Prestazioni. Sono state popolate dalla terminologia identificata dal mapping e completata da ulteriori termini individuati dagli esperti. Il tagging sulle pagine di AOSP è stato istanziato attraverso un'indicizzazione automatica delle micro-ontologie e perfezionato da un attento lavoro di revisione, che ha portato ad un "pulitura" dei termini dell'indicizzazione automatica, a sistemare i casi di sinonimia, ad aggiungere nuovi termini alle micro-ontologie (quando ritenuti mancanti), a definire i termini significativi per ogni pagina, a definire i tag utili per effettuare i passaggi semantici tra gli argomenti (ovvero la copresenza dei tag appartenenti alle micro-ontologie diAnatomia e Prestazioni).

Riassumendo, dal punto di vista metodologico sono stati eseguiti i seguenti passi:

  1. Individuazione dei servizi basati sulle ontologie per il cittadino: tagcloud, navigazione tra i termini, ricerche in base a passaggi semantici via tag (es: scelto un termine appartenente alle parti del corpo appaiono tutte le prestazioni collegate)
  2. Identificazione della terminologia nel Portale AOSP al fine di individuare "di cosa" si parla indipendentemente dai percorsi che sono esplicitati, tramite mapping
  3. Mapping: indicizzazione di ontologie esistenti ad una copia del portale AOSP
  4. Analisi del mapping per l'identificazione della terminologia più utilizzata nel portale e più interessante "Per il Cittadino"
  5. Determinazione di argomenti/categorie di interesse per il cittadino e conseguente costruzione delle rispettive micro-ontologie
  6. Caricamento e formalizzazione nel CMS del portale AOSP delle micro-ontologie
  7. Tagging: indicizzazione automatica e annotazione manuale dei termini delle micro-ontologie
  8. Implementazione dei servizi ontology-based