ANNOTAZIONI GERARCHICHE DI DOCUMENTI STRUTTURATI NEL SEMANTIC WEB

You are viewing the theme
[Voti: 0    Media Voto: 0/5]

La tesi mira a definire metodologie e tecniche per il “tagging” (marcatura) di tipo semantico di singole sottostrutture (capitoli, paragrafi, passaggi, …) di documenti di natura prevalentemente testuale. In particolare, si vuole definire, facendo ricorso agli standard esistenti, una tecnica di annotazione di tali sottostrutture in grado di metterle in relazione con le classi di un’opportuna ontologia. La tesi prevede una fase iniziale di acquisizione di competenze sulle tecniche ed i linguaggi legati al Semantic Web, di reperimento e studio di ontologie esistenti (ad esempio Open Directory), e di ricerca bibliografica delle soluzioni proposte per l’annotazione di sottostrutture. In seguito verra progettata una metodologia di marcatura, e verra realizzato un prototipo software in grado di elaborare tali marcature, facendo riferimento ad un insieme di documenti campione. Infine si dimostrera la validita dell’approccio e si valuteranno i benefici derivanti da una marcatura semantica “fine” mediante l’implementazione prototipale di un motore di ricerca semantico basato sull’ontologia e sulle marcature citate. Tale motore di ricerca dovrebbe essere in grado di “creare” un nuovo documento, componendo opportunamente frammenti di documenti esistenti su argomenti rilevanti per la ricerca.