PROGETTAZIONE E IMPLEMENTAZIONE DI ALGORITMI PER ESTRAZIONE DI PATTERN SEQUENZIALI

You are viewing the theme
[Voti: 0    Media Voto: 0/5]

L’obbiettivo della tesi è stato studiare tutte le tecniche di data mining presenti in letteratura applicabili al progetto BRITE (in particolare lo stato dell’arte riguardante i Sequential Pattern ed il Workflow Mining), scegliere e implementare un algoritmo per inferire pattern sequenziali dai file di logs estratti dalla piattaforma. L’algoritmo implementato è GenPrefixGrowth e il linguaggio di programmazione utilizzato è Java. Si basa sul metodo pattern-growth e la sua caratteristica principale è la possibilità di trattare vincoli di tipo temporale, esistenziale (minimo supporto) e di contenuto. Nel corso di questa tesi per semplicità sono stati applicati solo i primi due vincoli. GenPrefixGrowth inoltre utilizza una tecnica di proiezione del database basata sul prefisso, la pseudo proiezione, che è una versione main memory.