GRAB4J: UNA LIBRERIA JAVA UTILE PER ESTRARRE INFORMAZIONI DA UN DOCUMENTO HTML ONLINE.

You are viewing the theme
[Voti: 0    Media Voto: 0/5]

Varie regole (logica grabbing) permettono di estrarre determinate informazioni da qualsiasi pagina web. Questa soluzione migliora l’approccio dei token. Spesso veniva utilizzata infatti in questi casi la classe della microsoft HTMLTokenizer.
La seguente routine permette di :

  1. Scaricare il documento dalla rete.
  2. Interpretare il documento e costruirne una rappresentazione ad oggetti.
  3. Estrarre informazioni dalla rappresentazione del documento, eseguendo la routine con la logica di grabbing.

LIBRERIA

Verione della libreria:  grab4j V1.0

Nel archivio sono presenti:
Eseguibili, sorgenti, esempi e documentazione.