Jungletech
/
Menu
Chiudi
Inizia un progetto
← Torna ai progetti
Infrastrutture di dati pubblici2025

Piattaforma riservata di Integrazione Dati Semantica

Ente del settore pubblico

Durata

10 mesi

Dimensione team

6 specialisti

Settore

Infrastrutture di dati pubblici

Impatto

0%

Accuratezza nel rilevamento automatico del dominio

0%

Riduzione dello sforzo di modellazione manuale

0x

Workflow di integrazione più rapidi

0+

Ontologie supportate su più domini

La sfida

Un ente del settore pubblico aveva la necessità di integrare dataset aperti eterogenei provenienti da molteplici fonti europee. I dati erano forniti in formati CSV inconsistenti e privi di metadati, rendendo difficile identificare il dominio, garantire l'interoperabilità e integrare i dataset nelle infrastrutture semantiche esistenti.

La nostra soluzione

Abbiamo progettato e sviluppato un sistema AI di integrazione semantica capace di analizzare automaticamente dataset tabellari, riconoscerne il dominio, selezionare l'ontologia più appropriata e convertire i dati in knowledge graph RDF. La piattaforma combina natural language processing, modelli di similarità semantica e ragionamento ontologico per trasformare dataset grezzi in linked data interoperabili.

Tecnologie utilizzate

PythonFastAPIReactSemantic Web (RDF/OWL)SPARQLKnowledge GraphsSentence-BERTTransformer ModelsApache Jena / GraphDBDocker

Il nostro approccio

01

Discovery e valutazione delle ontologie

Abbiamo analizzato centinaia di ontologie europee su domini diversi e le abbiamo valutate secondo criteri di copertura semantica, interoperabilità e aggiornamento, per identificare le più adatte a ciascun dominio.

02

Infrastruttura Ontology Hub

Abbiamo sviluppato un hub ontologico centralizzato con triplestore, endpoint SPARQL e interfaccia web per esplorazione, ricerca semantica e visualizzazione dei knowledge graph.

03

Pipeline di Domain Detection

Abbiamo costruito una pipeline AI che pre-elabora i CSV, ne estrae feature lessicali, strutturali e semantiche, e applica modelli transformer zero-shot per individuare automaticamente il dominio più probabile.

04

Motore di Mapping Semantico

Abbiamo implementato un sistema ibrido che combina entity linking, similarità semantica e regole per associare le colonne dei dataset alle proprietà delle ontologie.

05

Generazione di Knowledge Graph

Abbiamo realizzato un modulo di trasformazione che converte i dataset tabellari in knowledge graph RDF con URI persistenti, tipizzazione semantica e interoperabilità con gli standard europei.

Pronti a costruire qualcosa di straordinario?

Parliamo del vostro progetto.

Inizia un progetto →