Aller au contenu principal
Patrick Colm Audley

Patrick Colm Audley

Hacker · Full-Spectrum Technologist · Polymath

GMEOW : une super-ontologie centrée sur le raisonnement pour l'existence numérique

J'ai lancé un nouveau projet d'ontologie : GMEOW — la Global Metadata and Entity Ontology for the Web.

L'objectif de conception est une super-ontologie centrée sur le raisonnement, en OWL 2 DL, ancrée dans gUFO, pour modéliser l'existence numérique d'une personne ou d'une organisation.

Tout est né d'un problème pratique : dès que l'on cherche à bâtir des agents locaux par-dessus une véritable mémoire personnelle ou organisationnelle, on se heurte vite à la fragmentation des vocabulaires.

Contacts, courriel, documents, projets, notes, accords juridiques, généalogie, publications, comptes, agendas et présence sociale ont chacun leur manière — mûre mais isolée — de décrire le monde. FOAF, REL, DOAP, GEDCOM, PROV-O, ORG, schema.org, vCard, Wikidata et d'autres portent une structure utile, mais aucun ne donne la forme entière.

L'approche de GMEOW consiste à forger des termes canoniques et à aligner vers l'extérieur. Plutôt que de réécrire les données sources, elle crée une couche supérieure cohérente où les vocabulaires de surface peuvent se projeter dans un modèle commun. L'ontologie est ancrée dans gUFO, vérifiée au regard des contraintes OWL 2 DL, et bâtie autour de l'idée que la provenance, la confiance, la validité temporelle et la coréférence sont des préoccupations de modélisation de premier ordre.

Le projet croît par tranches. La première tranche, ce sont les entités et les contacts. Chaque tranche ajoute des termes canoniques, des tables d'alignement SSSOM, des fixtures et un rapport de couverture, afin que les progrès se mesurent sur des données réelles plutôt que sur de bonnes intentions.

La chaîne d'outils fait aussi partie du propos : validation, raisonnement, correspondances, vérifications Wikidata, métadonnées, négociation de contenu, documentation, artefacts de construction et support de publication doivent tous tourner proprement. Les ontologies méritent, elles aussi, une discipline d'intégration continue.

Je suis particulièrement preneur de retours de celles et ceux qui travaillent sur OWL/RDF, les ontologies de haut niveau, l'alignement d'ontologies, la publication web sémantique, les magasins de données personnelles, les modèles de provenance, l'IA locale et la mémoire des agents.

Où avez-vous vu des graphes de connaissances personnels ou organisationnels se briser parce que la couche de vocabulaire était trop mince ?

Le dépôt est ouvert : gmeow-ontology.

Lien permanent: https://patrickaudley.com/posts/gmeow-ontology.html · Markdown