Sémantický slovník pojmů (SSP)

znalostní graf pro veřejný sektor


drawing Věděli jste, že se slovo “budova” vyskytuje v zákonech v různých významech? Např. v Katastrálním zákoně zahrnuje i nevyhřívané objekty, zatímco v Zákoně o hospodaření energií nikoliv. A když se poté dostanete k datové sadě o budovách (např. v NKOD) nevíte, o kterých budovách ta datová sada je. A nejedná se jen o vás - neví to ani vyhledávač datových sad, takže Vám nemůže pomoci vybrat datovou sadu přesně dle vaší potřeby.

A to je jeden z důvodů existence sémantického slovníku pojmů - jedná se o znalostní graf v jehož uzlech jsou pojmy. Takový pojem si představme jako slovo nebo sousloví, ke kterému je připojeno množství synonym, nejvýše jedna definice a zdroj této definice. Takové uzly jsou mnohem jednoznačnější než slova samotná. A aby pojmům rozuměl i stroj, jsou uzly navzájem propojeny významovými vztahy (třeba “Budova” je speciální případ “Stavby” - ano i v tomto případě se jedná o pojmy, ne o slova, ale definici, synonyma a zdroje neuvádíme), které umožňují odvozovat vlastnosti těchto pojmů a kontrolovat, že pojmy nejsou ve vzájemném rozporu.

Jak se dá SSP použít?

Když vytváříte data pomocí otevřených formálních norem (OFN), jsou jednotlivé datové typy a atributy ve skutečnosti reprezentovány pojmy z SSP. Např. OFN Lidé a osoby definuje datovou strukturu pro popis osob. Vytvoříte-li záznam o osobě, bude se tím rozumět osoba ve smyslu Zákona o základních registrech, která bude reprezentována jako pojem Osoba (Zákon o základních registrech). Ten má svojí lidsky čitelnou a strojově čitelnou reprezentaci a umožní tak uživatelům vašich dat tato data lépe nalézt, porozumět jim a integrovat do svých aplikací.

Využití je ovšem mnohem širší - formální vazby v SSP umožňují třeba kontrolovat, jak jsou pojmy napříč legislativou používány konzistentně. A dokonce - formální jazyky, ve kterých je sémantický slovník pojmů vyjádřen umožňují využít stejný aparát na tvorbu konceptuálních datových modelů (např. pro popis datové architektury veřejné správy), a to ve strojově čitelné podobě a s vazbou na legislativu.

Na jakých technologiích je SSP postaven?

SSP je zveřejněn jako propojená data a je založen na standardech sémantického webu RDF, RDFS, OWL. Validaci slovníku provádíme pomocí SHACL, dotazujeme se do něj pomocí SPARQL.

Metodicky SSP vychází ze základní ontologie Unified Foundational Ontology (UFO), kterou dále rozšiřuje, specializuje a interpretuje v kontextu veřejné správy ČR.

Zaujalo mě to, jak mám dál postupovat?

Můžete si prostudovat Koncepci sémantického slovníku pojmů. Jedná se sice o starší dokument, ale popisuje hlavní principy a architektonická rozhodnutí, které jsou stále platné.

Můžete:

Kontaktujte nás:


Tato stránka je udržována v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983. image