Mis vahe on teadmistegraafikul ja graafiaandmebaasil?


Vastus 1:

„Teadmiste graafik” ja „Andmebaas” on kaks turundusele orienteeritud terminit (summeeritud fraasid), mis on seotud struktureeritud andmeesitusega (teadmiste graafik) ja andmebaasihaldussüsteemidega (graafikute andmebaas).

Nende summeeritud fraaside graafiline külg puudutab olemi suhete mudelit, mida tavaliselt kujutatakse graafilise pildina (võrgu- või veebiskeem).

Nende buzz-fraaside "teadmise" aspekt puudutab olemi seoste tüübi (suhete) semantilisi seoseid, mida väljendatakse olemi seoste mudelis.

„Teadmiste graafik” on põhimõtteliselt struktureeritud andmete olemus (korraldatud andmebaasidokumendina), mida haldab „Graph Database Management Systems” ja mis kasutavad mitmesuguseid deklaratiivseid päringkeeli (mõned neist põhinevad avatud standarditel, nt SQL, SPARQL, samas kui teised on omanduses olevad ja tootespetsiifilised, nt Cypher jt).

Miks meil need buzz-fraasid on?

Relatsioonandmebaaside haldussüsteemi (RDBMS) müüjad tõstsid Edgar Coddi algset relatsioonimudelit üles selle kaudu, mis sai Coddi 12-ks (nullpõhise indekseerimise tõttu tegelikult 13 üksust) relatsiooniandmebaasi reeglid.

Kahjuks muutis ülalnimetatud ettevõtmine Coddi originaalse abstraktse relatsioonimudeli üldise olemuse rakendusspetsiifiliseks mudeliks, kus seosed on kujutatud pigem konkreetsel kui üldisel viisil, st N-Tuples (kujutatud tabelitena), kus iga relatsiooniliige on kordumatult tuvastatud Primaarvõti - mis on vastuolus üldise relatsioonimudeliga, mis nõuab andmete väljendamist lihtsalt suhetena, mis koosnevad Tuplesist.

Tuplid võivad esineda erinevates vormides, sealhulgas: N-Tuples (mida pakub enamik RDBMS-i tooteid), 3-Tuples (mida pakuvad RDF-iga ühilduvad [R] DBMS-tooted), 4-Tuples (mida RDF-iga ühilduvad [R] DBMS-tooted) mis toetavad nimega Graafikud) ja muud ..

Selle kõige netomõju on tinginud uue DBMS-i alamžanri nimega Not-Only-SQL (NoSQL), kuhu kuuluvad ka graafiaandmebaasid.

Olemite suhete mudel (kujutatud graafikuna)

Relatsiooniandmebaasi määratlusdiagramm (kujutatud tabelitena)

Tabeldatud DBMS-i žanrid

NoSQLi tekkimine on loomulikult viinud DBMS-i žanrite laiendamiseni, nagu on kujutatud järgmises tabelis:

DBMS-i žanri muudetud tabeli üksikasjaliku ülevaate saamiseks klõpsake siin.

Näited teadmiste graafikust?

Tuginedes minu isiklikule kogemusele projektis osalemise näol, on siin mõned näited teadmiste graafikutest, mis on vabalt kättesaadavad ja kättesaadavad kõigile, kellel on HTTP-protokolli toetav arvutusseade, st seade, mis on võimeline otsima ja teadmisi uurima vastuseks kasutaja klõpsamistoiming:

  • Lingitud avatud andmepilv (seederdatud DBpedia poolt) - see on hajutatud teadmistebaas (või teadmiste graafik), mis sisaldab struktureeritud andmeid, mis on juurutatud lingitud andmete põhimõtteid kasutades (st olemi suhte mudel, kus olem, atribuut ja väärtus [valikuliselt] tuvastatakse hüperlinkide abil [ st HTTP URI-d]).

Iga ülaltoodud pilve sõlme seostatakse teadmiste domeeniga ja see on täielikult kasutatav inimese klikkide interaktsioonide ja / või tarkvaraagendi otsingute kaudu SPARQL või SQL päringute kaudu.

Seotud

  • Suurte jagatud andmepankade andmete relatiivne mudel - Edgar Coddi algdokumentCodd ja relatsioonimudelEntiteedi suhte mudel - andmete ühtse vaate poole - Peter Cheni lähtepaber - Andmebaasi liidese kontseptuaalne graafik - John F. Sowa algdokumentProbleemid ja järeldused teemal “ Graafikute andmebaas ”fraasMis on DBpedia ja miks see on oluline? Mis on ühendatud lingitud andmete pilv ja miks see on oluline? Mis on väikeandmed ja miks see on oluline? Sõnastik

Vastus 2:

Graafide andmebaas on (sageli) teadmiste graafiku ülempiir.

Teadmiste graafik: Teadmiste graafik on teadmiste baas, mis on masinloetavaks tehtud loogiliselt järjepidevate, omavahel ühendatud graafikute abil, mis koos moodustavad omavahel seotud faktide rühma. Selles kontekstis olev graaf võib olla näiteks ühendatud RDF-i kolmikute komplekt.

Üks RDF-kolmik esindab inimese teadmisi standardses masinloetavas vormis, sidudes subjekti, verbi ja objekti (S-V-O), mis teadaolevalt on omavahel seotud. Need kolmikud meenutavad lihtsaid masinloetavaks tehtud S-V-O inimkeelseid lauseid, näiteks Ian teab Maarjat.

Näide RDF-i kolmikust. Aparaati Jena dokumentatsioon, 2011–2019, alates tuumast RDF API.

Samal ajal saab seda RDF-i kujutist visuaalselt kuvada ka graafide sõlmede (subjektid ja objektid) ja servade (tegusõnad või predikaadid) kujul.

Kui see on osa heausksest operatiivsest teadmiste graafikust, võib selline kolmik olla ka masinloetav faktiväide.

Kolmekordistatud faktidel, mis on loogiliselt järjekindlalt seotud teadmiste graafiku kaudu, on põhjendusvõime. Kui see on loogiliselt järjepidev, lisatakse graafikule faktilised kolmikud, masinad saavad tuletada uusi linke või ühendusi. ühendused, mis on inimeste poolt masinate abil leitavaks tehtud. Seejärel saavad masinad osutada infoteenuse osana juurdepääsu nende ühendatud kolmekordsete andmete, teadmiste graafikute või omavahel seotud faktide andmetele.

Google hakkas pakkuma teadmiste graafikul põhinevaid infoteenuseid 2010. aastal pärast Freebase omandamist 2010. aastal. Google kehtestas tegelikult termini „teadmiste graafik” - termin, mida esmakordselt populariseeriti 2012. aastal.

Ütleme näiteks, et Ian tunneb Maryt, sest mõlemad sõidavad tööpäeviti 23 VTA (Valley Transportation Authority) bussiliini. Ja et nad viisid sama bussiga samasse peatusesse ja avastasid, et nad töötavad samas kohas.

Kui Google'il on luba teha nii Mary kui ka Iani nutitelefoni abil asukoha jälgimist, võib see asukoha jälgimise üksikasjade põhjal järeldada, et kõik toimivad samas kohas.

Näiteks Mary saab õppida seda, mida Google temast teab, andes Google'ile loa jälitamiseks ja seejärel jälgides, mida Google Maps teeb. Pärast Maarja päevast päeva jälgimist järeldab Google Maps, et ta läheb töökohtadesse töökohta ja mingil hetkel pärast seda, kui töö naaseb tavaliselt kodukohta. Google kuvab neid järeldatud fakte Mary nutitelefonis, kui ta kasutab Google Mapsi.

Privaatsusküsimuste ja kujundusotsuste tõttu ei kuva Google Maryle, et Ian töötab samas kohas, kus Mary töötab. Kuid on ka suhtlusvõrgustike rakendusi, mis asjakohaste lubade korral pakuvad sellist teavet.

Graafikute andmebaas: graafikute andmebaase kasutatakse teadmiste graafikute andmete salvestamiseks sageli. Per Vikipeedia,

  • „Andmebaas on organiseeritud andmete kogum, millele tavaliselt salvestatakse arvutisüsteem ja millele on elektrooniliselt juurde pääseda.” „Graafiaandmebaas on omamoodi NoSQL andmebaas, mis kasutab sõlmede, servade ja omadustega graafistruktuure teabe esitamiseks ja talletamiseks. Üldised graafiaandmebaasid, mis võivad salvestada mis tahes graafikuid, erinevad spetsiaalsetest graafiaandmebaasidest, näiteks kolmikkauplused ja võrgu andmebaasid. ”

Andmebaaside haldussüsteem: Per Vikipeedia,

  • „Ametlikult viitab andmebaas seotud andmete kogumile ja viisile, kuidas see on korraldatud. Juurdepääsu neile andmetele pakub tavaliselt andmebaaside haldussüsteem (DBMS), mis koosneb integreeritud arvutitarkvara komplektist, mis võimaldab kasutajatel suhelda ühe või mitme andmebaasiga ja võimaldab juurdepääsu kõigile andmebaasis sisalduvatele andmetele (ehkki piirangud võivad eksisteerida, mis piiravad juurdepääsu konkreetsetele andmetele). DBMS pakub erinevaid funktsioone, mis võimaldavad sisestada, säilitada ja hankida suures koguses teavet, ning pakub viise, kuidas hallata selle teabe korraldamist. “Kuna nende vahel on tihe seos, kasutatakse mõistet„ andmebaas ”sageli juhuslikult, et osutada mõlemale andmebaasi ja sellega manipuleerimiseks kasutatavat DBMS-i. ”

Andmebaasist - Vikipeedia, 2019

DB-Mootorid jälgisid 2019. aasta juuni seisuga 32 erinevat graafilist DBMS-i. Sel hetkel oli 12 parimate hulgas kinnisvaragraafikute DBMS-e, nagu Neo4j ja Arango, ning DB- ja RDF-i neljapoed nagu Allegrograph, Virtuoso ja Stardog. Praeguse pingerea leiate DB-mootorite edetabelist.

2019. aastal alustas World Wide Web Consortium (W3C) graafikute andmete standardimise protsessi, mille eesmärk oli koondada ja võimaldada graafiliste andmete standardset teisendamist ühest vormist teise, erineval viisil esindatud andmeid, näiteks omandigraafikud, RDF või relatsioonilises vormis. Graafiliste andmete kohta vaadake W3C veebi standardimise seminari

Mõned organisatsioonid on ehitanud teadmiste graafikud, kasutades relatsioonilise andmebaasi tehnoloogiat, ja mis tahes graafi saab esitada relatsioonilise andmebaasi kujul. Kuid graafiku andmebaasid on populaarseks saanud tänu kõrgemale staatusele, mille nad on seoseandmetele (st lausetes olevatele verbidele) andnud. Irooniline on see, et suhteandmed on sageli maetud relatsiooniandmebaasidesse või puuduvad neist. Kus oleks inimloogika ja -keel, kui tegusõnad meie lausetest puuduksid?

Seoseandmed on kriitilise tähtsusega kontekstuaalsele arvutusele omase suuremahulise integratsiooni ja koostalitluse jaoks ning nende kontekstide loomine ja haldamine paindlikul, skaleeritaval viisil selgesõnaliste suhete täpsustamisega on muutunud oluliseks laiaulatusliku integratsiooni ja kunstliku üldise eesmärgi saavutamiseks vajalikuks osutumise korral. luure.

Lisateavet kontekstipõhise arvutamise ja AI kontekstifaasi kohta leiate John Launchbury kirjeldusest AI kolme faasi kohta.

Üha enam ettevõtteid loob teadmiste graafikuid, et suurendada oma AI jõupingutusi. Vaadake poodide näidet näiteks jaotises Miks on teadmiste graafikud tehisintellekti jaoks põhialused.

Tänud A2A eest, Terri Gilbert.