. Sistem de Informare Bazat pe O Reprezentare Ontologica a Cunostintelor

. Sistem de Informare Bazat pe O Reprezentare Ontologica a Cunostintelor

Byadmin ianuarie 1, 2024

Introducere

Tehnologia de bază a Web-ului semantic este ontologia. Scopul ei este de a facilita distribuirea cunoștințelor și refolosirea acestora. După natura lor, ontologiile, sunt specificații formale ale concepțiilor care permit o înțelegere distribuită a domeniului, o înțelegere care poate fi atinsă în procesul de comunicare între oameni și agenții software. Ontologia asigură o conceptualizare explicită care descrie semantica datelor. Ea înglobează des și funcțiile asemănătoare cu cele ale bazelor de date, cu toate că realizarea lor este cu totul alta. În timp ce Bazele de Date operează numai cu Datele la nivel de tabele, Ontologia poate include atât Datele cât și Cunoștințele, precum și legătura între aceste două reprezentări informaționale. Reprezentând o structură mai avansată, Ontologia are destulă putere să înlocuiască Bazele de Date, ce va rezolva, în primul rând, problema descrierii resurselor și înțelegerii comune ale acestora.

Crearea Ontologiilor poate avea următoarele cauze:

utilizarea concomitentă de către oameni și agenții software a unei structuri comune de înțelegere a informației.

posibilitatea reutilizării cunoștințelor dintr-un anumit domeniu.

ușurința modificării cunoștințelor, fără spargerea integrității acestora.

separarea cunoștințelor din domeniu de cunoștințele operative.

analiza cunoștințelelor de domeniu.

Toate aceste cauze reflectă și principiile de bază ale Managementului de Cunoștințe actual. Cu aceasta problemă se confruntă cel mai mult întreprinderile mari, în care Cunoștințele devin un instrument la fel de puternic ca și ceilalți factori de producție. Manegerii se confruntă cu problema necunoașterii resurselor umane și intelectuale ale întreprinderii, ce scade semnificativ capacitatea de producție și crește posibilitatea dublării taskurilor, cerințelor către diferiți angajați. Aceeași problemă apare și cu componentele Software, nefiind cunoscute ca un întreg, ele la fel pot crea dublicarea informației care, datorită caracterului ei dinamic, are ca efect apariția redundanței.

Așadar Ontologia, prin acceptarea sa de către mai mulți agenți, crează o coloană vertebrală în organizarea cunoștințelor, și resurselor acestora. Ontologia reprezintă o bază care poate fi accesată la fel de ușor de către Agenții Software, cât și de oameni. Agenții pot nu numai extrage cunoștințele necesare, dar pot și procesa prin metode de inferență, generând și concluziile necesare.

Lucrarea de față, cu titlu “Sistem de Informare bazat pe reprezentare ontologică a cunoștințelor” are ca scop cercetarea în domeniul Manegementului de Cunoștințe și anume subdomeniul principal al acestora care se numește Ontologia, facilitățile ei precum și legatura între aceste două noțiuni. Ca un set de cuvinte cheie care descriu în linii mari această lucrarea putem specifica: Managementul de Cunoștințe, Ontologia, Limbaje Ontologice, Framework-uri Ontologice, Jena, RDF, RDQL, Protégé… Scopul principal al acestei lucrări este înțelegerea generală a tehnologiilor Web-ului Semantic ca o parte integrată a Managementului de Cunoștințe și rolul Ontologiei în structura acestei tehnologii. Ca sub-obiective am încercat să studiez și să descriu principalele metode, instrumente și alte elemente, care au un caracter aplicativ în cea ce privește Ingineria Ontologiei și dezvoltarea Software-ului pe baza Ontologiei.

Lucrarea este structurată pe 4 capitole în care sunt descrise noțiunile menționate mai sus.

Capitolul 1 are un caracter introductiv, care reprezintă descrierea problematicii lucrării. Aici sunt definite noțiuni de bază precum: Managementul de Cunoștințe, Ontologia, Limbaje Ontologice, Interoperabilitatea… Se ridică problemele majore a Web-ului actual, și se discută variantele posibile de rezolvarea a lor, cu ajutorul elementelor predefinite. Se discută legătura între Ontologie și Managementul de Cunoștințe. Sunt enumerate principalele tehnologii a Web-ului Semantic.

Capitolul 2, se focalizează pe problematica Ontologiei, și explicarea mai detaliată a noțiunilor acestora. Capitolul are mai multe subcapitole, fiecare avand un aspect important în descrierea Ontologiei. În primul rând se discută Metodologia pentru Managementul de Cunoștințe și fazele principale de proiectare. După ce se descrie noțiunea Managementul Ontologiei, care presupune depozitarea, aliniamentul și întreținerea acesteia. În continuare sunt prezentate și exemple de Ontologii deja existente.

În capitolul 3, este descrisă partea aplicativă a Ontologiilor, și anume intrumentele, blocurile funcționale a midleware-ului precum și interacțiunea între ele. Subcapitolul 3.8 descrie activitatea Consorțiului EnerSearch în cercetarea industrială. Un subiect de importanță deosebită este descris în subcapitolul 3.9 care descrie perspectivele P2P în domeniului Web-ului Semantic, aceasta fiind una dintre cele mai promițătoare direcții de dezvoltare.

În capitolul 4 este prezentată partea practică a lucrării. Scopul acestui capitol este de a demonstra integritatea instrumentelor Managementului de Cunoștințe, prin exemplificarea cazurilor celor mai importante. În acest capitol este descris un studiu de caz, care are la bază posibilitatea îmbunătățirii procesului de căutare a Proiectelor de Cercetare și Dezvoltare ce sunt disponibile doar pe teritoriul României. Se face o paralelă între problema navigării și căutării proiectelor necesare și problemele generale descrise în capitole anterioare care, de obicei, apar în Web-ul actual. După aceea se dau variantele posibile de îmbunătățire a acestui proces. În primul rând, accentul se pune pe o rezolvare perfectă, din punct de vedere al Managementului de Cunoștințe, a problemelor ce se bazează pe o singură Ontologie, după ce se discută și situația reală, care este alta decât acea dorită în acest domeniu, și se propune o soluție posibilă care ar putea fi integrată fară realizarea schimbărilor majore în structura actuală de stocare a Bazelor de Date a Proiectelor de Cercetare și Dezvoltare. Aplicația prezentată în acest capitol are scopul de a arată un exemplu de aplicație posibilă care ar putea rezolva problema interfeței cu utilizatorul, ce se bazează pe Framework-ul Jena (HP).

Cercetarea prezentată în acestă lucrare se bazează atât pe bibliografia modernă din domeniu, cât și pe comunicarea virtuală cu inginerii de Ontologii din întreaga lume pe canale de chat din domeniu. Așadar pentru studiu mai profund al problemei în afara studiului bibliografic am apelat la „Semantic Web Interest Group IRC Scratchpad“ (http://swig.xmlhack.com/), care reprezintă un canal de tip IRC de pe serverul FreeNode; canalul #swig. Mai multe din răspunsurile importante le-am primit și pe forumul de pe pagina Sesame-ului: http://www.openrdf.org/forum/mvnforum/index.

Acum vreau să descriu pe scurt sursele bibliografice, și să precizez pe ce idei mi-am bazat lucrarea. În primul rând toate cărțile din domeniu sunt apărute după anul 2000, pentru că noțiunea Web-ului Semantic în general este destul de nouă.

Una dintre cărțile principalele, pe care a fost bazată în linii mari și cercetarea mea este “TOWARDS THE SEMANTIC WEB Ontology-driven Knowledge Management[5]”. După ce am parcurs această carte am scris o scrisoare de E-mail autorului, în care l-am întrebat despre instrumentele mai actuale de dezvoltare a Ontologiei, decât cele descrise în carte, din cauză că, după apariția cărții, au trecut doi ani. În răspunsul personal profesorul Dieter Fensel mi-a indicat să mă bazez mai mult pe soluțiile contemporane dezvoltate de către așa lideri a IT-ului cum sunt: HP, IBM, Aduna, etc. Așadar, în ultimul capitol al lucrării eu prezint Framework-ul Jena de la HP, în care am încercat să arăt și câteva exemple de Interogare a Ontologiei cu un limbaj de interogare RDQL. Despre limbajul RDQL sunt foarte multe resurse electronice, unele dintre care le-am trecut și la bibliografie. Mai mult teoretic am studiat și soluțiile de la Aduna, și anume serverul Sesame, care este la fel descris în următoarele capitole.

O sursă de informare foarte importantă în acest domeniu este revista IEEE INTELEGENT SISTEM[2], aici putem urmări ultimile știri și articole din domeniul Inteligenței Artificiale, mai ales și despre Web-ul Semantic și Managementul de Cunoștințe.

Pentru partea aplicativă am folosit tehnologia java, din 2 motive. Primul este legat de independența de platformă pe care ne-o oferă aceasta tehnologie. Al doilea motiv este legat de Framework-ul Jena de la firma Hewlett-Packard, care este realizat sub forma pachetelor Java. Ca mediu de dezvoltare am ales JBuilder, datorită facilităților oferite de el. Pentru a studia mai profund tehnologiile Java am folosit cartea Java de la 0 la expert[11].

Așadar, lucrarea mea este bazată pe cercetarea și studiul propriu-zis a urmatoarelor tehnologii, instrumente și altor noțiuni:

Aspectele generale a problematicii Web-ului actual;

Aspectele generale a Managementului de Cunoștințe;

Aspectele mai aprofundate despre tehnologia Ontologiei;

Modul de funcționare a serverului Sesame de la firma Aduna;

Modul de funcționare a Framework-ului Jena de la firma HP;

Modul de Funcționare a Redactorului Ontologic Protege

Limbajul de descriere a resurselor RDF;

Limbajul de interogare a RDF-ului RDQL;

Limbajul de programare Java în mediu de dezvoltare JBuilder.

Printre punctele tari ale lucrării eu consider studiul propriu în toate domeniile enumerate mai sus. Mai ales limbajului Ontologic RDF, limbajului de interogare RDQL și Frameworkului Jena, ce reprezintă o tehnologie foarte actuală în ziua de azi.

Printre punctele slabe aș numi studiul practic al Serverului Sesame, datorită complexității documentației propuse de către firma producătoare „Aduna”.

În final consider că am putut rezolva problema definită în această lucrare, pentru că am putut construi un prototip al aplicației care poate interoga Ontologia de nivelul RDF prin intermediul limbajului RDQL. Soluția propusă poate să fie văzută ca o soluție posibilă pentru „Sistemul de Informare bazat pe reprezentarea ontologică a cunoștințelor”, și să corespundă acestei definiții. Din punct de vedere al cercetării domeniului ales, am descris în lucrarea de față principalele direcții de dezvoltare ale Web-ului Semantic și am indicat tehnologiile preferabile pentu aceasta, cum ar fi: Sesame, Jena, RDF, RDQL, XSLT, OWL etc.

Capitolul I. Webul Semantic și Managementul de Cunoștințe

Ca să avem o imagine clară a scopului lucrării în prima secțiune vom vedea care sunt problemele Web-ului în ziua de azi și vom introduce cateva noțiuni noi precum: Managementul de cunoștințe, Web-ul Semantic, Ontologie și altele. De remarcat că toate noțiunile discutate fac parte dintr-un domeniu de mare interes a cercetării actuale.

1.1 Problemele Actuale

De la aparitia Web-ului a trecut, relativ, puțin timp. În perioada aceasta, au apărut multe facilități noi care cândva păreau imposibile. Și totuși în ziua de azi noi suntem puși în fața unor probleme noi, care dacă nu vor fi rezolvate la timp, pot duce la mari dificultăți în dezvoltarea viitoare a Web-ului. Una dintre problemele de acest gen este problema Managmentului de Cunoștințe, care constă în structurarea informațiilor în format semantic.

Majoritatea resurselor Internetului reprezintă o rețea de hyperlinkuri care sunt uneori realizate fără nici o structură logică. Navigarea într-o astfel de structură devine dificilă. Volumul informației crește progresiv, în fiecare zi se adaugă resurse tot mai noi, iar problema găsirii informației necesare și filtrării acesteia devine una dintre cele mai importante. Utilizatorul își pierde mai mult timp căutând informația decât consultând-o.

Ieșirea dintr-o astfel de situație poate fi oferită de Web-ul semantic, idee propusă de “creatorul” Web-ului Tim Berners-Lee și susținută de World Wide Web Consortium (W3C). La baza proiectului stă necesitatea structurării informației în mediul Internetului sub aspect semantic. Între resurse diferite trebuie să apară relațe resurse diferite trebuie să apară relații logice, site-urile vor fi grupate tematic, ceea ce va permite căutarea informației nu numai după cuvintele cheie, ci și după sensul lor semantic. Folosind adnotații logice resursele vor fi “înțelese” nu numai de oameni, ci și de mașini.

1.2 Impactul Webului Semantic- Managementul de Cunoștințe

În lucrarea de față este discutată noțiunea Web-ului Semantic prin prisma posibilităților oferite acestora de către aria Managementului de Cunoștințe. Managementul de cunoștințe poate fi definit ca un set de instrumente, tehnice și procese pentru management-ul de organizare a averii intelectuale. Așadar folosind metodele optimizate ale bussines-ului curent cum ar fi reutilizarea și partajarea, putem crește eficiența acestora și putem elimina duplicarea eforturilor.

Sistemele curente ale Managementului de Cunoștințe au mai multe slăbiciuni, cele mai importante fiind: căutarea informației, extragerea informației, generarea automată a documentelor, etc. Mai mult, sunt greu de susținut resursele textuale, audio și video slab structurate. Competivitatea multor companii depinde în mare parte de felul în care ele exploatează cunoștințele corporative și memoria.

Managementul de cunoștințe practice înseamnă o mulțime de operații de achiziție, accesare și menținere a cunoștințelor în cadrul organizației. Cu cât intreprinderea este mai mare cu atât problema dirijării cunoștințelor devine mai importantă.

Printre cele mai mari slăbiciuni ale Manegementului de Cunoștințe actual putem numi:

Căutarea informației: Motoarele de căutare se bazează pe cuvintele cheie, ce nu pot fi deajuns pentru o selecție calitativă prin volume mari de informații.

Extragerea Informației: Extragerea conținutului poate fi realizată numai prin munca umană, și există o mare nevoie de a automatiza acest nivel, pentru că el devine tot mai costisitor.

Menținerea Informației: Apare inconsistența informației, deseori datorită învechirei acestora.

Vizualizarea Informației: Imposibilitatea de a defini interogările Informației în mediul Web.

Managementul de Cunoștințe a Web-ului Semantic asigură că:

Cunoștințile vor fi organizate după criterii conceptuale, după sensul lor semantic.

Vor fi create instrumentele automatizate pentru menținerea și regăsirea informației.

Va fi posibilă interogarea semantică în cadrul unui sau mai multor documente.

Devine posibilă realizarea accesului prioritar la documente. Vei putea defini cine poate avea acces la documentul întreg sau la anumite parți ale lui.

1.3 Tehnologiile Webului Semantic:

Conținutul Web-ului actual este orientat către cititori umani mai mult decăt către aplicații. Până acum HTML-ul este limbajul predominant, ce crează o serie de dificultăți. În continuare vom descrie ce facilități de descriere a cunoștinților ne oferă Web-ul Semantic.

1.3.1 MetaDate

Metadatele sunt date despre date. Aceasta descrie înțelesul semantic al datelor, ce permite o procesare elementară de către mașini. Web-ul semantic se bazează mai mult pe informații și meta-informații procesate de către mașini.

1.3.2 Ontologiile

Tehnologia principală care stă la baza Web-ului semantic este ontologia. Scopul ei este de a facilita distribuirea cunoștințelor și refolosirea acestora. Ontologia este o specificație formală, explicită a conceptualizării distribuite. „Conceptualizarea” se referă la un model abstract al unui fenomen din lumea reală, care identifică relevanța altor concepte din fenomenul dat. „Formal” se referă la faptul că ontologia trebuie să fie înțeleasă de către mașini, iar „explicit” înseamnă că tipul conceptului folosit ca și constrângerile de folosire a lui este definit explicit. După natura lor ontologiile sunt specificații formale ale concepțiilor care permit o înțelegere distribuită a domeniului, o înțelegere care poate fi atinsă în procesul de comunicare între oameni și aplicații. Așadar ontologiile conțin două aspecte principale, care pot ajuta la atingerea potențialului maxim al Web-ului:

ontologiile definesc o semantică formală pentru informații, ce permite procesarea acestora de către calculator;

ontologiile definesc semantica lumii reale, ce face posibilă legarea conținutului procesabil de către mașini cu înțelesul omului, care se bazează pe terminologiile mutuale.

Trebuie să menționăm și caracteristicile principale ale ontologiilor folosite în Web-ul Semantic:

ontologia trebuie să se bazeze pe arhitectura rețelei;

ontologia trebuie să fie dinamică.

Ontologia este o reprezentare comună, acceptată de toți, însă obținerea unui model comun este atât de grea, încât poate părea nerealizabilă, de aceea la momentul actual se pune o altă problemă, și anume obținerea unui mecanism efectiv de integrare și interlegare a segmentelor semantice diferite. Rețeaua de ontologii trebuie să fie capabilă să rezolve conflicte apărute din cauza posibilelor conceptualizări contradictorii.

În funcție de nivelul de generalitate, pot fi definite diferite tipuri de ontologii în procesul creării sistemelor bazate pe cunoștințe:

ontologiile de domeniu: descriu cunoștințele dintr-un domeniu, cum ar fi domeniul electronic, medical, digital, etc.

ontologiile de metadate: asigură un vocabular pentru descrierea conținutului sursei on-line (Exemplu: Dublin Core).

“ontologiile generice” sau de „sens comun”: au ca scop acoperirea cunoștințelor generale despre lumea reală; pot descrie concepte ca timpul, starea, evenimentul, etc.. Ca rezultat ele sunt valabile în mai multe domenii. Spre exemplu o ontologie despre meteorologie poate fi aplicată în mai multe domenii.

ontologiile reprezentative: nu aparțin unui anumit domeniu. Acest gen de ontologii asigură reprezentarea entităților fără precizarea despre ceea ce trebuie reprezentat. O ontologie foarte cunoscută este Frame-Ontology, care definește concepte cum af fi cadre, sloturi, sloturi de constrângeri, care permite reprezentarea cunoștințelor într-o formă orientată pe obiecte și pe cadre.

Alte tipuri de ontologii sau așa numitele ontologii de metode și taskuri. Ontologiile de taskuri asigură terminologia specifică unor taskuri, iar ontologiile de metode- terminologia specifică metodelor particulare de rezolvare a problemelor.

Ontologia asigură o conceptualizare explicită care descrie semantica datelor. Ea are o funcție asemănătoare cu cea a bazelor de date. Diferențele sunt următoarele:

Din punct de vedere semantic și sintactic limbajul de descriere a ontologiilor este mai bogat decât abordările bazelor de date.

Informația descrisă într-o ontologie conține texte semistructurate într-un limbaj natural, și nu tabele cu informații.

Ontologia trebuie să fie o tehnologie distribuită și bazată pe terminologia naturală, deoarece se folosește pentru distribuirea și interschimbarea informațiilor.

Ontologia asigură teoria de domeniu, și nu o structură a containerului de date.

1.3.3 Logica și Inferența

Logica este o disciplină care studiază principiile de rațiune. Ea folosește limbaje formale pentru descrierea cunoștințelor. Logica este mai generală decât Ontologia și poate fi folosită de către agenți inteligenții pentru luarea deciziei și selectarea cursului corespunzător de acțiuni. Mai mult, este necesară pentru implementarea corectă a subsistemului explicativ, ce permite utilizatorului să controleze și să înțeleagă rațiunea agentului dacă este nevoie.

1.1.4 Agenții

Agenții Software lucrează autonom și activ. Ei evoluează din programarea orientată pe obiect și pe componente. Ideea Utilizării Agențiilor Personale a aparut demult, și anume acum cu dezvoltarea Web-ului Semantic ea a devenit reală. Este vorba de Agentii care ne vor ajuta să căutăm informația dorită, conform intereselor noastre persoanale. Mai mult, Agențiile vor avea un modul de inferența care va permite și luarea deciziei conform restricțiilor stabilite de către utilizator. El va primi de la utilizator un set de taskuri (figura 1.1), și le va rezolva conform preferințelor acestora. El va putea comunica cu alți agenți, compara informația cu cerințile utilizatorului și preferințele lui și răspunde la întrebările puse.

Tehnologiile Agențiilor Web-ului Semantic presupun lucru cu următoarele structuri:

Metadata: identificarea și extragerea informației din sursele Web-ului.

Ontologii: căutarea și interpretarea informației- precum și comunicarea cu alți agenți.

Logica: procesarea informației extrase, tragerea concluziilor.

Tehnologiile recente presupun:

Limbajele de comunicare între agenți.

Reprezentarea formală a convingerii, dorinței și intenției agenților.

Crearea și menținerea modelului utilizatorului.

1.4 Interoperabilitatea Semantică și Piramida Limbajelor Web-ului Semantic

Interoperabilitatea Semantică se obține printr-o reprezentare bazată pe straturi Semantice. Straturile Semantice sunt nivelurile de descriere semantică, fiecare având un set de specificații în plus fața de cel inferior, și este realuat cu ajutorul instrumentelor proprii, cum ar fi limbajele ontologice. Așadar, pentru construirea celei mai simple Ontologii este îndeajuns să începem cu stratul cel mai inferior care poate fi realizat cu ajutorului XML-ului. Pentru că XML-ul are prea puține facilități de descriere a relatiilor și cunoștințelor acestui strat nu este îndeajuns, și noi vom avea nevoie să mai continuăm, construind alt strat de specificații folosind RDF (limbaj de descriere a resurselor), și așa mai departe.

Toată ierarhia straturilor poate fi reprezentată în figura 1.2. Aici un segment semantic este reprezentat de o singură descriere a domeniului. De obicei reprezentarea comună acceptată de toți este practic imposibilă, de aceea avem nevoie de Interoperabilitatea Semantică. Aceasta este cel mai des este realizată de instrumentele speciale care permit rezolvarea problemelor incompatibilității a diferitelor tipuri de descrieri. Tot în acest desen noi vedem partu straturi principalr de reprezentare. Acum pe scurt despre fiecare dintre ele.

1.4.1 XML

XML este un limbaj care permite descrierea structurii arborescente sub formă lineară. Este bazat pe Standard Generalized Markup Language (SGML), care a fost dezvoltat mult timp înainte pentru descrierea structurii documentului.

Unul dintre componentele puternice ale XML-ului, este Document Type Definition (DTD). Această componentă nu este obligatorie într-un document „bine formatat” în XML, însă nu putem atinge structura semantică care ne interesează în lipsa acestora. Un DTD conține trei elemente principale: declarația elementului, care definește tagul și valorile posibile a acestora; declarația atributului care definește atributele tagului; și declarația entității.

Un alt mod de a defini constrîngeri asupra structurii documentului valid în XML ni-l oferă Schema XML. Schemele XML au același scop ca și DTD, însă oferă câteva facilități utile:

Definițiile Schemei XML sunt ele însuși documente XML;

Schema XML asigură un set larg de tipuri de date, care pot fi folosite pentru a defini valorile tagurilor elementare;

Schema XML asigură mai multe posibilități pentru descrierea sub-tagurilor (tagurile incluse în alte taguri);

Schema XML asigură un mecanism de „spațiu-nume” pentru a combina documentele cu vocabularul eterogen.

Standardul Schemelor XML formează o bază largă în care dezvoltatorii pot construi aplicațiile XML interoperabile.

În comparație cu DTD, Schema XML asigură diverse avantaje, dar totuși, dezvoltarea instrumentelor pentru Schema XML, ca și lucrul cu ea însuși este mult mai complicat.

Pentru a descrie un format de reprezentare a documentului, XML folosește pe XSL-ul, care provine din Cascading Stylesheets (CSS) și oferă multe noi facilități. Așadar XSL permite să definim un mod de afișare a documentului înainte de a fi afișat. Diferite pagini pot fi create în funcție de preferințele utilizatorului.

Mai mult decât atât, XSL permite translatarea documentului în alt document folosind DTD-ul diferit. La ora actuală, XSL se folosește pentru translatarea codului XML în HTML pe partea serverului. Această metodă mai este necesară, pentru majoritatea browserilor care încă nu suportă formatul XML și XSL.

XML asigură o structură arborescentă, în care diferitele frunze sunt prezentate sub forma tagurilor bine definite ce face informația mai înteligibilă. Cu toate acestea, XML nu poate deveni un instrument independent, care asigură legătura între mai multe tipuri de date diferite, din următoarele motive:

nu este posibil să extragem o entitate semantică dintr-un anumit domeniu, deoarece acest limbaj este orientat pe structura documentului, și nu presupune o interpretare generală a datelor pe care le conține;

este greu de realizat o structură a metadatelor, pentru că la structurarea lor contează ordinea reprezentării;

marcajul, care conține textul împreună cu elementele incluse, este greu pentru o extragere corectă a datelor și stabilirea relațiilor între ele;

Shemele XML n-au noțiuni de moștenire multiplă, iar DTD-ul nu le are deloc.

Limbajul Extensibil de Markare (XML) a fost dezvoltat în scopul prezentării documentelor cu

structura arbitrară, spre deosebire de HTML, care era proiectat pentru structura fixă. În XML etichetele n-au structuri fixe, și sunt predifinite de către utilizator. Descrierea structurii se realizează cu ajutorul DTD-ului. Tendința actuală este de a trece de la folosirea DTD-ului spre Schemele XML, aceasta având câteva avantaje față de DTD.

XML servește la următoarele realizări:

Utilizarea sintaxei ale altor limbaje de marcare,

Separarea de conținut,

Formatul uniform de interschimb al datelor.

Este foarte important să precizăm că toate aceste aplicații de XML, DTD sau Schema XML specifică numai convențiile sintactice, și nu ajută la descrierea semanticii, cu toate că reprezintă un nivel esențial și indespensabil pentru realizarea ei.

1.4.2 RDF

Modelul Resource Description Framework (RDF), are un statut de recomandare dat de către W3C, are ca scop standardizarea legată de definirea și folosirea metadatelor, care descriu resursele Web-ului. Ca urmare, RDF este la fel de bun și pentru reprezentarea datelor. Un dezavantaj mare a RDF-ului totuși este lipsa mecanismului de reprezentare a relațiilor prin axiome.

Pentru Ontologiile simple se folosesc Schemele RDF-ului (RDFS). Cu RDFS noi putem vorbi despre clase, subclase, subproprietăți, domenii și restricții a proprietățiilor. În comparație cu Schemele XML- RSFS-ul oferă numai informații despre interpretarea stărilor de date în modelul de date RDF, dar el nu restricționează apariția sintactică a descripțiilor RDF-ului. RDF-ul permite defenirea vocabularului personal pentru datele RDF-ului și specifică tipuri de obiecte pentru care aceste obiecte trebuie aplicate.

Până acum noi am văzut, că RDFS-urile pot fi tratate ca un limbaj pentru descrierea ontologiei, totuși multe tipuri de cunoștințe nu pot fi descrise, spre exemplu:

Situații, când fiecare carte poate avea un singur preț, și cel puțin un autor (sau mai mulți);

Situații când titlu de carte este de tipul string, sau prețul este de tip număr;

Situații când nici o carte nu poate avea în același timp coperta dură și moale;

Situații în care fiecare carte fie are coperta dură, fie moale.

Un bloc de bază constructiv al RDF-ul este — tripletul «obiect — atribut — obiect», care este des notat sub forma A(O,V). Se citește astfel: obiectul O are atributul A cu mărimea V. Această relație mai poate fi reprezentată sub forma unei muchii notată cu A, care leagă două noduri, O și V: [O]-A—>[V]. Notația aceasta este destul de folositoare, pentru că RDF-ul ne dă posibilitatea să schimbăm locurile obiectelor cu al atributelor. Așadar, orice obiect poate juca un rol de atribut, care în prezentarea grafică corespunde unui lanț cu două muchii marcate.

XML-ul, XSL-ul și RDF-ul sunt tehnologii complementare, ce înseamnă că ele vor susține reprezentarea ontologică în managmentul de cunostințe și comerțul electronic.

Un proces foarte important este maparea ontologică, care inseamnă un proces de atingere a interoperabilității între diferite ontologii. Se pune problema obținerii unui mecanism efectiv de integrare și interlegare a segmentelor semantice diferite. Conform figurei 1.2 folosirea, XML-ului și RDF-ului poate fi un prim pas important spre structurarea ontologică.

1.4.3 Stratul Ontologic

Acest strat este considerat ca unul mai expresiv decât stratul Schemei RDF-ului. Standartul curent de descriere a acestui strat este limbajul OWL.

OWL-ul constă din trei niveluri a limbajului: OWL Lite, OWL DL (pentru logica descriptivă) și OWL Full. OWL-ul poate fi privit ca o colecție a tripleturilor RDF, dar aceste tripleturi care folosesc vocabularul OWL au un înțeles difinit specific. Daca graful este specificat de către OWL, semantica lui se interpreatează de către OWL, în caz contrar de către RDF.

Un alt limbaj actual de descrierea Ontologiei este OIL. Iată câteva idei care au stat la baza creării acestui limbaj:

Maximizarea compatibilității cu standarde existente a W3C-ului;

Maximizarea parțială a interoperabilității, minimizând numărul de procese semantice;

Oferă principii, care sunt utile pentru comunități mari de utilizatori;

Maximizarea expresivității pentru modelarea marilor varietăți de ontologii;

Oferă o semantică formală pentru a ușura interpretarea de către mașini;

Permite folosirea sunetelor, serviciilor complete și eficiente de explicare.

Aceste idei au condus către următoarele trei necesități:

Aceasta trebuie să fie destul de intuitivă pentru utilizatorii umani;

Ontologia trebuie să aibă o semantica formală bine definită cu proprietăți de explicare pentru a asigura integritatea, corectitudinea și eficiența.

Ontologia trebuie să aibă o legătură corespunzătoare cu limbajul Web existent, cum ar fi XML și cu RDF-ul ca să asigure interoperabilitatea.

OIL extinde sintaxa de bază a cadrelor astfel încât aceasta poate folosi pe deplin logica descriptivă expresivă. Aceste extensiuni includ:

Combinațiile arbitrare booleane de clase pot fi formate și utilizate acolo unde numele clasei poate fi folosit;

Constrângerea de slot poate fi și ea tratată ca o clasă;

Definiția clasei are un câmp opțional care specifică, dacă definiția clasei este primitivă sau neprimitivă;

Sunt posibile diferite tipuri de constrângeri de sloturi, care specifică restricții de valori, cuantificatori existenți, și multe tipuri de constrângeri de cardinalități;

Definițiile sloturilor globale se extind pentru a permite specificațiile supersloturilor;

În comparație cu multe limbaje de cadre existente, aici nu sunt restricții privitor la ordinea claselor și definirea lor;

Mai mult dea atât OIL permite folosirea axiomei pentru definirea disjuncției, egalității respectând expresiile claselor.

DALM+OIL este asemănator cu OIL, totuși este mai strâns legat de RDFS. Cel mai mare impact al OIL-ui și al DAML+OIL-ui constă nu numai în faptul că sunt cele mai actuale în momentul de față, dar în aceea că pot construi o bază stabilă pentru un limbaj viitor, care va fi folosit de toți.

1.4.4 Stratul Logic

Stratul Logic permite explicarea raționamentului. Este realizat de către OWL DAML-ul, și permite descrierea cunoștințelor declarative orientate către aplicații.

Stratul Logic este unul de bază însă nu este cel mai superior, și la fel ca și celelalte straturi poate fi extins. Spre exemplu, după ce stratul logic este definit devine posibilă construirea Straturilor de Adevăr (dovadă) și a unuia de Încredere. Adevărul se referă la un proces de generare a adevărului, și la interschimbului și validarea acestora. Încrederea face posibilă realizarea semnăturilor digitale și a listelor de recomandare sau a top-urilor relevante de încredere a agențiilor (fig 1.3).

Capitolul II. Ontologia ca arhitectură de bază a MC-ului:

Ontologia este acea cheie care stă la baza tehnologiilor Web-ului Semantic. Ontologia reflectă înțelegerea comună acceptată, dintr-un domeniu oarecare, ce permite comunicarea între om și aplicațiile software.

2.1 Metodologia pentru Managmentul de Cunoștințe bazată pe Ontologie

Aici este prezentată o metodologie complexă, care permite crearea ontologiei pentru aplicațiile managementului de cunoștințe, și care constă din cinci pași principali:

Studiul fezabilității: Fiecare sistem al managementului cunoștințelor poate funcționa perfect atunci când el este bine integrat în structura funcțională a întreprinderii. Un studiu al fezabilității presupune, identificarea problemei, respectiv a opurtunităților și posibilelor soluții, analiza din perspectivă organizațională largă.

Una dintre etapele acestui pas este identificarea taskurilor relevante. Pentru aceasta uneori avem nevoie de următorii actori: analistul taskurilor, analistul pieselor de cunoștințe, agentul modelului.

Faza de început: Ca și în cazul dezvoltării software-ului trebuie să începem cu descrierea documentară a cerințelor. Descrierea aceasta trebuie să conțină următoarele infomații:

În general sunt două mari metode folosite pentru dezvoltarea aplicațiilor: top-down și bottom-up.

Faza de rafinare: În această etapa de obicei se alege un limbaj de descriere potrivit.

Faza de evaluare: În etapa de evaluare inginerul de ontologie trebuie să verifice dacă ontoligia întra-devăr corespunde specificațiilor ei.

Faza de menținere: Aici avem un set de reguli stricte cu privire la actualizarea și întreținerea permanentă a ontologiei.

Ontologia stă la bază tehnologiei managmentului de cunoștințe prezentate aici. Metodologia prezentată este structurată în cinci mari etape. Fiecare etapă presupune evaluarea mai multor decizii, care sunt pe scurt prezentate în figura 2.1a. Mulțimea tutoror fazelor presupune urmărirea dezvoltării ontologiei de la zero pâna la faza de menținere.

Metoda prezentată de mai sus este destul de sugestivă pentru realizarea ontologiilor, însă datorită faptului că ingineria ontologică este o noțiune destul de nouă, multe grupuri de cercetători folosesc fiecare, metoda lui proprie. Iată cele mai importante dintre ele:

Metodologia de tip schelet:

Identificarea scopului

Construirea ontologiei

Evaluarea

Documentarea

Cactus:

Specificarea aplicațiilor

Crearea ontologiei prin metoda top-level.

Structurarea și rafinarea Ontologiei

Methodology:

Identificarea proceselor de dezvoltare a ontologiei

Identificarea stărilor prin care trece ontologia

Pașii care trebuie efectuați pentru a realiza fiecare activitate

de Descriere a cerințelor Ontologiei.

Instrumentele formale ale analizei ontologice.

Ontologia este un element de bază al arhitecturii de administrare a informațiilor descrise în capitolul 1. În acest capitol am descris o metodă pentru dezvoltarea aplicațiilor în cadrul ontologiei, pornind proiectul de la faza de început până la faza de menținere. Metodele existente și experientele în dezvoltarea ontologiei practice au în comun faptul că încep prin identificarea scopului ontologiei și prin nevoia domeniului de a acumula informații. În studiul nostru despre procesul de dezvoltare ontologică integral aspectele metodelor existente cu cele ale cursurilor din experiența practică. Punem dezvoltarea ontologică într-un context organizațional mai mare prin executarea unui studiu de fezabilitate.

Studiul de fezabilitate se bazează pe KADS Common. Am modificat anumite aspecte din KADS pentru o integrare mai bună a studiului de fezabilitate în metodologia noastră. Studiile cazului descrise în ultimele capitole tratează un domeniu vast de provocări în administrarea informațiilor. Fiecare are propriile sale caracteristici. Calea procesului de dezvoltare a aplicațiilor în cadrul ontologiei este schițată în Figura 2.1a.

Ideea principală indică anumite activități care conduc în cele din urmă la ontologia rafinată, evaluată și aplicabilă ce trebuie menținută. Fiecare semnal indica efecte majore ale activității relatate. Cele mai importante etape ale fiecărei activități sunt schițate în dreptul fiecărei activități. Rafinamentul, evaluarea și menținerea trebuie executate în cicluri repetate. Acum vom descrie fiecare activitate în parte.

2.1.1 Studiul de fezabilitate

Fiecare sistem de gestionare a informațiilor poate funcționa satisfăcător doar dacă este integrat cum trebuie în organizația în care operează. Mai mulți factori, alții decât cei tehnologici, determină succesul sau eșecul unui asemenea sistem. Pentru a analiza acești factori, trebuie să pregătim inițial studiul de fezabilitate, adică să identificăm problema: ocaziile favorabile și soluțiile posibile să le punem într-o perspectivă de organizare.

Ne îndreptăm atenția către aspectele studiului de fezabilitate care ne ajută să identificăm în Figura 2.1b următorii utilizatori și interacțiunile lor:

Depozitele legate de un proiect împărțit în : cei ce utilizează sistemul și cei ce susțin sistemul.

Întâlnim cazuri ce descriu folosirea indrumătoarelor pe care le numim „situația condusă de către utilizatori” (navigarea și răsfoirea unei baze de informații, utilizarea unei baze de informații și căutarea informațiilor).

Întâlnim cazuri ce susțin aceste situații condusă decătre utilizator pe care le numim situații de suport (dezvoltare ontologică, menținere, adnotare). Setările de instrumente descrise în ultimele capitole reprezintă un sistem care furnizează baza tehnică.

Un element esențial al sistemului de administrare a informațiilor este crearea unui sistem de sonorizare în navigare pentru a-l face mai acesibil utilizatorilor. Utilizatorul poate alege între două metode generale în localizarea informației: o primă metodă o reprezintă utilizarea bazei de informații și a doua metodă o reprezintă navigarea și răsfoirea acestei baze de informații. Pentru a susține pregătirea și sharing-ul informațiilor, utilizatorul trebuie să fie îndrumat și susținut de o organizație de partajare a informațiilor. Serviciile de stimulare pot oferi noi cunoștințe în conformitate cu dorințele și cerințele utilizatorului.

Informațiile tehnice furnizează o stuctură pentru sistem care este de fapt ontologia. Inițial aceste informații sunt responsabile pentru dezvoltarea, menținerea și evoluția ontologiei.

Furnizorii de informații sunt responsabili pentru pregătirea conținutului în sistem. Principalele surse ale acestor informații acceptă paginile de intranet, documentele în formatul electronic și bazele de date. Legătura dintre intranet, documente în format electronic și baza de date o reprezintă adnotarea.

Documentele și paginile Web trebuie să fie adnotate pentru a reprezenta explicit semantica conținutului lor. Aceste adnotări pot fi acumulate în surse sau în exterior. Urmărim aici metoda de depozitare a tuturor adnotărilor în baza de informații.

Ultimul, dar nu cel din urmă, managementul are mai multe roluri importante în proiectul de administrare a informațiilor: susține legalitatea proiectului și aduce în vizor ceea ce corelează cu o viziune completă asupra companiei. Managementul trebuie să fie convins în întregime de valoarea proiectului.

Pentru analizarea utilizatorilor în timpul studiului de fezabilitate, metoda KADS Common oferă trei modele: organizarea, sarcina și modelul de agent. Procesul de construire a acestor trei modele parcurge următoarele etape:

Grija pentru scopul și problematica studiului de analiză care constă din două părți:

identificarea problematicii / domenii favorabile și soluții posibile și punerea acestora într-o perspectivă vastă de organizare;

deciderea în legătură cu fezabilitatea economică, tehnică și de proiectare pentru a selecta cea mai promițătoare suprafață de focalizare și solutia finală.

Grija pentru studiul de influență și îmbunătățire care de asemenea constă din două părți:

acumularea înțelegerilor între relațiile dintre sarcina de afaceri, personajele implicate și utilizarea de informații pentru a ajunge la performanță și îmbunătățirile obținute aici;

deciderea în legătura cu măsurile de organizare și schimbările de sarcină pentru a garanta aprobarea organizațională și integrarea unei soluții de informare în sistem.

Realizarea sarcinii, organizării și modelului de agent se face urmărindu-se o serie de etape susținute de scheme de lucru și liste de control practice și ușor de folosit. Urmărind studiul de fezabilitate, următorul pas în conformitate cu Common KADS este acela de a identifica sarcinile relevante și un anumit număr de informație. Pentru scopul urmărit etapele acestea conduc la un rezultat modificat.

Analiza sarcinii identifică caracteristicile sarcinii relevante și de aceea multe dintre ele servesc ca bază pentru selectarea instrumentelor. Pentru a mări categoria unor combinații posibile de instrumente, fiecare instrument al candidatului trebuie să fie operabil.

Analiza unui anumit număr de informați concentrează în amănunt îmbunătățirile în anumite domenii de informații. Fiecare număr de informații identificat este un posibil candidat la ontologie și va putea fi evaluat în timpul fazei de început.

Modelul de agent servește deasemenea ca sursă de intrare in faza de început a dezvoltării ontologice prin listarea tuturor agenților relevanți care posedă un anume număr de informații. În special agenții umani sunt experți în domeniu și reprezintă o sursă valoroasă de cunoștințe în timpul fazei de început și modernizare a dezvoltării ontologice. Agenții umani pot fi de asemenea utilizatorii sistemului, adică knowledge workers și de aceea acest lucru poate indica proiectarea unei interfețe corespunzătoare utilizatorului pentru aplicarea imaginii în conformitate cu nevoile acestor agenți.

2.1.2 Faza de început

Dezvoltarea ontologică începe cu faza de început. În mod similar cu dezvoltarea software, începem cu un document specific de cerințe ontologice (ORSD). În general, se descrie ceea ce ontologia poate susține prin schițarea suprafeței planificate de aplicații și listări ontologice, de exemplu sursele de informații valoroase conțin un set de structuri relevante ale domeniului.

ORSD ar trebui să îndrume un inginer în ontologie pentru a decide în legătură cu includerea și excluderea noțiunilor/relațiilor și structura ierarhică a ontologiei. În acest prim stadiu trebuie să privim asupra dezvoltării și refolosirii ontologiei din punct de vedere al potențialului. În amănunt, ORSD conține următoarele informații:

Domeniul și scopul ontologiei. Primul(domeniul) ar trebui să specifice domeniul particular în folosința, care poate ajuta la identificarea ontologiei deja existente. Ontologia tehnică (ontology engineer) poate folosi efectele de analiză a sarcinii pentru a descrie scopul ontologiei. Lista următoare ne oferă câteva exemple:

Ontologia servește ca resursă la structura domeniului xy,

Ontologia servește ca îndrumător pentru distribuția informațiilor între departamentul A și departamentul B,

Ontologia servește ca punct de plecare pentru cercetarea semantică.

Model de îndrumare. Modelul de indrumare ajută utilizatorii care nu sunt familiarizați cu ontologia de proiectare. De exemplu, ei pot conține un anumit număr de noțiuni, și un nivel de granulozitate al modelului planificat. Acest calcul se bazează pe analiza unui anumit număr de informații, un efect mai nou al studiului de fezabilitate. De exemplu, dacă analiza de cerinte specifică faptul că ontologia ar trebui să susțină răsfoirea unui domeniu ce include în jur de 100 concepte iar ontologia tehnică sfârșește cu un număr de 1000 de concepte, fiecare ontologie s-a dezvoltat prea mult și a trebuit să fie modificată pentru a îndeplini cerințele sau specificarea cerinței nu mai poate data și trebuie să fie modificată.

Sursele de informații. Analiza unui număr de informații din studiul de fezabilitate servește ca o sursă importantă de informații. Ontologia tehnică poate primi oameni și documente pentru a completa lista surselor de informație pentru domeniul în folosință. Următoarele arată o listă parțială a surselor de informații cum ar fi:

TM-1(bazat pe KADS Common);

experți în domeniu(interviuri, chestionare de competență);

ontologii refolosite;

dicționare;

documente interne;

liste de indici;

regulamente;

șabloane standard;

prezentare de proiecte;

indici de telefonie;

pagini web/statistica de site-uri;

schițe de organizare ;

planuri de afaceri;

documente externe.

Folosirea ontologiei reutilizate poate îmbunătăți viteza și calitatea dezvoltării în timpul întregului proces. Aceste ontologii pot să ofere, de exemplu, sugestii folositoare pentru decizii în modelare. Dacă ontologiile disponibile îndeplinesc cerințele, una ar putea chiar să folosească ontologia deja existentă-sau să o folosească cu ușoare modificări. Ontologia tehnică ar trebui să folosească toate sursele de informații disponibile bazate pe abilitate și siguranță.

Utilizatorii potențiali sau îndrumător de utilizare. Liste cu posibili utilizatori sau grupuri de utilizatori și descrierea fiecărui îndrumător de utilizare. Aceste îndrumătoare ar trebui să fie descrise de posibili utilizatori care pot raporta din propriile experiențe: În ce situții își doresc ei un astfel de sistem(pentru o cautare mai bună a informației, distribuire de informații etc.)? Cum au lucrat fără acest sistem? Ce erau acele blocuri de oprire? Cum si-ar dori ei să fie susținuți? Îndrumătorul de utilizare schițează punctele de vedere ale fiecărui utilizator în parte. Aceste puncte de vedere oferă o intrare interesantă în structura ontologiei. Descrierea blocurilor de oprire include de asemenea sugestii pentru proiectul sistemului bazat pe ontologie. Achiziția îndrumătorului de utilizare se face prin interviuri structurale și informaționale.

Chestiuni de competență. Îndrumătoarele de utilizare descriu domeniul real care există în sistemul urmărit. Ele furnizează informații despre noțiunile și relațiile dintre ele care a trebuit să fie modelate în ontologia target. Pentru a furniza aceste informații, ontologia tehnică trebuie să transforme îndrumătoarele în chestiuni de competență detaliată. Aceasta reprezintă o vedere asupra posibilelor întrebări legate de sistem indicând scopul și conținutul domeniului ontologic.

Aplicațiile ontologiei. Aici, este schițat un proiect al ontologiei bazat pe aplicații, pe sistemele sale și mediul software. Ontologia tehnică poate folosi de asemenea și analiza de sarcină de la studiul de fezabilitate ca sursă de intrare pentru a descrie sistemul propus și să analizeze rolul ontologiei. Proiectul trebuie să furnizeze de asemenea o imagine clară despre interfața ontologiei cu utilizatorul și să raspundă la următoarea întrebare: ce părți ale ontologiei, numite concepte și relații, sunt vizibile utilizatorului și cum le folosește el? Dacă aplicația rulează de mai multe ori în calculatoare-gazdă diferite, ar vrea să urmărească pista unor locații diferite pentru a activa procesele separate de actualizare în faza de menținere?

În general, există două metode diferite în timpul modelării: sus-jos și jos-sus. Metoda îndrumătorului de utilizare/chestiuni de competență urmărește de obicei și metoda sus-jos în modelarea domeniului. Prima metodă începe prin modelarea noțiunilor la nivel general. Ulterior, se rafinează. Această metodă se face manual și conduce la o ontologie tehnică de calitate superioară.

Ontologiile la nivel înalt pot fi aici refolosite și servesc ca punct de plecare spre dezvoltarea noilor ontologii. În practică, acest lucru pare a fi mai degrabă o metodă de mijloc, adică se identifică cele mai importante noțiuni care vor fi folosite ulterior pentru a obține restul ierarhiei prin generalizare și specializare. Oricum, cu sprijinul analizei automate a documentelor se folosește și metoda jos-sus unde se extrag semi-automat intrările lexicale relevante din documentele corespunzătoare. Există de asemenea și metoda jos-sus pentru fuziunea ontologică. S-a făcut un număr de propuneri pentru a facilita ontologia tehnică de la informațiile de domeniu, limbajul natural al domeniului ONTOEXTRACT din CognIT și oferă sprijin pentru extragerea semi-automată a noțiunilor importante și relațiilor dintre ele.

Ambele metode au avantaje și dezavantaje. Problemele legate de competență conduc spre o descriere mai detaliată a problematicii. Pe de altă parte, acestă acumulare a mai multor puncte de vedere nu poate fi niciodată completată și nu se poate concentra asupra documentelor disponibile. Extragerea semi-automată de texte nu este de obicei capabilă să producă o calitate superioară dar oferă în schimb o listă mai completă de noțiuni. Deci metoda sus-jos este mai eficientă decât metoda jos-sus cu analiza automată a documentelor și ea suportă o reprezentare mai bună a furnizării de informații.

2.1.3 Faza de rafinare

Scopul acestei faze este acela de a produce o ontologie matura orientată spre aplicații în conformitate cu specificația fazei de început. Această faza de rafinare este împărțită în mai multe subfaze: prima subfază este reprezentată de procesul de obținere a informațiilor cu ajutorul experților în domeniu bazați pe intrarea inițială în faza de început. Acolo, proiectul inițial al ontologiei este modificat și/sau extins. A doua subfază: ontologia target este creată prin formarea descrierii semi-formale a ontologiei în limbajul de reprezentare formală cum ar fi OIL și DAML+OIL.

Depinzând de aplicația care trebuie să fie prezentată, prima trebuie să aleagă limbajul de reprezentare corespunzător. Limbajele de reprezentare formală diferă prin puterea expresivă și suportul de instrumente. Ontologia tehnică trebuie să ia în considerare avantajele și limitările limbajelor diferite pentru a o alege pe cea corespunzătoare.

Această etapă este strâns legată de faza de evaluare. Dacă analiza ontologică în faza de evaluare arată o lipsă sau o greșeală, ontologia tehnică preia aceste două rezultate ca intrare în faza de rafinare. Poate fi necesar să se execute mai mulți pasi iterativ.

2.1.4 Faza de evaluare

Pentru a descrie sarcina de evaluare, cităm pe Gomez-Perez(1996): ”pentru a judeca tehnic ontologiile, mediul lor software asociat și documentația în legătură cu un cadru de referință…Cadrul de referință poate fi reprezentat de cerințe, specificații, chestiuni de competență și/sau lumea reală ”.

Ontologia tehnică trebuie să verifice dacă ontologiei target îi este suficientă documentația de cerințe și specificările ontologice și dacă ontologia bazată pe aplicații sprijină sau răspunde chestiunilor de competență, analizate în faza de inceput a proiectului. De aceea ontologia este testată în mediul de aplicații target. Un prototip ar fi trebuit să arate deja funcționalitățile de bază ale sistemului target. Preluarea de la utilizatorii beta ai prototipului poate fi o intrare valoroasă pentru viitoarea modernizare a ontologiei.

O intrare valoroasă în scopul modernizării(și menținerii) o reprezintă modelele de întrebuințare ale ontologiei. Sistemul trebuie să urmărească căile de navigare ale utilizatorilor sau să caute concepte și relații. Părțile utilizate cu frecvență joasă ar trebui să fie monitorizate dacă sunt relevante pentru aplicații. Părțile ontologiei utilizate cu frecvență înaltă ar putea avea nevoie de extindere. Cu toate acestea, ontologia tehnică trebuie să evalueze cu grijă modelele de întrebuințare înainte de modernizarea ontologiei.

2.1.5 Faza de menținere și evoluție

Menținerea și evoluția ontologiei bazate pe aplicații reprezintă în primul rând un proces de organizare. Trebuie să existe reguli stricte în procesele ontologice de actualizare/inserare/ștergere. Se recomandă ca ontologia tehnică să acumuleze schimbările ontologice și să inițieze switch-ul la o nouă versiune a ontologiei după testarea tuturor efectelor în aplicații. Cel mai important este să se clarifice cine este responsabil pentru menținere și cum se desfășoară aceasta. De exemplu, este o singură persoană sau un consorțiu responsabil pentru menținerea procesului? În care interval de timp este menținută ontologia? Există deja propuneri pentru menținerea evoluției procesului ontologic.

2.1.6 Referințe

Metodele care ajută la dezvoltarea procesului ontologic au fost propuse de mai multe grupuri de cercetători. Datorită faptului că ontologia tehnică este o disciplină încă imatură, fiecare grup de cercetători și-a folosit propriile metode.

În ultimii ani, s-au propus metode care ghidează procesul de dezvoltare ontologică. Metoda de programare a lui Ushold a fost prima schiță metodică propusă în 1995 în baza experienței acumulate prin dezvoltarea ontologiei de întreprindere(Ushold și King, 1995). Pe baza proiectului Toronto Virtual Enterprise(TOVE), Ushold și Gruieninger(1996) au descris etapele dezvoltării ontologice. Metoda de formare a ontologiei în domeniul rețelelor electrice a fost prezentată de Bernaras(1996) ca parte a proiectului Esprit KACTUS. În aceeasi perioadă a apărut și s-a extins Metontologia(Gomez-Perez, 1996). În paralel, disciplina filosofică a ontologiei se orientează spre disciplina tehnică. Guarino și Welty(2000) arată cum unele metodologii fondate pe noțiuni analitice și care au fost schițate în filosofie, pot fi folosite ca instrumente formale ale analizei ontologice. În cele ce urmează oferim o vedere de ansamblu a acestor metode.

2.1.7 Metodologia de programare

Această metodologie este bazată pe experiența formării ontologiei de întreprindere care include un set de ontologii pentru modelarea de întreprindere . Sunt propuse următoarele îndrumările pentru dezvoltarea ontologiilor:

Identificarea scopului. Clarificarea scopului și utilizarea intenționată a ontologiei.

Formarea ontologiei care cuprinde trei etape:

Obținerea ontologiei. Identificarea noțiunilor- cheie și a relațiilor în domeniu de interes. Crearea de definiții clare și precise pentru anumite concepte și relații și identificarea termenilor. Utilizarea unei căi de mijloc pentru a parcurge aceste etape și identificarea celor mai importante concepte care vor fi folosite ulterior pentru obținerea ierarhiei prin generalizare și specializare.

Codificarea. Reprezintă informațiile obținute în punctul precedent în limbaj formal

Integrarea ontologiilor existente.

Evaluarea. Se face o judecată asupra ontologiei în legătură cu cadrul de referință.

Documentarea. Documentele referitoare la tipul și scopul ontologiei.

Un dezavantaj al acestei metodologii este acela că nu descrie exact tehnicile pentru desfășurarea unor activități diferite. De exemplu, sunt oferite doar niște îndrumări imprecise, implicând utilizarea tehnicii ”exploziilor de idei”. Nu este recomandat ciclul de viață. Nu sunt îndrumări despre menținerea și dezvoltarea ontologiilor.

Am prins ideea chestiunilor de competență și extinderea utilizării-nu am propus doar utilizarea lor pentru evaluarea sistemului ci și pentru a găsi intrările lexicale relevante cum ar fi:conceptele și relațiile.

KACTUS

Metoda lui Bernaras a fost dezvoltată în proiectul Esprit KACTUS. Unul dintre obiectivele acestui proiect a fost acela de a investiga fezabilitatea informațiilor re-folosite în sistemele tehnice complexe iar rolul ontologiei este acela de a-l suporta. Metodologia recomandă o dezvoltare a ontologiei în aplicații. Deci, de fiecare dată când are loc o aplicație ea este construită. Trebuie parcurse trei etape de fiecare dată când este asamblată ontologia bazată pe aplicații:

Specificarea aplicației. Furnizează un context de aplicații și o vedere a componentelor pe care aplicația încearcă să le modeleze.

Proiectul preliminar. Bazat pe categorii relevante ale ontologiei, creează o primă schiță în care lista de termeni și aplicații de sarcină specifice dezvoltată în timpul fazei precedente se folosește ca intrare pentru obținerea mai multor vederi ale modelului global în concordanță cu categoriile ontologice de nivel înalt determinate. Căutarea de ontologii existente pot fi rafinate și extinse pentru utilizare într-o nouă aplicație.

Rafinarea și stucturarea ontologiei. Structura și rafinarea modelului pentru a ajunge la proiectul definitiv.

Metodologia oferă foarte puține detalii și nu recomandă ca tehnicile particulare să sprijine etapele dezvoltării. De asemenea, documentatia, evaluarea și menținerea proceselor lipsesc. În general, suntem de acord cu ideea generală a dezvoltării ontologice bazate pe aplicații.

Metontologia

Cadrul mentontologiei de la Gomez-Perez(1996) include:

Identificarea procesului de dezvoltare ontologică care se referă la: sistematizare, control, specificare, obținere de informații, conceptualizare, integrare, implementare, evaluare, documentație, configurație.

Identificarea stadiilor prin care trece ontologia.

Etapele care trebuie parcurse pentru desfășurarea fiecărei activități susținând tehnicile și etapele de evaluare.

Setarea ORSD pentru a obține cererile pentru o ontologie similară la specificația software.

Metoda oferă sprijin amănunțit în activitățile orientate pe dezvoltare cu excepția formalizării și menținerii, și descrie activitățile proiectului. Folosind metontologia ca schemă pentru metodele și cerințele noastre, am adoptat ideea unui ORSD dar am modificat și extins versiunea prezentată pentru nevoile noastre. De exemplu, am inclus un îndrumar pentru a sprijini ontologia tehnică și în special pentru a asigura o dezvoltare consistentă a ontologiilor. În afară de îndrumarul tipic de modelare ele includ de asemenea și comenzi care trebuie verificate în timpul fazei de dezvoltare.

Instrumentele formale în analiza ontologică

În Guarino și Welty(2000) este propusă ontologia formală pentru a ajuta la folosirea relației dintre premize într-un mod disciplinat. Această ontologie formală se bazează pe patru noțiuni filosofice fundamentale: (identitate, unitate, rigiditate și dependență ) care impun constrângeri în felul în care premizele sunt folosite ca model în domeniu. Aceste constrângeri clarifică concepțiile înțelese greșit în legătură cu taxonomiile. Autorii prezintă o metodologie in șase etape pentu producerea acestor taxonomii. Aceste etape sunt importante pentru a obține o taxonomie mai clară datorită constrângerilor semantice. În plus, analiza riguroasă forțează ontologia tehnică să efectueze angajamente ontologice, clarificând înțelesurile conceptelor utilizate și deci producerea unei structuri re-utilizabile a taxonomiei. Luăm în seamă acest lucru în faza de rafinare a procesului ontologic bazat pe aplicații.

Am prezentat o metodologie cuprinzătoare care a condus la dezvoltarea ontologiilor pentru aplicațiile în administrarea informațiilor. Cele mai importante cinci etape – studiu de fezabilitate, faza de inceput, faza de rafinare, faza de evaluare și menținere și faza de evaluare – sunt parcurse în scopul formării ontologiei bazată pe aplicații. Pe viitor, va fi susținute mai mult aspectele legate de menținerea și evoluarea ontologiilor.

2.2 Managmentul Ontologiei: depozitarea, aliniamentul și întreținerea

Managmentul Ontologiei este o mulțime a taskurilor de stocare, aliniamentul, întreținere, care urmărește evoluția sa în timp. Aliniamentul este important, pentru că fiecare ontologie poate folosi terminologii diferite. În practică ontologiile nu sunt statice ci evoluează în timp, de aceea avem nevoie de un suport pentru a realiza aceste evoluții. Sistemul de biblioteci trebuie să faciliteze infrastructura funcțională pentru a stoca, a întreține și a adopta un mediu de dezvoltare, trebuie să permită un suport bine standardizat pentru ontologiile de clasă superioară și pentru limbaj de reprezentare a ontologiilor.

Managmentul Ontologic este un set întreg de metode, metodologii și tehnici necesare pentru utilizarea eficientă a mai multor ontologii din mai multe surse, care au fost proiectate pentru taskuri diferite. Aliniamentul este important, pentru că fiecare ontologie poate folosi terminologii diferite. Multe companii folosesc reprezentarea XML pentru documentele interne. Trebuie creată o mapare specifică, pentru a lega diferite terminologii și stiluri de modelare folosite în aceste domenii. Punțile obținute astfel permit folosirea taskurilor inter-ontologice.

Ontologiile nu sunt statice, pentru că necesită adoptarea permanentă la noile schimbări cum ar fi taskurile diferite, noi sau schimbări de conceptualizare.

Sistemul de biblioteci trebuie să faciliteze infrastructura funcțională pentru a stoca, a întreține și a adopta un mediu de dezvoltare, trebuie să permită un suport bine standardizat pentru ontologiile de clasă superioră și pentru limbaj de reprezentare a ontologiilor. Scopul principal al oricărei ontologii este de a permite distribuirea cunoștințelor și reutilizarea lor. Sistemele de biblioteci trebuie să faciliteze taskul de extindere și updatare a ontologiilor. Bibliotecile Ontologice trebuie să suporte standardele existente, cum ar fi: Limbajul Standard de Reprezentare a Ontologiilor și taxonomiile standardizate sau structuri de ontologii. Este un mare avantaj dacă ontologia este legată de vre-o ontologie de nivel superior, cum ar fi Cyc Ontology sau SENSUN, etc.

2.2.1 Cerințele administrării ontologice

Ontologiile trebuie să fie depozitate, uneori aliniate iar evoluția trebuie să fie și ea administrată. Toate acestea sunt cunoscute sub denumirea de administrare ontologică.

Aliniamentul este o sarcină importantă în ontologia re-folosită. Această ontologie re-folosită solicită adesea un efort considerabil: ontologiile trebuie să fie integrate ceea ce înseamnă că sunt unite într-o nouă ontologie sau că ontologiile pot fi păstrate separat. În ambele cazuri, ontologiile trebuie să fie aliniate, ceea ce înseamnă că trebuie să fie aduse la o înțelegere reciprocă. Problemele care subliniază dificultățile în integrare și aliniament sunt nepotrivirile care pot exista între ontologiile separate. Ontologiile se pot deosebi prin limbaj ceea ce înseamnă că expresivitatea limbajului ontologic este deosebită. Ontologiile pot avea de asemenea nepotriviri la nivelul de model, de exemplu, în modelul general sau stilul de modelare.

Aliniamentul ontologiei este foarte relevant în contextul Web-ului. Web-ul Semantic ne va furniza un domeniu accesibil, specific ontologiilor pentru a contura Semantica Web-ului real-care va permite computerelor să combine și să deducă informații-aceste ontologii saparate ar trebui să fie aliniate și unite.

Sprijinul pentru dezvoltarea ontologiilor este cerut în majoritatea situațiilor în care ontologiile sunt utilizate în aplicațiile lumii reale. În aceste cazuri, ontologiile dezvoltate de mai multe persoane și vor continua să se dezvolte în timp, datorită schimbărilor în lumea reală, adaptărilor la diferite sarcini sau aliniamente cu alte ontologii. Pentru a împiedica faptul că astfel de schimbări vor invalida modul de utilizare existent, este nevoie de o metodologie de schimbare a managementului. Acest lucru implică metode avansate de versiuni pentru dezvoltarea și menținerea ontologiilor dar și configurația care are grijă de identificare, relatii și interpretări ale versiunilor ontologice.

Toate aceste aspecte joacă un rol important în integrarea în sistemele ontologice de bibliotecă. În momentul în care numărul ontologiilor diferite este în creștere, capacitatea de depozitare, menținere și re-organizare asigură reutilizarea cu succes a ontologiilor. Sistemul ontologic de bibliotecă ajută la gruparea și reorganizarea ontologiilor pentru re-utilizare, integrare, menținere, cartografie și versiuni. În esență, un sistem de bibliotecă oferă funcții variate pentru administrare, adaptare și standardizarea grupurilor de ontologii. Astfel de sisteme integrate reprezintă o cerință pentru Semantica Web.

În acest capitol, descriem un număr de rezultate cu referire la aspectele menționate mai sus. Începem cu o descriere a capacității de aliniament și arătăm o meta-ontologie care se dezvoltă pentru specificarea cartografiei. Apoi vom trata problemele care sunt cauzate de dezvoltarea ontologiilor și vom descrie două elemente importante ale metodologiei de schimbare a managementului. În final, vom trece în revistă sistemele de bibliotecă existente și vom formula o listă de opțiuni a caracteristicilor unui sistem ontologic de bibliotecă.

2.2.2 Aliniamentul Ontologiilor

Pentru interoperarea ontologică efectivă, ontologiile trebuie să fie aliniate în mod eficient. Aceste aliniamente trebuie să reprezinte explicit distribuția maxim posibilă a relațiilor dintre ontologii și elementele lor active de re-folosire a ontologiilor.

De ce este nevoie de aliniament

Îndrumarul de administrare a informațiilor care joacă un rol important în acest capitol, preia serviciile diferite ce creează unui domeniu specific ontologii prin capturarea unor aspecte specifice informațiilor lor. Trebuie create ontologii speciale de hărți pentru a lega diferitele terminologii și pentru a modela stilurile folosite în aceste ontologii, creând legături între elementele separate ale informațiilor. Aceste legături din ontologie sunt utilizate ulterior pentru a căuta informații pe parcursul ontologiei și pentru a le recupera.

Tehnicile ontologice de cartografie au legătură cu cuplajul ontologic slab. Tehnicile bazate pe deduceri pot fi de asemenea folosite pentru a reprezenta și exploata corespondențele dintre termenii ontologici. Oricum, integrarea practică a informațiilor și capacitatea de aliniament solicită dezvoltarea tehnicilor de cartografie computerizată.

Documentele XML de adnotări aliniate

Companiile tind să folosească XML pentru a reprezenta tot mai multe documente interne. Unele dintre cele mai importante beneficii în utilizarea XML îl reprezintă posibilitatea procesării automate a documentelor XML în acord cu modelele lor conceptuale reprezentate de documentele DTD sau shemele XML. Documentele pot conține adnotări la nivel de informatiei reprezentate în RDF în acord cu o anumită ontologie codificată în schemele RDF. Aceste adnotări se pot folosi pentru a răspunde întrebărilor utilizatorilor și pentru a căuta documente și recuperarea bazată pe rezultatele procesării adnotărilor și ontologiilor. Răspunsurile la întrebări pot fi reprezentate chiar ele ca documente XML pentru a putea fi procesate ulterior automat.

Această capacitate de administrare a informațiilor solicită executarea unei serii de transformări a conceptelor reprezentate în documentele ilustrate în Figura 2.3:

Sursa documentelor XML este transformată în modelul conceptual din RDF care cuprinde toate obiectele (cu o posibilă ierarhie a claselor sale) și relațiile prezentate în documentele XML,DTD și schemele conțin o mare parte de informații cu privire la conceptele prezentate în documente. În esență, cea mai mare parte a relațiilor sunt codificate și pot fi re-folosite în modelele conceptuale din documente. Unele tehnici eficiente care realizează acest lucru au fost deja propuse. Prevăzut cu rezultatele algoritmilor, utilizatorul trebuie doar să alinieze modelele unor ontologii la nivel superior și să execute niște mici modificări.

Sursa modelului conceptual este aliniat la mediatizarea ontologiei furnizate de companii, de exemplu, clasificarea tuturor documentelor în acord cu taxonomia subiectelor posibile. Documentul este depozitat ulterior ca exemplu a mediatizării ontologiei. Serviciul de opțiuni trebuie să prelucreze modelele conceptuale iar mediatizarea ontologiei să extragă conceptele care corespund cerințelor.

Ținta RDF corespunde cu scopul documentului și este aliniat cu mediatizarea ontologiei. Scopul documentului este extras din documentul de mediatizare în acord cu aceste aliniamente.

Scopul documentelor XML de serializare este re-construită de la modelul conceptual la prelucrarea prin serviciul de opțiuni.

O meta-ontologie de cartografie trebuie să fie dezvoltată pentru a reprezenta toate legăturile dintre elementele XML și atribute, și clasele schemei RDF și proprietăți.

Documentele XML tind să se schimbe în timp și astfel nu vor mai poate fi eficiente. Transformarea documentelor XML poate avea loc prin intermediul documentelor XSLTîn formatul solicitat de sursa de cereri. Necesitatea de compilare a hărților limitează puterea excesivă a limbajului cartografic.

Meta-ontologia de cartografie

Am prezentat transformarea RDF care specifică o ontologie mică de hărți XML DTD. Diagrama de bază este prezentată în Figura 4.1 unde clasele sunt reprezentate prin denumiri. Conceptul principal al Thing-ului îl reprezintă legătura dintre cele două seturi de concepte: sursa și scopul. Legăturile sunt grupate în hărți. Fiecare hartă reprezintă o colecție de legături servind unui singur scop. Hărțile se identifică după denumire(URI) și formează module re-utilizabile de legături.

O legătură abstractă descrie caracteristicile comune conexiunii permițând doar legăturile unul la mai mulți și mai mulți la unu. Fiecare legătură are proprietatea de Valoare de Corspondență făcând legătura unei hărți între valorile sursei și entitățile target.

Cartografia în OIL

Meta-ontologia Triplete-RDF(RDFT) servește ca format pentru a crea ontologii de hărți pentru sarcinile de integrare în afaceri. Reprezintă meta-clase care sunt apoi trecute în clasele de utilizatori, făcând legătura cu ontologiile utilizatorilor în domeniu. OIL s-a dezvoltat ca limbaj de reprezentare ontologic și conține sensuri mai puțin flexibile pentru definirea meta-claselor decât schema RDF. Oricum, este încă posibil să se reprezinte semantica RDFT în OIL.

Modelăm legătura RDFT în OIL astfel. Pentru fiecare legătură specificăm două clase ce definesc sursa și ținta conceptelor care urmează să fie trecute pe hărți. De exemplu, legătura unul la mai mulți din legătura clasă la clasă specifică faptul că fiecare exemplu din clasa de surse este echivalent cu un set de exemple, un exemplu pentru fiecare clasă-țintă. Legăturile corespunzătoare sursei și legăturile-țintă se pot defini după cum urmează:

Comenzile în legătură cu aceste punți de legătură trebuie să fie specificate ca și comenzi în axiomele OIL și este important să le reprezentăm direct în OIL. În ciuda acestui lucru, traducerea în OIL este încă foarte folositoare pentru că ne permite să invocăm un motor de căutare care să execute validarea informațiilor.

2.2.3 Susținerea schimbării ontologiei

Ontologiile se schimbă

În practică, ontologiile nu sunt statice ci se dezvoltă în timp. Este nevoie de sprijin pentru această evoluție. Acest lucru este important mai ales că ontologiile vor fi utilizate într-un mediu descentralizat și necontrolat la fel ca Web unde schimbările apar fără coordonare. Mult mai mult decât într-un mediu controlat, acest lucru poate avea rezultate neașteptate și necunoscute.

Există mai multe motive pentru care ontologiile se schimbă. În acord cu Gruber o ontologie reprezintă “specificarea conceptualizării unui domeniu”. Deci, scimbările în ontologii pot fi cauzate de factorii:

schimbări în domeniu;

schimbări în conceptualizare;

schimbări în specificare.

Primul tip de schimbare îl întâlnim adesea. Această problemă este foarte cunoscută din aria schemelor pe bază de date. În Ventrone și Heiler, sapte situații diferite sunt schițate în care schimbările din domeniu (evoluție în domeniu) solicită schimbări într-un model de baze de date. Un exemplu pentru acest tip de schimbare îl reprezintă unirea a două departamente universitare: aceasta este o schimbare în lumea reală ceea ce solicită ontologia care descrie acest domeniu ce trebuie modificat.

Schimbările în conceptualizare se întâmplă frecvent. Este important să ne dăm seama că o conceptualizare este distribuită într-un domeniu – ceea ce reprezintă o solicitare pentru schimbul de informații- și nu este o specificare statică care este produsă încă o dată în istorie, ci trebuie găsită în timp. În capitolul precedent, ontologiile sunt descrise ca rețele dinamice de sensuri și sunt obținute printr-un proces social al schimbului de informații și sensuri. Această lucru oferă calitatea de atribut și de dublu rol ontologiilor în schimbul de informații: ambele reprezintă o condiție esențială în schimbul de informații și un rezultat al acestui proces de schimbare.

O conceptualizare se poate schimba deasemenea datorită modului de utilizare. Sarcini diferite pot implica diferite imagini în domeniu și, în consecință, o conceptualizare diferită. Când o ontologie este adaptată unei noi sarcini sau uni nou domeniu, modificările reprezintă schimbări ale conceptualizării. De exemplu, considerăm o ontologie despre legăturile din trafic în Amsterdam, cu noțiuni ca drumuri, canale, poduri si altele. Când ontologia este adaptată de la perspectiva de bicicletă la perspectiva transportului naval, conceptualizarea unui pod se schimbă de la modalitatea de traversare a unui canal la modul de trecere a timpului.

În sfârșit, o schimbare a specificării este un fel de traducere, adică o schimbare în felul în care o comceptualizare este oficial înregistrată. Deși traducerea ontologică este un rezultat important și semnificativ în multe aplicații practice, este mai puțin interesantă dintr-o perspectivă a schimbării din două motive. În primul rând, scopul unei traduceri este de a reține semantica, adică variantele de specificare ar trebui să fie echivalente și cauzează unele probleme de interoperabilitate sintactică. În al doilea rând, o traducere este adesea creată să utilizeze ontologia în alt context(o altă aplicație sau sistem), ceea ce reduce cu greu importanța chestiunilor de interoperabilitate.

Schimbările în ontologie sunt inevitabile. În continuare, vom privi asupra caracteristicilor în schimbarea ontologiei și vom descrie două elemente ale metodelor de schimbare ontologică.

Schimbările în Ontologie implică mai multe probleme

Există mai multe probleme implicate în schimbarea ontologiei. În acest fragment vom privi asupra incompatibilităților cauzate de acestă schimbare, specificarea lor și implicarea conceptuală a unor astfel de schimbări.

Efectele schimbării ontologice

Un efect important în evoluția ontologiei este acela că ar putea cauza incompatibilități. Incompatibilitatea înseamnă că ontologia originală nu poate fi înlocuită de versiunea schimbată fără a cauza efecte secundare în conformitate cu datele sau aplicațiile pe care aceasta le folosește. Oricum, adevătata problemă este aceea că aceste efecte secundare depind de utilizarea ontologiei:

Când o ontologie este folosită pentru a specifica sensul informațiilor, aceste informații pot obține o interpretare diferită sau poate folosi termeni necunoscuți. Un exemplu de astfel de utilizare îl reprezintă pagina Web în care conținutul este adnotat cu termeni ontologici.

Dacă ontologiile sunt făcute pentru alte ontologii, schimbarea în ontologiile-sursă poate afecta sensul ontologiilor rezultate.

Aplicațiile care folosesc ontologia pot fi deasemenea împiedicate de către aceste schimbări. Informațiile conceptuale care sunt necesare în aplicații ar trebui să fie specificate numai în ontologie; oricum, în practică, aplicațiile folosesc și un model intern. Acest model intern poate deveni incompatibil cu ontologia.

Sensul compatibilității este diferit pentru fiecare dintre aceste tipuri de utilizări. În primul caz, compatibilitatea reprezintă abilitatea de a interpreta toate datele corect prin ontologia schimbată. Acest lucru seamănă mai degrabă cu interpretarea compatibilității în schema de baze de date. Aici compatibilitatea reprezintă o păstrare a informațiilor.

În al doilea caz, efectele schimbării din modelul logic pe care îl formează ontologia sunt adesea importante. Alte ontologii care importă o ontologie pot depinde de concluziile care pot fi schițate de acestea. O schimbare ontologică nu ar trebui să facă concluzii nule și pripite. În acest caz compatibilitatea înseamnă o conservare de consecvență.

Schimbări tipice și Specificarea lor

Specificarea schimbărilor reprezintă o altă problemă. Există multe tipuri posibile de schimbări în ontologie pornind de la simple redenumiri care să compună transformări. Specificarea celei din urmă este importantă pentru că efectul de compunere poate fi diferit de efectul de acumulare care formează o schimbare complexă.

Pentru a face acest lucru mai concret, luăm în considerare schimbările dintr-un conținut standard particular, adică UNSPSC. Conținutul standard specifică o ierarhie standard de produse și servicii care poate fi utilizată de companii pentru a-și clasifica produsele actuale. Această ierarhie poate fi considerată ca simplă ontologie care specifică un consens pe produsele care există. Diferite companii care utilizează același conținut standard pot comunica cu ușurință în legătură cu produsele lor. În afară de UNSPSC, care folosește un domeniu vast de produse și servicii mai sunt și alte clasificări standard cum ar fi RosettaNet.

Aceste standarduri tind să se schimbe foarte des. De exemplu, dacă ne uităm în UNSPSC, vedem următoarele:

au fost 16 actualizări între 31 ianuarie 2001 și 14 septembrie 2001;

fiecare actualizare conținea între 50 și 600 schimbări;

în 7,5 luni mai mult de 20% din standardul actual s-a schimbat!

Deși unele părți ale schemelor UNSPSC ar putea fi mai stabile decât altele, este clar că importanța schimbărilor nu poate fi ignorată. O astfel de rată mare de schimbări poate invalida repede multe din clasificările actuale de produse. De exemplu, produsul ‘Elemente de legătură ’ în versiunea 8.0 este retras din standard și trei noi produse sunt adăugate în versiunea 8.1 (‘Consolidarea structurilor de bază ’, ‘Consolidarea bobinelor și buclelor de întoarcere’, și ‘Consolidarea benzilor’). Acest lucru înseamnă că toate produsele care au fost clasificate ca ‘Elemente de legătură’ sunt clasificate într-o nouă versiune.

O analiză a diferențelor dintre două versiuni ale conținutului standard a realizat următoarea listă de schimbări tipice: schimbări clasă-titlu, adăugări de clase, relocări de clase în ierarhie (prin mutarea lor sus sau jos, sau orizontal), relocări ale unui subarbore în ierarhie, unirea a două clase (în două variante: două clase devin o nouă clasă, sau o clasă este adăuagată altei clase) separări de clase și ștergeri. Oricum, tehnicile actuale de versiuni pentru conținutul standard sunt adesea destul de simple. În UNSPSC, de exemplu, toate schimbările sunt codificate altor adăugări, ștergeri sau editări (schimbări de titlu). Acest lucru înseamnă că relocarea unui subarbore este specificat ca secvență a ‘șterge o listă de clase’ și ‘adaugă o listă de clase’.

Implicații conceptuale ale schimbărilor

O altă problemă cu schimbarea ontologiei o reprezintă diferența posibilă dintre schimbările în specificări și schimbările în conceptualizare. Specificarea actuală de concepte și proprități este reprezentarea specifică a conceptualizării; oricum, aceleași concepte pot fi de asemenea specificate diferit. Deci, o schimbare în specificare nu coincide neapărat cu o schimbare în conceptualizre, și schimbările în specificarea ontologiei nu sunt prin definiție schimbări ontologice.

De exemplu, sunt schimbări în definirea conceptelor care nu pot schimba conceptul și pe de altă parte, un concept se poate schimba fără o schimbare în definiția sa logică. Un exemplu al primului caz atașează un slot ‘tip de combustibil’ clasei ‘Mașină’. Ambele definiții de clasă se referă la același concept ontologic dar în a doua versiune este descrisă mai detaliat. Pe de altă parte, o definiție în limbaj natural a conceptului se poate schimba fără o schimbare logică în definiția conceptului, de exemplu, o nouă definiție pentru ‘Scaun ’ poate exclude întinderea scaunului.

În literatură, aceste tipuri diferite de schimbări se disting în felul următor:

schimbare concepotuală reprezintă o schimbare în interpretarea domeniului care rezultă în diferite concepții ontologice sau diferite relații între aceste concepte;

un schimb de explicații este o schimbare în modul în care conceptualizarea este specificată .

Este imposibil să se determine tipul de schimbare automată pentru că este în esență o decizie a ontologiei tehnice. De aceea este necesar să permitem ontologiei tehnice să specifice intenția schimbării. Dacă se caracterizează o schimbare într-o definiție ca și ‘conceptual’, atunci definițiile sursă și tintă ar trebui să fie diferite (chiar și atunci când specificarea lor este aceeași), altfel, dacă o schimbare este ‘explicațională’, cele două definiții pot fi echivalente.

Metodele de schimbare

Metodele de schimbare care permit parțial transformarea automată a datelor și ontologiile dintre versiunile diferite sunt esențiale. O astfel de metodologie ar trebui sa fie capabilă să se descurce cu tipurile diferite de incompatibilitate, ar trebui să permită o specificare precisă a schimbărilor și ar trebui să ajute ontologia tehnică să specifice urmările conceptuale schimbării. Acum vom discuta două aspecte ale acestei metodologii: instrumentul ontologiilor și mecanisme de schimbare a specificării.

Comparația ontologiilor

Un aspect important al metodelor de schimbare îl reprezintă abilitatea de a compara versiunile ontologiilor și de a scoate în evidență diferențele. Acest lucru ajută în depistarea schimbărilor în ontologii chiar dacă acestea au apărut într-un mod necontrolat, posibil de anumite persoane într-o ordine necunoscută. Am dezvoltat un Server de Versiuni Ontologice,web bazat pe un sistem care conduce schimbările în ontologii. Funcția sa principală este de a prezenta o interfață transparentă versiunilor arbitrare ale ontologiilor . Pentru a obține acest lucru sistemul menține o specificare internă a relației dintre variantele diferite ale ontologiilor . Permite utilizatorilor să facă diferența dintre ontologiile la nivel conceptual și să exporte diferențele ca adaptări sau transformări.

Una dintre caracteristicile centrale ale sistemului este abilitatea de a compara ontologiile la nivel conceptual. Acest lucru este inspirat de UNIX diff, dar implementarea este puțin diferită. Standard diff compară versiunile de fișiere la nivel de linie. Alt tip de sistem compară versiunea ontologiilor la nivel structural arătând care definiții ale conceptelor ontologice sau proprietăți sunt schimbate .

Funcția de comparație face deosebirea dintre tipurile următoare de schimbare:

Schimbarea non-logică în descrierea în limbaj natural. Acestea sunt schimbări în etichetă a conceptului sau proprietății sau în comentariu din cadrul definițiilor.

Schimbarea de definiții logice. Aceasta este o schimbare în definiția conceptului care îi afectează semantica formală. Exemple de aceste schimbări sunt alterațiile de comenzi de subclase sau schimbări într-un domeniu de proprietăți. Adăugări sau ștergeri ale restricțiilor locale într-o clasă sunt deasemenea schimbări logice.

Schimbarea de nume simbolic. Acesta este un caz în care conceptul sau proprietatea are un nou nume simbolic adică o redenumire.

Adăugări de definiții.

Stergeri de definiții.

Funcția de comparație permite deasemenea utilizatorului să caracterizeze implicarea conceptuală a schimbărilor. Pentru primul tip de schimbări utilizatorul are opțiunea de a eticheta ‘identic’ sau ‘schimbare conceptuală’. În ultimul caz utilizatorul poate specifica relația conceptuală dintre cele două versiuni ale conceptului.

Altă funcție o reprezintă posibilitatea de a analiza efectele schimbărilor. Schimbările în ontologie nu afectează doar informațiile și aplicațiile pe care le folosesc dar au și consecințe neașteptate și neprevăzute. Sistemul furnizează sprijin pentru analiza acestor efecte. Primul poate activa locurile în ontologie în care conceptele schimbate conceptual sau proprietățile sunt utilizate.

Specificarea schimbării

O schimbare în ontologie constituie o nouă versiune pentru aceasta. Această nouă versiune definește o relație de actualizare ortogonală între definițiile din versiunea originală a ontologiei și acestea în noua versiune. Relația de actualizare între cele două versiuni ale conceptului, de exemplu, între clasa A1.0 și clasa A2.0 , este diferită de clasa A și clasa B. În ultimul caz relația este pur conceptuală; oricum, relația de actualizare are deasemenea meta-informații despre schimbarea conceptului asociat cu acesta.

Distingem următoarele proprietăți care sunt asociate cu relația de actualizare:

transformarea sau schimbarea actuală: specificarea a ceea ce s-a schimbat actual în definiția ontologică, specificată de un set de operații de schimbare, de exemplu, schimbarea unei restricții pe proprietate, adăugare de clasă, îndepărtarea unei proprietăți, etc.;

relația conceptuală: relația logică între construirea celor două versiuni ontologice, de exemplu, specificată de relațiile de echivalență, relațiile de premize, reguli logice sau aproximări. Relația conceptuală dintre cele două versiuni ale conceptului specifică intenția ontologiei tehnice care a caracterizat schimbarea;

meta-informații descriptive cum ar fi data, autorul și motivul actualizării ;

contextul valid : o descriere a contextului în care actualizarea este validă. Alte descrieri extinse ale contextului, în variate stadii de formalitate, sunt deasemenea posibile.

Urmărind în continuare aceste patru aspecte ale relației de schimbare observăm că sunt mai multe funcții. Este posibil să efectueze transformări cu pierderi mai puține ale ontologiei prin exploatarea setului de operații de schimbare. Relația conceptuală oferă abilitatea de a re-interpreta informațiile și alte ontologii care folosesc ontologia schimbată prin noua ontologie.

2.2.4 Organizarea ontologiilor

Cum numărul de ontologii diferite este în creștere sarcina de depozitare, menținere și re-organizare care le asigură re-folosirea cu succes a ontologiilor este provocată. Sistemele de ontologie de bibliotecă reprezintă un instrument important în gruparea și re-organizarea ontologiilor , integrare, menținere și cartografie. În esență este un sistem de bibliotecă care oferă variate funcții de administrare , adaptare și stndardizarea grupurilor de ontologii.

Cerințele Sesame

Sesame permite o depozitare persistentă a informațiilor RDF și RDFS și ulterior cererea de informații disponibile RQL . Sesame a selectat o baze de date relațională ca un mecanism de depozitare, dar este independent-DBMS. RAL este o interfață care oferă metodele RDF clienților săi și traduce aceste metode de la denumiri la DBMS.

Sesame furnizează o funcționalitate de bază de a înmagazina ontologiile și furnizează serviciul de opțiuni de asemenea. Oricum, pentru o utilizare la scară mare și o ontologie re-folosită sunt nevoite funcții mai avansate. Un sistem de bibliotecă a ontologiei lumii reale trebuie să sprijine următoarele:

depozitarea , identificarea și versiunea ontologiilor ;

accesul la ontologiile existente și sprijinul avansat în adaptarea ontologiilor la un anumit domeniu;

înlocuirea puterii de standardizare și limbajele de reprezentare standard.

Funcționalitatea unui Sistem de Depozitare a Ontologiei

Un sistem de ontologie de bibliotecă ar trebui să caracterizeze o infrastructură funcțională pentru depozitarea și menținerea ontologiilor. Aspectele de mai sus pot fi specificate după cum urmează.

Management

Căutarea. Majoritatea acestor sisteme ontologice de bibliotecă pot fi accesate prin World Wide Web sau Internet.Acestea oferă doar o răsfoire. Ontolingua este singurul care oferă câteva caracteristici de căutare funcțională, cum ar fi căutarea cu un cuvânt-cheie.

Editarea. Majoritatea sistemelor ontologice de bibliotecă furnizează simple funcții de editare. WebOnto și Ontolingua sprijină editarea ontologică de colaborare(asincronă și sincronă).

Motivarea.Funcțiile foarte simple de motivare sunt furnizate de WebOnto(motivare bazată pe reguli), Ontolingua(ontologia de teste) și SHOE(revizuire ontologică).

Sesame. Sprijină cerințele RDFS și informațiile RDF activate de RQL. Are funcții simple de editare dar nu și editarea de colaborare.

Standardizarea

Limbajul. Sistemele ontologice de bibliotecă folosesc limbaje diferite pentru a depozita ontologiile. În acest caz, funcția importantă pentru sistemul ontologic de bibliotecă ar trebui să sprijine traducerea inter-lingvistică(ca și Ontolingua) sau unele limbaje standard ar trebui să fie acceptate sau propuse în comunitatea ontologică (cum ar fi DAML+OIL).

Ontologia la nivel înalt.Ontolingua deține o versiune publică a Cyc numită HPKB-la Nivel Înalt cu câteva modificări de la Pangloss, WordNet și Penma. WebOnto și SHOE nu au ontologia la nivel înalt standard. IEEE SUO încearcă să instaleze o ontologie la nivel înalt standard și publică.

Sesame.Sprijină RDF, RDFS și DAML+OIL. Nu deține nici o ontologie la nivel înalt.

Cerințe pentru un Sistem de Depozitare

În acest fragment,facem un sumar a cerințelor importante pentru structurarea sistemului ontologic de bibliotecă pentru mări managementul ontologic, adaptarea și standardizarea. Pentru a face acest lucru, formulăm o listă de opțiuni pentru un sistem ontologic de bibliotecă ideal.

Management

Depozitarea.O arhitectură bazată pe client/server este critică pentru capacitatea sistemului ontologic de bibliotecă în a sprijini editarea ontologică.

Este necesar să clasificăm o ontologie într-un sistem ontologic de bibliotecă pentru a facilita căutarea, administrarea și re-folosirea ontologiei. Unele dintr mecanismele de clasificare ontologică valabile sunt bazate pe caracteristicile distinse a ontologiilor. Exemplele includ următoarele:

subiectul ontologiilor: sistemul DAML clasifică ontologiile în acord cu Open Directory Category.

structura ontologiei: sistemul Ontolingua e o componentă care arată relațiile între diferite ontologii.

caracteristicile inter și intra ontologice.

structura lattice:Noy și Hafner(1997)au construit o lattice ontologică arătând relevanța ontologiilor.

dimensiunile ontologiei: Heijst (1997) au indexat ontologii folosit dimensiuni pentru a despărți biblioteca într-o bibliotecă de bază și una periferică.

ontologia la nivel înalt stratificat: ONIONS au folosit un domeniu universal, intermediar pentru indexa ontologiile

relațiile ontologiei: Visser și Bench-Capon (1998) au indexat ontologia bazată pe relații definite cum ar fi relația subset/superset, relația de extindere, restricție și relația în cartografie.

componentele ontologiei: Visser și Bench-Capon (1998) au menționat de asemenea indexarea ontologiei bazată pe componentele ontologiei, cum ar fi domeniul de partiție, abstracția( ontologii abstracte și detaliate).

Sprijinul pentru organizația modulară în sistemul ontologic de bibliotecă permite ontologiilor complexe să fie compuse de la cele mai simple. Acest lucru solicită o coeziune maximă cu module și o interacțiune minimă între module. Majoritatea sistemelor ontologice de bibliotecă care vor să faciliteze ontologia re-folosită, ontologia de cartografie și integrare au adoptat această structură. ONIONS activează de aemenea un design stratificat al unui sistem ontologic de bibliotecă. Partiționarea separată a claselor pot ușura modularitatea, asamblarea, integrarea și consistența de verificare ontologică. Dacă, de exemplu, o anumitș clasș cum ar fi oameni a fost separată de o altă clasă, de exemplu, țări atunci consistența poate fi executată mai repede.

Identificarea. Ontologia unică URL, numele simbolic și numele sunt folosite ca nume simbolice pentru ontologii în sistemul ontologic de bibliotecă.

Versiunea. Un mecanism de control al versiunii este foarte important pentru un sistem ontologic. Din păcate, multe sisteme existente nu-l pot sprijini cu excepția SHOE.

Adatarea

Căutarea și editarea. Un sistem ontologic poate caracteriza un mediu de răsfoire vizualizată. Ar trebui să sprijine editarea de colaborare și să ofere caracteristici de căutare avansate adoptând tehnici de recuperare a informațiilor existente.

Motivare. O simplă funcție de motivare ar trebui să fie inclusă pentru afacilita crearea ontologiei, cartografia ontologică și integrare.

Standardizarea

Limbajul. În mod sintactic, un limbaj de reprezentare ontologică ar trebui să fie standardizat sau un limbaj de traducere inter sau intra ontologic poate fi sprijinit. Din punct de vedere semantic, un sistem ontologic de bibliotecă trebuie să caracterizeze un vocabular comun. De preferat, un sistem ontologic de bibliotecă ar trebui să sprijine de asemenea compatibilitatea între vocabulare multiple din domenii diferite. Structura acestor vocabulare comune sau multiple trebuie să fie mascate sau modulate pentru a facilita re-folosirea,cartografia și integrarea ontologiilor (McGuinness,2000). Aceste vocabulare pot ajuta în sinonimie.

Ontologia la nivel înalt. O ontologie la nivel înalt standard este importantă pentru o organizare mai bună a sistemelor ontologice de bibliotecă.

Alte cerințe

Facilitatea de menținere. Sistemele ontologice de bibliotecă ar trebui să furnizeze de asemenea niște caracteristice de menținere, cum ar fi consistența, sprijinul pentru schimbșri și adaptarea ontologiilor în diferite aplicații.

Documentele explicite. Fiecare ontologie într-un sistem ontologic de bibliotecă ar trebui să fie documentat în mod extensiv. Documentarea trebuie să includă informații despre cum a fost ontologia construită, cum să se facă extensii și ce reprezintă politica de denumiri a ontologiei, care sunt principiile și funcțiile de organizare.

În acest subcapitol, am privit asupra unor aspecte variate ale ontologiei. Managementul ontologic reprezintă un întreg set de metode, metodologii și tehnici necesare pentru utilizarea eficientă a mai multor variante de ontologii.

Aliniamentul este un aspect important pentru că sunt mai multe ontologii în domeniu folosite pentru o anumită sarcină. Fiecare din aceste ontologii de domeniu pot cuprinde aspecte specifice ale informațiilor și pot folosi diferite terminologii. Ontologiile de hărți trebuie create pentru a lega diferite terminologii și a modela stiluri folosite în aceste ontologii specifice de domeniu. Am descris o meta-ontologie care poate fi folosită pentru a crea asemenea legături între piese separate de informații. Aceste lagături pot fi utilizate ulterior.

Am discutat de asemenea despre faptul că ontologiile nu sunt statice ci evoluează în timp. Schimbările în domeniu, adaptările la diferite sarcini sau schimbările în conceptualizare solicită modificări în ontologie. Evoluția ontologiilor cauzează probleme în interoperabilitate care pot împiedica re-utilizarea efectivă. Tehnicile de comparație ontologică pot ajuta ontologia tehnică să găsească schimbări între ontologii și să le caracterizeze conceptual. Când relația conceptuală dintre versiuni, transformările dintre ele, ca și meta-informațiile schimbării este menținută, este posibil să sprijine ambele transformări cu pierderi mai puține dintre versiuni și re-interpretarea informațiilor și datelor în diferite versiuni.

Sistemele ontologice de bibliotecă sunt sisteme care sprijină sarcinile managementului ontologic sub mai multe aspecte. Am discutat funcțiile sistemului ontologic de bibliotecă, am trecut în revistă sistemele existente și în sfârșit am venit cu o listă de opțiuni pentru sistemul ontologic de bibliotecă ideal.

2.3 Exemple de Ontologii Existente

2.3.1 WordNet

Acum propun să trecem la prezentarea celor mai mari Ontologii la ora actuală. Începem cu un sistem on-line de referință WordNet, disign-ul căruia a fost inspirat din teoriile curente psiho-lingvistice a memoriei lexicale umane. Substantivele, verbele, adjectivele și adverbele din limba engleză sunt organizate în seturi de sinonime, fiecare reprezentând un concept lexical subliniat. Relațiile diferite leagă seturi de sinonime. El a fost dezvoltat de Cognitive Science Labaratory din Universitatea din Princeton. WordNet-ul conține aproximativ 100,000 de sensuri ale cuvintelor organizate într-o taxonomie. WordNet grupează cuvintele în cinci categorii: substantive, verbe, adjective, adverbe, și cuvinte funcționale. În cadrul fiecărei categorii cuvintele sunt organizate după sensul și după relațiile semantice între ele. Exemple de aceste relații sunt următoarele:

Sinonime: similitudinea în sensurile cuvintelor, care este folosită pentru a construi conceptele reprezentate de seturi de cuvinte;

Antonime: cuvintele cu sensuri contrare, de obicei se folosesc pentru organizarea adjectivelor și adverbelor;

Hiponime: sunt relații între concepte. Ierarhia aceasta asigură moștenirea proprietăților între super-concepte și concepte;

Meronime: o parte a relației între concepte;

Morfologii: relații care se folosesc pentru reducerea formelor cuvintelor.

Succesul WordNet-ului se bazează pe faptul că acesta este valabil on-line, este gratuit, și reprezintă un dicționar bazat pe concepte. El oferă mult mai mult, decât o listă alfabetică a cuvintelor.

O versiune “multilanguage” a WordNet-ului se numește EuroWordNet. La momentul actual pe structura WordNetu-lui se construiesc Ontologii asemănătoare și în alte limbaje, ca și în limba română. Specificul WordNet-ului este volumul mare de cuvinte, independența de domeniu, și nivelul scăzut de formalizare. Ultima afirmație înseamnă că WordNet-ul nu asigură nici o definiție semantică în limbajul formal. Semantica conceptelor este definită de termenii limbajului natural. Aceasta limitează posibilitatea pentru suportul automat. WordNet-ul este motivat lingvistic. Așadar WordNet-ul poate fi văzut ca una dintre extremitățile spectrului unde ontologia Cyc definește o altă extremitate.

2.3.2 Cyc

Cyc a apărut în cursul cercetării Inteligenței Artificiale, asigurând accesarea și procesarea cunoștințelor de către aplicațiile soft. O problemă majoră întâlnită în multe (dacă nu toate) aplicații software, era problema cunoștințelor cu sens unic, adică cunoștințelor înțelese de mai mulți agenți soft. Să luăm spre exemplu învățarea mașinilor. Pe de o parte pentru un proces de învățare avem nevoie de intelegență, pe de altă parte intelegența necesită un proces de învățare semnificativ. Oamenii decid singuri ce trebuie învățat și ce nu, din observațiile proprii. Cyc s-a pornit ca o metodă pentru formalizarea cunoștințelor despre lume și asigură o semantică formală și executabilă. Sute de mii de concepte au fost formalizate de atunci cu milioane de axiome, reguli, și alte aserțiuni care specifică constrângeri pentru obiecte individuale și clase. Unele dintre ele sunt accesibile public pe pagina Web. Așadar, ontologia de nivelul cel mai înalt Cyc, cu 3000 concepte a devenit accesibilă publicului. Aceste concepte sunt cele mai generale, care se situiază pe nivelul înalt al taxonomiei conceptelor. Marea majoritate a conceptelor celor mai importante sunt secretizate, ca proprietate a Cycorp-ului, compania care realizează pe piață Cyc-ul.

Cyc-ul grupează conceptele în microteorii pentru a structura ontologia generală. Microteoriile sunt instrumente pentru a explica dependențele cunoștințelor. Cu ajutorul lor se structurează cunoștințele care, în caz contrar vor fi inaccesibile și inconsistente. Fiecare microteorie este o teorie logică care introduce termeni și definește semanticul lor cu ajutorul axiomelor logice. CycL, este o variantă de logică a predicatelor, care este un limbaj pentru descrierea teoriilor.

Ca și WordNet-ul, Cyc-ul este destul de mare și independent de domeniu. În contrast cu WordNet-ul el asigură definițiile formale și operaționale.

2.3.3 TOVE și KA

Dintre Ontologiile mari mai trebuie menționat și TOVE-ul . Scopul Toronto Virtula Enterprise-ului (TOVE) este crearea unui model generic cu datele reutilizabile care să aibă următoarele caracteristici:

asigură terminologia distribuită pentru întreprindere, care poate fi înțeleasă și folosită de orice agent;

definește sensul pentru fiecare termen atât de precis și lipsit de ambiguități încât este posibil;

implementează semantica într-un set de axiome care permite TOVE-ului să deducă automat un răspuns pentru multe întrebări cu “sens comun”.

definește o simbologie pentru descrierea termenului sau a conceptului construit într-un context grafic.

Knowleadge Annotation Initiative of Knowleadge Acquisition Community (KA) include trei subtaskuri majore:

ingineria Ontologiei, pentru a construi o ontologie a sensului subiectului;

caracrerizează cunoștințele în termenii ontologiilor;

asigură accesul inteligent la cunoștințe.

Capitolul III. Instrumente Ontologice

Ontologia face parte din arhitectura managmentului de cunoștinte, și se realizează cu ajutorul suitei de instrumente noi pentru procesarea semantică a informației. Mediul instrumentelor folosite conține 3 aspecte cheie, cum ar fi:

Intreținerea ontologiei, și conectarea ei la un volum mare de date,

Păstrarea și întreținerea ontologiei și instanțelor ei,

Vizualizarea și accesarea surselor mari de informație.

În mediul cercetătorilor apare foarte des o discuție contradictorie, referitoare la importanța tehnologiei. Unii susțin că tehnologia este mai puțin semnificativă în comparație cu cultura organizațională. Într-adevăr legatura între aceste două noțiuni este destul de slabă.

Achiziția automată de cunoștințe se realizează, din volume mari de informații structurate sau semistructurate, de la depozite externe de date. Odată ce cunoștințile au fost achiziționate dintr-o sursă umană, sau extrase în mod automat, ele trebuie să fie reprezentate în limbaj ontologic. Această funcție este îndeplinită de către depozitul ontologic.

Pentru dezvoltarea, întreținerea, și utilizarea bazei de cunoștințe este necesar un așa numit strat de middleware. Un rol important în folosirea ontologiei îl joacă și un set de instrumente necesare, care permit utilizatorului afișarea și interpretarea necesară a acesteia. Aceste instrumente includ facilități pentru căutarea, partajarea, însumarea, vizualizarea, navigarea și organizarea cunoștințelor, și sunt prezentate în figura 3.1.

3.1 Sesame: arhitectura generală pentru stocarea și interogarea RDF-ului și a schemei RDF-ului

Documentele RDF-ului și RDFS-ului pot conține trei niveluri diferite de abstractizare, și anume: nivelul sintactic, nivelul de structură și nivelul semantic. Folosind arhitectura Sesame-ului este posibilă adăugarea altor module și folosirea depozitelor de stuctura diferită. Sesame-ul reprezintă un depozit de bază pentru un set mare de instrumente ale Managmentului de Cunoștințe.

Sesame-ul (figura 3.1) permite o stocare persistentă a datelor RDF-ului și un set de metode de acces prin module de export și cele de interogare. Mai mult de atât această arhitectură permite și un suport concurent.

O caracteristică importantă a Sesame-ului este abstactizarea ei de la detaliile posible a repositelor diferite. Sesame-ul în sine este o aplicație de tip Server, de aceea poate fi folosită ca un serviciu la distanță în Webul Semantic.

3.2 Generarea Ontologiilor pentru Web-ul Semantic

Probabil una dintre cele mai grave probleme actuale ale Web-ului este dificultatea cautării si comparării informației. Setul de instrumente CORPORUM este special dezvoltat pentru acest scop. El conține un set de aplicații care pot realiza o varietate de operații separate, sau legate între ele. În continuare vom discuta metode de transformare a Web-ului actual într-un Web Semantic.

În general există cele trei scopuri importante ale folosirii sistemului CORPORUM:

Extragerea informației din text pentru construirea bazei de cunoștințe;

Refolosirea informației din alte surse;

Strategii de compresie, vizualizare și acceptare a informației de catre oameni.

OntoBuilder constă din două module: OntoExtract și Onto Wrapper. Cu ajutorul acestor două module Ontobuilderul va fi capabil să extragă toate tipurile de informații: de la cele structurate, cu ajutorul lui OntoWrapper până la cele nestructurate, cu ajutorul lui OntoExtract.

La extragerea informației de pe Internet putem întâlni următoarele dificultăți:

Manipularea documentului. Nu toate formatele documentelor sunt la fel de ușor de parcurs, pentru o extragere calitativă.

Normalizarea. Trebuie să țină cont de diferite modalități de prezentare cum ar fi: caractere speciale, secțiuni de paragrafe, adnotații, enumerări…

Ideile multiple. Este destul de greu de apreciat câte idei poate să aibă un document, și dacă este un document întreg, sau unul care conține mai multe piese de informații.

Clasificarea documentului. Este strâns legată de problema precedentă, și se referă la gasirea clasei din care face parte documentul studiat. În funcția acestuia pot fi aplicate diferite reguli specifice, euristice.

Stilurile de exprimare. Se referă la faptul că documentul nu întotdeauna este corect gramatical, pentru că o mare parte a utilizatorilor Internetului nu vorbesc în limba natală.

Formatarea documentului la fel crează o problemă, a tratării corecte. În primul rând informația poate fi inclusă nu numai în text, ci și în elementele secundare cum ar fi titluri sau imagini, în al doilea rând avem nevoie și de o modalitate corectă de tratăre a stilurilor de formatare, precum diferite culori ale fonturilor, sau mărimea lor, ce în mai multe cazuri are anumite subînțelesuri.

Pentru extragerea informației dintr-un limbaj natural, se folosesc mai multe aplicații cu scopuri diferite, cum ar fi:

Abstractizarea și concluzionarea: are ca scop redarea pe scurt a conținutului unui document de volum mare.

Vizualizarea textului: documentele pot fi des vizualizate în funcție de conceptele și relațiile care joacă un oarecare rol.

Comparația și căutarea: caută instanțe a pieselor semantice de cunoștințe care au ceva în comun.

Raspunderea la întrebări: la sistemele interactive de tip om-calculator; spre exemplu la Sistemul Expert.

Inducția/Deducția bazei de cunoștințe a informației extrase. Aici joacă un rol important multe cercetări din domeniul Învățării Mașinelor.

Generarea bazei de Cunostințe: informația extrasă, dedusă/indusă poate fi folosită și în alte scenarii.

Setul de instrumente de la CORPORUM extrage și generează structura semantică din documente. Acestea sunt pe urmă exportate și reprezentate sub forma graficelor, imaginilor și ontologiilor. Sistemul extrage din fiecare document meta-datele care pot fi depozitate în depozitul Sesamului. În figura 3.2 este prezentat un ciclu de extragere a OntoBuilderului.

3.3 Ingineria coloborată a Ontologiei

Mediul ingineric de dezvoltare a Ontologiilor OntoEdit, este unul unic de genul său, pentru că el combină dezvoltarea ontologiei, bazată pe metodologia cu capacitate de coloborare și o integrare puternică cu conținutul. Metodologia care stă la baza OntoEditului este focalizată pe trei etape descrise mai devreme, și anume: Faza de început, Faza de rafinare, Faza de dezvoltare.

Ca și în Ingineria Softwareului dezvoltarea se începe cu colectarea cerințelor pentru ontologia dată. De obicei această sarcină este efectuată de către echipa de experți în domeniu împreună cu experții de modelare. Scopul acestei faze este de a defini cerințile ontologiei, și de a produce prima schița- “descripțiune ontologică semi-formală”.

Scopul fazei de rafinare este de a îmbunătăți ontologia semi-formală în concordanță cu cerințele noi evaluate. Foarte des în aceasta fază echipe diferite lucrează simultan. În versiunea curentă a OntoEditului membrii echipei inginerice pot lucra fiind distribuiți geografic, și pot modifica Ontologia simultan. În figura 3.3 este arătată arhitectura client-server, în care clienții sunt conectați la serverul ontologic și pot modifica sau extinde Ontologia existentă.

Scopul fazei de evaluare este de a verifica dacă ontologia obținută satisface cerințile stabilite în prima etapă.

3.4 QuizRDF: Tehnologia de căutare pentru Webul Semantic

Motorul de cautare QuiyRDF combină cautarea textuală cu capacitățile avansate de a exploata datele meta la cautare și navigare.

Tehnicile de indexare și de recuperare a QuiyRDF-ului sunt proiectate pentru a lucra cu cunoștințele în domeniu care sunt disponibile într-un formular a specificațiilor ontologice sub forma schemei RDF-ului. Entitățile informaționale prelucrate de către QuiyRDF-ul sunt în general resursele RDF-ului, care pot fi prezentate sub forma unor pagini Web, sau sub forma părților acestora. Figura 3.4 prezintă o viziune mai generală a întregii structuri de indexare a QuiyRDF-ului.

Din discuțiile cu potențiali utilizatori și din literatura de specificare este indicată opurtunitatea combinării navigării Rdf-ului cu interogări efectuate la căutarea textuală. Posibilitatea de căutare textuală înseamnă că utilizatorul poate alege cele mai simple interogări inițiale care ajută la localizarea generală într-un spațiu informațional, după ce din acest punct de pornire obținut vor funcționa metode de navigare și cautare. Mai mult, cautarea textuală înseamnă, că utilizatorul poate accesa informația, chiar și la etapă inițială, atunci când adnotațiile încă sunt puține, în timp ce suportul pentru RDF și QuiyRDF permite navigarea structurată pe Ontologie. Adnotațiile Rdf-ului sunt adăugate la sistem pentru ca utilizatorul să beneficieze de, mare precizie a exprisivității interogărilor RDF.

3.5 Reprezentarea Informației

Multe soluții ale Web-ului Semantic îmbunătățesc capacitatea mașinelor de a interschimba înțelesul informației . Toate aceste soluții sporesc semnificativ calitatea rezulatetelor obținute de către aplicații implicate, în timp ce interfața lor cu utilizatori aduce comparativ puține (sau deloc) îmbunătățări.

Ideea Reprezentărilor (The Spectacle Semantic Web ) crește capacitatea mașinilor de a reprezenta înțelesul informației utilizatoruzlui uman. Reprezentarea este o platformă de vizualizare a conținutului care permite personalizarea informației finale, orientate spre utilizatori.

Pentru transformarea informației din sursele existente într-o formă ontologică, reprezentările oferă o arhitectură de dezvoltare a aplicației care constă din următoarele componente (figura 3.5).

Reprezentarile Onto API Suportă maparea ontologică, Reprezentările Core API oferă o interfață pentru Server de Reprezentare. Acest API este folosit în interior de către OntoAPI. Reprezentările de vizualizare API oferă înțelesurile pentru generarea și interacțiunea cu vizualizarea.

Un element important de vizualizare este Mapa de Grupuri (The Spectacle Cluster Map) care permite selectarea unui grup de elemente din întreaga taxonomie (exemplu din desenul 3.6 este luat din OntoBuilder). Mapa de grupuri permite cautarea după cel puțin trei modalități: analiza, interogarea și navigarea.

3.6 OntoShare: Evoluează Ontologii în sistemul de partajare a cunoștințelor

Când vorbim despre partajarea cunoștințelor în primul rând trebuie să menționăm comunități virtuale de organizare. Comunități de organizare sunt grupuri în cadrul organizației care partajează un set comun a cerințelor informaționale sau problemelor. De obicei acestea nu sunt organizații formale, ci niște rețele neformale, fiecare dintre care partajează parțial agenda comună și are interese comune cu celelalte. Instrumentele managmentului de cunoștințe poate aranja averile de cunoștințe sub forma unor clase conceptuale predefinite a ontologiilor, permițând un acces la cunoștințe mai natural și mai intuitiv. Instrumentele managmentului de cunoștințe trebuie să ajute utilizatorul și să-i dea o posibilitate de a organiza informațiile sub forma unei averi ușor controlabile.

Sistemul OntoShare facilitează și ușurează partajarea informației între comunități de organizare și dă posibilitate oamenilor în cadrul unei comunități să cunoască pe ceilalti cu interese asemănătoare.

Când informația devine partajabilă de către OntoShare, aceasta poate efectua urmatoarele patru taskuri principale:

Pe parte de server OntoShare al utilizatorului se creează o copie de gen rezumat a informației. Rezumatul este creat cu ajutorul instrumentului de text ViewSum, după ce din text sunt extrase propozițiile cheie. Acesta se bazează pe frecvența întâlnirii cuvintelor și frazelor, folosind tehnica analizei conexiunii lexice. Accesul la acest rezumat permite utilizatorului accesarea rapidă a conținutului paginei din sursele locale, înainte de a decide dacă e nevoie de încărcare a părților mai mari a acestora.

Conținutul paginei este analizat și personalizat în funcție de profilul utilizatorului.

OntoShare are și abilitatea de a învăța din compartamentul utilizatorului, urmărind interesele și acțiunile acestuia.

Pentru fiecare document partajat, se crează o instanță a clasei Document, cu propriitățile acestora precum: metadatele, titlul, rezumatul documentului, adnotațiile utilizatorului…

În literatura organizațională de obicei toate cunoștințele se împart în două mari grupe: explicite și tacite. OntoShare este mai mult focalizat pe cele explicite, care sunt transferate prin partajarea informației.Transferul Tacit nu este direct implimentat, cu toate ca utilizatorii au posibilitatea de a contacta pe ceilalți cu interese comune, cum este arătat în figura 3.7.

Comunitățile pot partaja informația în mod automat și astfel pot crea resursele informaționale în format RDF. Mai mult utilizatorii au profilurii proprii, unde sunt declarate interesele lor proprii, care sunt implicate automat, căutând informația cât mai apropiată de cerințele și interesele acestora.

3.7 Midleware Ontologic

Midleware Ontologic este o infrastructură software de administrare care ușurează integrarea cu celelalte aplicații din lumea reală a modulelor din setul de instrumente ale managementului de cunoștințe. Scopul primar al acestei infrastructuri este de a face metodologia și modulele folosite accesibile pentru societate, ca o platformă independentă pentru realizarea așa numitor taskuri cum ar fi: dezvoltarea, administrarea, întreținerea și utilizarea bazelor de cunoștințe mari și medii.

Sistemul ontologic de midleware este o platformă flexibilă și extensibilă a managementului de cunoștințe. Ea trebuie să realizeze o infrastuctură cu următoarele caracteristici:

Trebuie să aibă un Depozit, care să permită serviciile de stocare extensibilă și partajare.

Suport pentru module extensibile de explicare, care sunt acceptate de către mai multe domenii și aplicații. Aceasta asigură, ca în cadrul unei singure întreprinderi sau unui mediu computerizat unul și același sistem să poată fi folosit pentru scopuri diferite, astfel se obține ușor integrarea, interperobilitatea între aplicații, accesarea cunoștințelor și refolosirea lor…

Controlul cunoștințelor. Aici sunt luate în considerare urmatoarele caracteristici:

controlul asupra versiunilor bazelor de cunoștințe. (schimbările urmate)

sistemul de control al accesului. (securitatea)

meta-informații pentru baza de cunoștințe

Relațiile acestor caracreristici sunt prezentate în figura 3.8.

3.8 Experimentarea domeniului cu unelte semantice de rețea într-o organizare virtuală

Cum noi testăm instrumenetele semantice de rețea? Cum putem ști dacă ele se execută mai bine decât tehnologiile curente pentru managementul cunoașterii? Ce îseamnă mai sigur conceptul “mai bine”? Cum putem noi operaționaliza și măsura aceasta? Unele din aceste întrebări pot fi parțial răspunse simultan de experimentele în laboratoare care de exemplu urmăresc viteza sau mărimea scalară a algoritmilor. Cu toatea acestea nu este văzut clar în avans la ce întindere aceste rezultate de laborator se reportează la lumea reală. Calitatea este la vederea spectatorului și astfel calitatea metodelor instrumentelor de rețea vor depinde foarte mult de perceperea utilității lor văzută de utilizatorii instrumentelor. Aceasta poate fi doar testată prin experimente proiectate detaliat. În acest subcapitol, noi vom discuta considerațiile de proiectare și organizare a experimentelor din domeniu cu instrumentele semantice de rețea și ilustrând-le cu exemple de cazuri din organizarea virtuală în cercetarea industrială.

3.8.1 Consorțiul EnerSearch în cercetarea industrială ca organizare virtuală

EnerSearch- un consorțiu al cercetării industriale se bazează pe IT și pe energie. Scopul ei este să creeze și să răspândească cunoștintele despre modul cum utilitatea IT –ului va influența sectorul energiei utilizate, în special în vederea faptului că aceasta este rezolvată facând o extragere ontologică automată din document. În acest caz aceasta funcționează foarte bine, deoarece documentul are o bază bine controlată a vocabularului. Cu toate acestea, în cazuri generale, noi anticipăm că extragerea ontologică, va fi mult mai dificilă. Mai mult, noi suntem capabili să extragem doar ceea ce se numește ontologia ușoară (de fapt o rețea semantică asemănătoare). În cazuri generale, această rețea poate forma punctul inițial pentru faza dezvoltării ontologice manuale.

A doua problemă întâmpinată ține de evaluarea ontologiei. S-a văzut că într-o anumită rază de răspândire pot fi determinate concepetele ale căror atribute și ale căror relații sunt OK și care trebuiesc reexaminate, dar în afară de aceasta, oricare evaluare a ontologiei devine foarte dificilă. Cea mai bună cale pentru a face în continuare o ontologie este prin aplicațiile pentru care ontologia a fost construită. Răspunsul utilizatorului la aplicație dictează care este ontologia cea mai apropiată și care nu este. Astfel, evaluarea ontologiei se reduce la un grad mai larg de aplicare a ontologiei.

A treia problemă devine mult mai vizibilă la studiul cazului de management calificat. Am observat că utilizatorii au dificultăți la găsirea conceptelor corecte într-o ontologie de câteva sute de concepte sau mai mult. Aceasta se aplică pentru selectarea conceptelor atât pentru adnotare cât și pentru interogare. Problema căutării unui spațiu mai mare de căutare poate fi mai ușor rezolvat folosind ontologiile. Dar atunci problema căutării spațiului ontologiilor trebuie rezolvată. Aceasta este mult mai simplă deoarece căutarea spațiului este o problemă mai mică totuși, o problemă care de obicei se rezolvă prin reducerea drastică a mărimii ontologiei. Acest fapt este desigur nesatisfăcător. Interfețele așa ca cele date de QuizRDF care permit utilizatorilor să se localizeze într-un spațiu ontologic printr-o căutare simplă de cuvânt cheie și apoi să caute ontologia din punctul care ar putea să-i ajute în această privire.

În ciuda problemelor întâlnite,după cum am discutat, utilizarea ontologiilor în 2 suprafețe de aplicare descrise clar oferă avantajele utilizării tehnologiei de căutare a textului liber tradițional și duce la apariția sistemelor care acum sunt utilizate în viață.

EnerSearch realizează proiecte de căutare pentru investigarea unor posibilități inovatoare. Unele din aceste cercetari sunt IT inovatoare, în special la inteligența distributivă. De exemplu, EnerSearch și-a dezvoltat agenții inteligenți pentru construirea deșteaptă și controlul electronic bazat pe marketing pentru aplicații așa ca managementul distribuirii încărcăturii și la construirea confortului managementului. Aceste aplicații sunt, de asemenea, domenii supuse testării. Toate aceste servicii noi imaginate sunt provocări tehnologice, dar vor necesita și vor induce diferite atitudini și comportări, atât de la consumatorii finali adoptați, cât și de la bussines-uri care livrează aceste servicii. Deci, EnerSearch de asemenea realizează cercetarea de modelare a bussines-ului și de cercetare a marketingului.

EnerSearch are o structură care este foarte diferită de o companie de cercetare tradițională. Proiectele de cercetare sunt realizate de un grup variabil și schimbător de cercetători din diferite țări din lume. (Suedia, SUA, Germania, Franța…). Multe din ele, deși fondate pentru munca lor, nu sunt tocmai angajații EnerSearch-ului. Astfel, pentru cunoașterea funcționării creării, EnerSearch este organizată ca o uniune de cercetare virtuală. Instituțiile derivă de la cercetarea condusă care interesează utilitatea industriilor și furnizorii lor IT. Aici, EnerSearch are structura unei companii limitate, care este preluată de un număr de companii din sectorul industrial, sector care are un interes deosebit în cercetările realizate. Companiile acționarilor includ utilizări mari în diferite țări europene printre care Suedia( Sydcraft), Țările de Jos( ENECO, ECN), Portugalia(EDP), Spania(Iberdrola) și Germania(Eon) și alți câțiva acționari IT din lume la acest sector(IBM și ABB). Datorită răspândirii geografice atât de largi, EnerSearch are caracterul unei organizări virtuale și din punctul de vedere al distribuirii cunoștințelor. Ca să adăugăm, pentru interesul general al publicului, se menține un site (www.enersearch.se) unde se publică multe din rezultatele lucrărilor de cercetare, raporturi și cărți. Astfel, răspândirea cunoșințelor produse pe IT și energie este o funcție de bază pentru EnerSearch. În timpul proiectului Spre-Cunoaștere, EnerSearch observă dacă metodele rețelei semantice și instrumentele lor pot fi folositoare pentru îmbunătățirea acestei funcții, în special bazată pe aprovizionarea informației lor de rețea.

3.8.2 Cum pot metodele semantice de rețea să ne ajute?

EnerSearch-ul rețelelor se întâmplă să fie un mecanism important pentru răspândirea cunostințelor. De fapt, una din companiile de acționari a intrat recent în EnerSearch direct datorită rezultatului cunoașterii lor în site-ul web. Totuși, informația structurată pe site lasă multe lucruri de dorit. Are o structură foarte tradițională tipică multor organizații de cercetare: câteva informații principale „despre noi”, o privire generală despre cum au fost făcute proiectele, și care cercetători sunt incluși. De aici, se găsesc multe lucrări electronice, raporturi și cărți care conțin rezultatele cercetării și intră în diferite suprafețe de cunoaștere. Astfel, introducerea reală la ce constituie inima EnerSearch-ului – instinctele despre cum IT-ul avansat poate influența energia bussinesului într-un mediu de market neregulat este de-a lungul liniilor proiectelor sau autorilor. Este clar că acesta este un site foarte bine organizat, condus de informațiile furnizorilor-proiecte și autori. În consecință, el nu furnizează informații pentru cerere și site-ul necesită informații pentru căutători, de exemplu, pentru interesul util al utilizatorilor companiilor. Ele în general nu sunt interesate deloc în cunoașterea proiectelor sau cine sunt autorii lor, dar mai mult în găsirea răspunsurilor la intrebările care sunt importante pentru domeniul industriei. De exemplu: „Încărcătura managementului conduce la salvări de costuri?; și daca e așa, cât de mari sunt ele și care sunt investițiile necesare pentru ele? Poate comunicarea liniei de energie să fie tehnic competitivă cu modemul prin cablu sau cu ADSL-ul? Este vre-un interes în categoria marketului pentru serviciile noii energii? etc.”

Principala dificultate, cu serverul curent al rețelei EnerSearch, este că mult mai greu este să găsești informația corectă despre așa o problemă (doar dacă nu știi ceva despre proiect sau autor, sau să-ți ia ceva timp pentru căutare sau listare). Acesta este rezultatul unei părți de furnizare, mai mult decât partea de cerere a informației de aprovizionare. De asemenea, motorul căutării EnerSearch suportă căutarea textului liber dar nu căutarea bazată pe conținut. Acest standart de căutare a textului are ca de obicei probleme: lipsa preciziei și lipsa recuperării resurselor de informații irelevante. O posibilitate este să restructurezi complet informația de pe site dar aceasta este o sarcină enormă pentru furnizorii de informații- cercetatorii pentru care structura proiect/autor este destul de naturală, și mai mult într-o organizare virtuală, este dificil ca să-i impui să-și petreacă timpul pe ceea ce ei vor vedea ca timp adăugator. Deși, o altă soluție este să nu schimbăm structura site-ului prea mult, dar să o facem mai accesibilă pentru utilizatori prin furnizarea punctului de vedere al accesului extra informației, care este structurată așa încât se așteaptă la partea cu întrebarile cerute și interesele care sunt prezente la punctul de început în loc de punctul final.

Acesta este cazul cand metodele semantice ale rețelei și instrumentele pot fi folositoare. Sunt câteva motive pentu aceasta. În primul rând, ele ne pot ajuta, după cum am spus deja, la limitarea timpului consumat pentru informațiile furnizorilor. Cu atât mai mult, scopul grupurilor de informații din rețea este clar: cercetătorii în domeniu, personalul și utilitatea managementului industriei, și la o întindere mai mică o audiența generală exterioară, care se întâmplă să aibă un interes pentru IT și energie, căsuțe deștepte etc. Ca atare, este foarte probabil să formezi o imagine clară despre ce tip de întrebări sau subiecte sunt relevante pentru grupurile cu acest scop. În final, domeniul cunoștințelor, în care EnerSearch functionează, este relativ foarte bine definit. Astfel, este desigur posibil ca să egalezi cu o ontologie a domeniului, aratând diferite subiecte importante și relațiile dintre ele, care sunt de o bună calitate și destul de stabile. De fapt, câteva din site-urile semantice arătate mai târziu, sunt bazate pe puterea „ontologiei EnerSearch de prânz” care necesită 2 revelatori pentru nu mai mult de câteva ore ( în timpul prânzului) ca să se dezvolte.

3.8.3 Considerațiile de proiectare a experimentelor domeniului semantic al rețelei

Astfel, instrumentele rețelei semantice și metodele ontologiei pot ajuta EnerSearch-ului cu managementul cunoștintelor sale interne și externe. Pentru acest scop, EnerSearch este un studiu conducător de caz pentru implementarea și evaluarea accesului semantic la site-urile lor web. Sunt câteva elemente independente care trebuie luate în considerare, în general când sunt folosite pentru proiectarea testării domeniului ale instrumentelor semantice din rețea:

Diferite moduri de adunare a informației folosite de utilizatori în timpul încercării găsirii informației pe care o caută;

Diferite grupuri de utilizatori cu un anumit scop care sunt diferențiați din punct de vedere al diferențelor de interes, motivare și natura informației care o urmăresc, și cunostinețele principale pe care le aduc;

Diferite stiluri personale de utilizare a informației care se referă la diferențele în stilurile individuale cognitive la manipularea informației.

3.8.3.1 Moduri diferite de informare

Dacă dorim să evaluăm metodele semantice, în primul rând stabilim un punct clar referențial pentru comparare sau câteva tipuri de unități în termenii în care putem măsura calitatea noilor moduri de a face lucrurile. În cazul discutat, punctul de referire este de obicei calea adunării informației pe calea rețelei: cercetarea cuvântului cheie și hiperlinkului bazat pe afișare. Aceasta asigură bastonul cu care putem măsura cât este de bun modul de abordare semantic novator. Aici considerăm 2 moduri diferite de informații semantice în stilul rețelei web:

cercetarea bazată pe ontologie;

cercetarea bazată pe navigare.

Vom da mai târziu câteva exemple pentru ambele moduri de informare semantică.

3.8.3.2 Diferite grupuri ale utilizatorilor cu un anumit scop

În general, este foarte important să se realizeze o segmentare propiu-zisă a utilizatorilor cu un anumit scop deoarece de obicei ei sunt foarte deosebiți, fiecare aducând cu ei punctul lor de vedere, așa spus ”ontologia lor” cu privire la informația căutată. Aceste diferențe evident vor influența percepția lor la cât de bune sunt metodele semantice de lucru ale rețelelor. În cazul EnerSearch, unele grupuri ale utilizatorilor cu un anumit scop și caracteristicele lor sunt destul de ușor identificabile, și anume:

din exterior: personal interesat și management în utilitatea companiilor;

din interior: cercetătorii implicați în IT și proiectele energiei.

Aceste 2 grupuri sunt foarte diferite. Utilitatea personalului este în general foarte interesată în subiectele bussines-ului. Chiar când este preocupată de tehnologiile noi, interesul nu va fi în primul rând la elementele tehnologiei, dar cu mai multă fermitate la potențialul aplicațiilor („ce putem face noi cu aceasta?”) și la stabilirea cazului de bussines pentru ele. („care sunt beneficiile?”). Pentru cercetători este mai mult sau mai puțin invers. Publicațiile arbitrare conținând argumente solide și cu detalii tehnice ,de obicei formale, sunt cheia pentru academici. Și invers, utilitatea bussinesului, competența tehnică a fost întotdeauna foarte importantă, dar cercetarea a fost întotdeauna limitată: o cifră tipică pentru R&D consumată în utilitatea industriei nu este mai mare decat 2% de venitul total anual. Cifra tinde să coboare odată cu neregularitățile marketului: debitarea costului este crucială și timpul strategic orizontal descrește. Ca să adăugăm, IT nu este tipic o competență principală în utilități care tinde să aiba un punct de vedere asupra rețelelor prin „cablu și sârmă”, un punct de vedere care este revizuit de asemenea pentru IT (astfel cititorii sunt învitați să-și imagineze cum să explice convingător conceptul de ”agent software” în așa o setare). Astfel, o privire generală a cercetatorilor și utilităților interesate de același subiect al IT-ului și energiei este foarte tare diferită. Ultima, dar nu în ultimul rând, se pare ca există o a treia grupă a EnerSearch site-ului web care este mult mai difuză, un public mult mai general care nu cunoaște dar este interesat de cifre și diferite rezultate ale cercetării și tendințelor. Desigur, prezicerea adecvată a așteptărilor și intereselor acestui grup larg, pentru scopul aprovizionării cu informații adecvate pe site este foarte dificilă și aici este unde apare o provocare interesantă pentru aplicarea metodelor semantice web.

3.8.3.3 Diferite stiluri individuale cognitive

Totuși o altă dimensiune influențează rezultatele testelor semantice web și experimentele care constau în faptul că oamenii diferă în stilul personal cu care manipulează informațiile și iau deciziile corespunzătoare. Din moment ce este un element novator în cercetarea semantică web, vom merge mai departe în a vedea cum stilul cognitiv al informației utilizate poate fi măsurat și schițat. O teorie utilă ca sa se facă aceste tulpini în domeniul atitudinii organizaționale este numită teoria stilului decisiv. Își are originea în teoria raționalității limitate a lui Herbert Simon care spune că ființele umane de obicei nu pot procesa toată informația relevantă, aparținând unei decizii care trebuie hotărâtă, dar sunt multumiți cu cantitatea limitată de informații care este adecvată pentru luarea deciziei ce este „foarte bună”. Aceasta se numește atitudine satisfăcătoare de luare a deciziei.

Teoria stilului deciziei generalizează ideea lui Simon ca o continuatoare. Oamenii diferă pronunțat în cât de multă informație utilizează ei pentru deciziile lor. Sunt oameni care par să facă repede concluzii și alții care nu-și schimbă părerea doar dacă fac o analiză. O persoană care e fericită să considere cantitatea minimă de informații utilizată pentru luarea unei decizii rezonabile și „foarte bune” este numită satisfăcută în utilizarea informației ei/lui. Și invers, o persoană care face întâi o analiza detaliată ca să se asigure că nici o parte relevantă din informație nu a fost scapată pentru luarea deciziei, este numită persoană maximalizatoare în utilizarea informației. Această diferență este arătată în fig. 3.9. Prima informație primită la o problemă este în general cea mai valoroasă pentru luarea deciziei. Când nu se știe aproape nimic despre problemă, primele bucăți de informații pot fi deschizătorii unei decizii. Mai târziu, după ce s-a adunat informația, multe din cunoștințele situației, sunt puțin probabil să fie adaugate, sau modificate noilor obiecte ale informației pentru ințelegerea situației. Stilurile de utilizare a informației satisfăcătoare versus maximatoare sunt referitoare la valoarea informației observate, și constituie o dimensiune a stilului cognitiv. În adăugare, la întrebarea: ”Câtă informație utilizăm ca să luăm o decizie?”, este o a doua dimensiune numită centrarea pe soluție. Aici, problema deosebită constă în luarea deciziei, unii oameni tind să utilizeze informații pentru a ajunge la un curs de acțiune definitoriu, în timp ce alții tind sa vadă informația ca conducătoare pentru varietatea diferitelor soluții posibile în același timp. Aceste stiluri contradictorii în centrarea luării deciziilor sunt redate in fig.3.10. și sunt numite unicentrate versus multicentrate.

Apoi dacă se combină aceste 2 dimensiuni ale stilului-cantitatea informației utilizate și centrarea solutiei- se primește un set de informații individuale diferite bazate pe stilurile luării deciziei ca cele prezentate in fig. 3.11. Stilurile deciziei următoare sunt numite decisive, flexibile, ierarhice, integrative și sistematice. Stilul decisiv este un stil satisfăcător și unicentrat. Decisivele utilizează o cantitate minimă de informații pentru ca să vină rapid cu o soluție clară a unei probleme. Lucrurile-făcute-acum este o caracteristică a acestui stil. Comunicarea decisivă este scurtă și la subiect. Personalitățile decisive spun ce cred și cred ce spun. Oamenii cu un stil flexibil utilizează un nivel moderat de informații (așa utilizează și decisivii) dar interpreatează aceleași informații în diferite moduri și timpuri diferite în dependență de punctul de vedere care îl susțin curent. Ei sunt capabili să se adapteze rapid la așteptările altora și își schimbă foarte des direcția depinzând de cine este prezent. Flexibilii preferă să nu plănuiască deoarece planurie îi fac să se simtă în capcană și să nu fie capabili să-și exercite opțiunile. Și invers, stilul ierarhic utilizează o cantitate maximă de informații ca să-și atingă concluzia unică cea mai bună. Pentru ierarhici, este clară „o cale cea mai bună” de a face lucrurile. Informația importantă utilizată e dictată de dorința să nu ingnore nici un detaliu care poate diminua calitatea concluziei. Odată ce informația este riguros analizată, de obicei intr-un fel cantitativ, planul rezultat este complex dar centrat pe importanță. Stilul integrativ, tinde să proceseze o cantitate mare de informații (așa ca ierarhicii), dar ei o folosesc(așa ca flexibilii) pentru a genera mai multe alternative de soluții. Integrativii, după obisnuință, produc o largă varietate de posibile interpretări ale informației despre situațiile simultane. Planurile lor sunt mereu deschise la schimbare: sunt văzuți ca buni inițiatori ai cursului în acțiune dar nu ceva în care să se bage imprecis, și astfel ca să revizuie când o situație evaluată este cerută. În final, stilul sistematic se transformă băbește în studii cantitative, ce ține de stilul deciziei (informația băbească implică de fapt zeci de mii de subiecte din diferite țări). Aceasta combină calități din ambele stiluri: integrativ și ierarhic. Este un stil de utilizare a informației maximal, dar sunt ambele multicentrate și unicentrate în luarea deciziei. Planifiarea sistematică este cuprinzătoare. Este unicentrată în termenii în care are o singură boltire și un scop unificator, dar este multicentrată prin aceea că va conține multe sub-scopuri diferite și multe tactici și strategii pentru atingerea acelor scopuri.

Diferențele individuale în stilurile procesării informației astfel captează caracteristicile esențiale ale oamenilor într-o organizare, cum ei doresc să fie informația prezentată și cum ei comunică caracteristic. În general, oamenii nu au un singur stil, de obicei câteva combinații cu unul sau două fiind dominante. Cu atât mai mult stilurile deciziei, nu sunt statistice. Ele se schimbă ca rezultat al schimbărilor parametrilor mediilor așa ca presiunea muncii creând (supra)-încarcare cognitivă, sau dacă suntem într-o situație de muncă zilnică sau într-o setare formală și independentă. Pe o scară de timp mai mare, stilul deciziei unei persoane de asemenea se poate schimba. Stilurile sunt studiate după obișnuințele de a face lucrurile și sunt influențate de mediul social în care locuim, munca pe care o facem, cererile și așteptările care le întâlnim,etc. Din moment ce acești factori se schimbă stilurile procesării informațiilor se pot schimba și peste ani de zile. Multe aspecte ale teoriei stilului deciziei nu pot fi atinse în realitate și pentru o privire generală cuprinzătoare cititorul trebuie să consulte literatura. Ca să măsurăm stilul deciziei unei persoane, există chestionare standarte care sunt validate în timpul multor ani de cercetare. Aceste instrumente de cercetare sunt de asemenea utilizate în studiul cazului semantic web realizat de EnerSearch.

3.8.3.4 Ipotezele la testări

Sumar, la proiectarea experimentelor semantice web, dimesiunile diferite de proiectare sunt de o mare importanță: variațiunile modurilor de informare, la grupurile utilizării cu un anumit scop, și la stilurile individuale ale procesarii informației. În final, experimentul trebuie să fie bazat pe una sau mai multe ipoteze clar formulate care pot fi verificate sau falsificate, de exemplu, prin metode statistice empirice. O posibilă listă de ipoteze testabile se referă la informațiile semantice web bazate pe căutare:

I1.Utilizatorii vor fi apți să completeze cerințele găsirii informației în timp mai scurt utilizând instrumentele accesului semantic bazat pe ontologie apoi cu mentinerea curentă a cuvintelor cheie bazate pe căutarea textului liber.

I2.Utilizatorii vor face mai puține greșeli în timpul căutarii cerințelor utilizând ontologia bazată pe instrumentele accesului semantic apoi cu menținerea curentă a cuvintelor cheie bazate pe căutarea textului liber.

I3:Reducerea în completarea și numărul greșelilor vor fi mai vizibile pentru utilizatorii mai puțin experimentați.

I4:Reducerea timpului va fi de asemenea mai mult vizibil pentru utilizatorii cu lipsă de cunostințe detaliate ale implementării sistemelor tehnice evidențiate

I5:Instrumentele accesului semantic bazat pe ontologie vor fi percepute mai utile decât căutarea textului liber de diferite tipuri de persoane pentru un rang larg al domeniului și căpătarea scenică a cunoștințelor

I6:Efortul dezvoltării și menținerii ontologiei și structurii informative nu va întrece semnificativ efortul dezvoltarii și menținerii abordării textului liber.

Într-un experiment de domeniu, așa ipoteze ca acestea sunt testate pentru importanța lor, și pentru cum validarea lor variază în timpul diferitelor moduri de informare, grupurile de utilizatori cu un anumit scop, și stilurile individuale ale procesarii informației sunt investigate.

3.8.4 Setarea experimentală în organizarea virtuală

Studiul de caz în care sunt realizate instrumentele semantice web sub condițiile domeniului este văzut ca un studiu de explorare. Nu constituie un studiu comparativ cuprinzător. Pentru acesta sunt necesare mai multe instrumente de informații recuperate (atat standarte cât și instrumente de acces semantice bazate pe ontologie) și adăugând un grup mai mare de subiecte pentru compararea rezultatelor și extragerea statistică a concluziilor importante empirice. Cu toate acestea, studiul cazului explorator va da o buna indicație pentru ce direcții trebuie sa se îndrepte pentru obținerea metodelor și instrumentelor semantice în viitor.

3.8.4.1 Selectarea utilizatorilor pentru testare

Implicarea cunoștințelor utilizatorilor în experiment de la început este importantă, pe de o parte din cauza interacțiunii între utilizatori și cerințe, și pe de altă parte din cauza cunoștințelor lor anterioare, sau a lipsei de cunoștințe anterioare în domeniu sau/și a sistemelor. Noi am identificat câteva tipuri de utilizatori pentru testare prin conducerea unui set de interviuri înainte încercate. Ca rezultat, evaluarea experimentului include 3 tipuri diferite de grupuri interesate, dupa cum am menționat mai devreme. Un grup constă din membrii personalului din 4 companii diferite de acționari . Un al doilea grup constă din cercetătorii din diferite domenii științifice, unii având ceva timp participat la proiectele EnerSearch. Al treilea și grupul final tinde să reprezinte mai mult sau mai puțin o audiență generală exterioară și constă din studenți (care studiază la Departamentul de Inginerie și Știința Calculatoarelor la Institutul de Tehnologie Blekinge din Suedia). Găsind informații pe baza personală este important pentru toate aceste grupuri,dar din diferite motive, ei sunt în general limitați în timp ca să investească pentru cercetarea cunoștințelor. Majoritatea utilizatorilor supuși testului sunt familiarizați cu EnerSearch web și au utilizat-o înainte. Mai sunt de asemenea și din acei care nu au auzit de EnerSearch web dar li s-a spus și au fost instructați despre cum funcționează EnerSearch web.

3.8.4.2 Instrumentele pentru testare

Oamenii supuși la testare utilizează 3 instrumente diferite: 2 instrumente semantice bazate pe ontologia QuizRDF și Spectacol și instrumentul căutării textului liber, EnerSearch. Aceste instrumente și ce tipuri de rezultate produc sunt discutate în detaliu mai târziu. Instrumentul semantic bazat pe ontologie Quiz RDF este ales pentru studiul de caz pentru 2 motive. Instrumentul are avantajul că utilizatorul poate începe cu întrebarile simple constând doar dintr- un număr mic de termeni de cercetare ca să obțină o ilustrație despre ce tip de informații sunt valabile pentru baza cunoștințelor din EnerSearch. Este apoi o continuare oferită de cercetarea bazată pe cuvintele cheie comune la diferite nivele ale cercetării semantice. Motivul utilizării instrumentului Spectacol de navigare bazat pe ontologie este acela că prezintă informația în conformitate cu structura inerentă care este oferită de domeniul ontologiei. Aceasta dă un context semantic valoros pentru utilizator care nu este valabil pentru instrumentele standarte de recuperare a informației. Informația este prezentată în așa un mod încât calea duce la informații adăugătoare pentru înțelegerea utilizatorului a rolului semantic al informației. Fiecare concept ales este „înconjurat” de alte concepte similare ontologice. Generalizările semantice și specializările sunt de asemenea oferite utilizatorului în timpul navigării informației.

3.8.4.3. Cerințele testului și organizarea lor

O problemă importantă este alegerea cerințelor pentru aplicare puse pentru testarea utilizatorilor. Pentru acest scop, ele trebuie să fie destul de simple și să fie studiate într-un timp scurt dar destul de complex pentru provocarea utilizatorilor la grupările de testare. Un exemplu de cerință a achiziționării cunoștințelor date pentru testul utilizatorilor este să găsească anumite răspunsuri la întrebările anterior definite despre găsirea informației în baza de date EnerSearch. Eforturi importante se consumă pentru setarea unui set util de intrebări anterior definite așa încât ele să permită analiza comparată adecvată, și în același timp probe adecvate pentru diferite interese ale categoriilor de utilizatori testați și să acopere instrumentele informației variate valabile într-un fel reprezentativ. O problemă experimentală în timpul testului studiului de caz este aceea că dacă i se dă unui utilizator exact aceeasi cerință de căutare ca să o facă cu 2 instrumente diferite va fi mult probabil să fie o eroare de transfer. Aceasta înseamnă că este mai sigur că ei nu vor putea să repete aceleași greșeli la îndeplinirea cerinței a doua oară și vor ține minte cum au făcut ceva și nu va fi necesar să se gândească asupra acesteia a doua oara. Ca să se evite acest transfer de efect, se proiectează 3 scenarii diferite dar comparabile fiecare incluzând același tip de cerință a achiziționării cunoștințelor în același domeniu dar incluzând un aspect diferit al bazelor de date. Întrebările testului sunt divizate în 3 blocuri. Sunt 6 moduri diferite de a organiza instrumentele într-o anumită ordine (Spectacol, QuizSEARCH …) și egalitate și multe moduri de a organiza blocurile cu intrebări. În general sunt 36 moduri diferite de a organiza ordinea instrumentelor și întrebările căutate. Prin această permutare a intrebărilor și ordinii instrumentelor se face o evaluare statistică și potrivită a instrumentelor.

Pentru facilitarea achiziționării cunoștințelor utilizatorului la test cerute pentru îndeplinirea scenariilor și pentru asigurarea unei întelegeri uniforme a domeniului cu care interactionează utilizatorul, domeniul de aplicație este explicat la test utilizatorilor printr-un email care este trimis în avans. Utilizatorii de teste și domeniul au fost special alese pentru evitarea diferențelor în expunerea anterioară a subiectelor la domeniu. Desigur aceste puncte nu sunt relevante în timpul testării utilizatorilor care sunt experți într-un anumit domeniu. Un depozitar de baze de date și scenariile la instrumentele de testare care pot fi cunoscute de diferiți cercetători fac o mai bună evaluare comparativă între diferitele abordări, atât cât și reduc cantitatea muncii cerute pentru evaluarea testului. Pentru fiecare suprafață ontologică majoră un scenariu diferit este folosit. Este important ca scenariile diferite să fie comparate la mărime și la complexitate cât mai posibil ca rezultatele experimentului să fie cu efect.

3.8.4.4 Procedura experimentală

După determinarea tipului de experiment care trebuie realizat, ipotezele, tipurile de utilizatori și natura cerințelor de căutare sunt pusă pe poziția planificării altor detalii ale experimentului. Aceasta include, de exemplu, ce informații vor fi date la test utilizatorilor și în ce format, ce tip de interacțiune pot avea utilizatorii cu experimentele în timpul testelor, de exemplu, dacă pot pune întrebări referitoare la domeniul sau instrumentele utilizate în experiment. Cât de multe repetiții sau probleme vor fi date la fiecare test al utilizatorului și în ce ordine, și o indicație la succesul criteriului utilizatorilor de teste astfel încât să știe că după ce au terminat ce scenariu li se dă.

Organizarea experimentului trebuie proiectat cu grijă ca să controleze pe cât posibil variabelele care pot afecta rezultatul experimentului. În acest caz, ordinea în care cerințele trebuie executate poate fi afectată de rezultate, deci se schimbă ordinea executării pentru diferiți utilizatori ai testelor. Utilizatorilor li se cere să completeze un chestionar înaintea executării experimentului ca să formeze grupuri pe cât posibil echilibrate. Pentru toți utilizatorii, stilurile lor de procesare a informației sunt de asemenea determinate separat de administrarea chestionarelor standarte care vin cu teoria stilului de decizie.

Experimentele verificate compară EnerSEARCH cu performanțele utilizatorilor testelor cu instrumente QuizRDF sau Spectacol. Fiecare utilizator se confruntă cu diferite întrebări referitoare la EnerSearch web. Fiecare scenariu va fi realizat cu instrumentul bazat pe ontologie și cu instrumentul căutării textului liber. În acest mod rezultatele vor fi independente din complexitatea scenariilor. Recapitulând, prin proiectare atentă a experimentului, toți factorii sunt echilibrați chiar la calificarea utilizatorilor pentru fiecare grup aparte, numărul de câte ori e folosit un instrument pentru fiecare scenariu și numarul de câte ori fiecare instrument e folosit în primul rând.

3.8.4.5 Determinarea căror date să se adune

Colectarea datelor în timpul experimentului poate fi determinată și/sau limitată prin ce este posibil în termenii instrumentelor de căutare pe baza ontologică și pe baza mediului cunoștințelor.Modurile nedorite de înregistrate a datelor trebuie evitate. De exemplu, nu trebuie să li se ceară utilizatorilor să completeze în forma lungă descrierea la ceea ce au făcut detaliat deoarece le desconcentrează gândurile și le ia mult timp ca să completeze cerințele mari. Următoarele date sunt colectate în timpul executării scenariilor:

Timpul în care se completează întreaga cerință de căutare

Logarea automată a schimbărilor executate la sistemul de cunoștințe

Logarea automată a erorilor în cerința de căutare

Logarea automată a comenzilor executate (de ex.adăugarea unei noi probleme de rezolvare a treptei anterioare similară cu cea existentă)

Note detaliate a acțiunii executate de utilizatori incluzând cum utilizatorii abordează problema dată și ce materiale consultă. Cu acest scop utilizatorilor li se cere să verbalizeze ceea ce cred și ce fac în timpul executării scenariilor. Se utilizează magnetofonul în timpul interviurilor din moment ce notițele nu sunt suficiente.

Chestionarele de după probă a utilizatorilor sunt completate la sfârsitul experimentului cu întrebări referitoare la utilitatea instrumentelor observate

Datele colectate trebuie să fie suficiente testului pentru ipoteze, după cum s-a arătat mai sus, și trebuie confirmate dacă sunt relevante sau nu. Colectarea datelor este foarte folositoare, deoarece nu este doar demonstrația ipotezelor, dar de asemenea ajută la explicarea rezultatului experimentului, și la explorarea cauzelor potențialului anumitor rezultate experimentale. S-a văzut că conducerea interviurilor înainte de teste a fost utilă nu numai la ajutarea rafinării organizării evaluării actuale,dar și organizarea strategiilor de colectare a datelor.

3.8.4.6 Matricea evaluării și măsurarea

Fiecare persoană care realizează un experiment începe testul cu o procedură de logare. Numele utilizatorului și compania sau organizația în care activează utilizatorul. Utilizând logarea va fi de asemenea posibil ca să se vadă când și de unde utilizatorul a intrat pe EnerSearch web. Va fi posibil ca să se măsoare timpul perioadei în care diferiți utilizatori consumă pentru răspunderea fiecarei întrebări în timpul experimentului. După fiecare întrebarea utilizatorului i se cere să explice cum a primit informația pentru a răspunde la întrebare. Prin colectarea informației și prin compararea răspunsurilor utilizatorului la întrebare va fi posibil să se evalueze diferite instrumente semantice bazate pe ontologie. Este de asemenea important să se evalueze nivelul aprecierii diferitelor instrumente. Întrebările ca aceasta să fie evaluată sunt de exemplu: Este posibil ca să se completeze cerințele căutării într-un timp mai scurt utilizând instrumentele bazate pe ontologie decât instrumentele standarte de căutare a textului liber? Este ușor să se folosească instrumentele bazate pe ontologie? Se ințelege interfața? Sunt răspunsurile corecte? Sunt răspunsurile relevante pentru cercetare?

Ca să fie apt să răspundă la aceste întrebări într-un timp rezonabil, studiul de caz necesită să fie limitat la un anumit număr de întrebări pentru fiecare instrument bazat pe ontologie. Studiul de caz este de restricționat la un număr limitat de întrebări, ca să evite renunțarea utilizatorului datorită lipsei de timp pentru completarea experimentului. Ca să se evite renunțarea trebuie făcută posibilă logarea utilizatorului oricând pentru completarea chestionarului.

Este clar că testele instrumentelor semantice web necesită o proiectare foarte atentă a experimentului. Testul viitor pentru utilizatorii de grupuri și cerințele testului trebuiesc atent echilibrate ca să permită testarea adecvată a statisticii empirice a ipotezelor care trebuie clar formulate în avans. Adunarea datelor empirice într-un așa experiment trebuie să fie bogate, incluzând metodele variate calitative atât cât și metodele cantitative.

3.8.5 Aspectele tehnice și sistematice ale experimentelor semantice ale Web-ului

3.8.5.1 Proiectarea sistemului.

Linia de bază a ipotezelor este că soluția bazată pe ontologie va face pentru utilizatori o mai ușoară locare a informației pe care o caută și va face mai usoară împărtășirea cunoștințelor cu alții din organizație. Utilizatorii pot alege între două noi modalități de găsire a informației:

Întrebând baza de date cu instrumentul de căutare QuizRDF bazat pe ontologie;

Navigând și listând prezentarea construirii de la site-ul bazelor de date utilizând instrumentul prezentării Spectacle.

Testele de domeniu vor evalua navigarea și căutarea facilităților sistemului împotriva instrumentului tradițional bazat pe cuvântul cheie EnerSEARCH, care a fost înainte utilizat pentru căutarea într-un domeniu. Proiectarea completă a sistemului pentru informațiile recăpătate bazate pe ontologie este arătată in fig. 3.5.. Sistemul este construit folosind unelte și tehnologii dezvoltate în proiectul de cercetare Spre-Cunoștința și îi urmează multe decizii de proiectare luate în timpul proiectului așa ca:

Cuplarea liberă a uneltelor prin HTTP

Utilitatea facilitătii depozitării centrale (sesame)

Sprijin pentru media slab structurată (texte simple, HTML și formate PDF)

Alegerea RDF-ului ca format reprezentativ de cunoaștere

Conformitatea cu o convenție comună asupra modelului de date

Pentru utilizatorul final, funcționalitatea sistemului este valabilă prin interfața HTML a motorului de căutare Quiz RDF și prezentarea Spectacol care este prezentată mai jos.

3.8.5.2 Ingineria ontologică, Popularea și Adnotarea

Procesul setării sistemului începe cu achiziționarea ontologiei de bază prin permisiunea extragerii uneltei OntoExtract pe publicațiile depozitate la site-ul EnerSearch. Rezultatul ontologiei vizibile conține o ierarhie largă de concepte și relații între concepte, plus clasificarea pe pagini în conformitate cu conceptele. Odată supus la serverul central Sesame, este completat cu ontologia strânsa din datele de baza a publicațiilor EnerSearch prin inversarea ingineriei în RDF. Ontologia domeniului OntoExtract obținută prin procesarea limbilor naturale și ontologia care descrie publicațiile care sunt legate împreună natural prin URL-ul publicațiilor.

Al doilea pas este rafinarea ontologiilor prin utilizarea uneltei OntoEdit. Ca ghidare în acest proces, editorul ontologiilor consultă domeniul experților și ia în considerare cazurile propuse utilizate. Când este implementată, ingineria ontologică va fi capabilă să întoarcă ontologia rezultată ca cunostințe principale pentru OntoExtract, realizând dezvoltarea ontologiei iterative cu efect. O astfel de caracteristică va face posibilă transformarea unei ontologii mai vizibile obținută prin NLP într-una mai bogată, mai structurată în timp ce se mențin avantajele unei abordări automate.

La pasul al treilea și ultimul, două prezentări sunt generate din datele ontologiei pentru căutare și navigare. Generând un motor de căutare bazat pe ontologie este un proces de un clic: necesită doar selectarea Sesame pentru utilizarea depozitării. Ulterior, uneltele procesează paginile adnotate de ontologie și sporeste indexul cuvântului cheie cu datele ontologice. Rezultatul este căutarea la comandă a motorului descris mai jos.

Deși procesarea dezvoltării iterative ontologice nu a fost valabilă în timpul scrisului, ontologia studiată în studiul de caz este bazată pe combinația OntoExtract generată de onotologia vizibilă și de datele de bază transformate.

Motorul de căutare QuizRDF, cu toate acestea, a fost generat de o versiune a ontologiei vizibile unde doar conceptele de bază sunt prezente. Acest lucru a fost strict necesar deoarece QuizRDF este o unealtă generică care nu are nici o înțelegere asupra ontologiei dincolo de schema și părțile modelului de date utilizat în timpul proiectului Spre-Cunoștință. De asemenea, o versiune diferită a pubicării bazelor de date a fost utilizată în cazul QuizRDF pentru motive tehnice, este remarcabil faptul că doar proprietatea căutarii valorează la nivelul exemplului.

Creând interfața de navigare Spectacol este o cerință de programare care necesită o utilizare intensivă a clientului Sesame API, Spectacle publicând Api și câteva transformări ontologice de programare, de exemplu, pentru deducerea noilor fapte care nu sunt clar depozitate în ontologie. De exemplu, dacă o pagină este despre un anumit concept, atunci este de asemenea despre clasa superioară a acelui concept. Din moment ce conținutul este generat și depozitat pe serverul prezentat Spectacle utilizatorii îl pot accesa utilizând sistemul de navigare JavaScript .

3.8.6 Recuperarea informației pe baza ontologică: Cum arată?

Recuperarea informației pe baza ontologică este suportată de utilizator când acesta întreabă despre cunoștințele de bază. Îi va permite utilizatorului să formuleze întrebările într-o cale mai naturală, de exemplu, prin ajutorul selectării și combinării termenilor relevanți. O astfel de abordare va permite de asemenea tipurile de întrebări mai avansate care nu sunt posibile prin uneltele căutării pe bază non-ontologică, de exemplu, prin locarea informației în timpul specificării scopului interesului sau prin furnizarea ajutorului cu o întrebare de generalizare sau rafinare. De asemenea, prin abordarea de navigare în prezentarea Spectacle, se așteaptă ca procesul recăpătării informației să fie adăugat la domeniul de ințelegere a utilizatorului.

3.8.6.1 Ontologia și Site-urile semantice

Din moment ce tehnologiile pentru îmbogațirea ontologiei obținute de NLP nu sunt valabile la momentul dat, ontologia implicată în studiul de caz este o ontologie vizibilă care se dezvoltă manual într-un timp scurt. Se observă că domeniul este acela în care lipsește o ierarhie bine definită a subclaselor. Cu toate acestea, este posibil să se capituleze asupra întăririi abordării automate, și anume clasificarea eficientă a publicării extensive a datelor de bază completate cu selectarea automată a conceptelor cheie și a conceptelor relatate. Astfel, munca impusă consumatorilor de informație a fost foarte limitată.

Experiențele anterioare au arătat ca ontologiile vizibile pot înca furniza intuiții semnificative combinate cu abordări automate. Ca să se demonstreze aceasta,instrumentul Administratorului Webmaster a fost utilizat cu o ontologie principală vizibilă, din care un fragment este arătat în figura.3.6. Autorii,Ygge și Gustavsson,au furnizat lucrări tehnice importante pe când Sweet și Bosch au scris în principiu lucrări orientate spre administrarea businessului. Alți autori au un interes mult mai general (Akkerman) și acest fapt este vizibil la măpile semantice ale site-ului EnerSearch care arată distanța semantică între autori și termenii domeniului de disciplină a cercetării și publicării.

3.8.6.2 Recuperarea informației semantic-bazată

EnerSearch-ul suportă trăsături standarte așa ca căutarea cuvintelor și utilizarea cazurilor senzitive și cercetării intensive. Calitatea cercetarii EnerSearch-ului este similară cu calitatea obținută la cele mai standarte motoare de cercetare web. Dificultatea acestui instrument de căutare este aceea că are multe aluzii irelevante care sunt mai senzitive la ortografierea și executarea mai săracă a sinonimelor.

QuizRDF prezintă utilizatorului în primul rând un text introductiv și un meniu drill-down. Acest meniu conține o listă de toate tipurile de resurse depozitate în indexul QuizRDF, care sunt concepte și o clasă a Publicarii în cazul nostru. Meniul drill down dă utilizatorului opțiunea să restrângă cercetarea la un concept specific: după selectarea unui concept, doar paginile referitoare conceptului sunt prezentate. Prin selectarea clasei „Publicație” în meniul drill-down utilizatorul are ocazia să caute în diferite domenii publicațiile datelor de baze. În orice moment utilizatorul poate introduce textul din limba naturală într-o boxă de introducere a textului așa ca cercetarea textului liber. QuizRDF combină aceste criterii de cercetare utilizând operatorul ADN și potrivește rezultatul întrebărilor împotriva indexului bazat pe ontologie. Răspunsul este o listă de resurse QuizRDF plasate în conformitate cu relevanta resurselor la răspunsul utlizatorului.

În final, utilizând prezentarea Spectacol, utilizatoriii pot începe navigarea prin selectarea unui obiect din lista de concepte, concepte de bază, autori, proiecte sau anul publicației. În consecință, utilizatorul poate în continuare să restrângă cercetarea prin alegerea conceptului întâlnit sau conceptul relatat. Acest pas este repetat pâna când lista paginilor este redusă la un anumit număr.

3.8.7 Câteva lecții învățate

Ca să se demonstreze adevărata valoare a metodelor semantice web trebuie să se realizeze experimente în domeniu. Se conturează un numar de ipoteze care trebuie studiate în studiile de caz reprezentative. Este de asemenea descris ce fel de variabile trebuie luate în considerație, ce colectare de date, evaluare, procedura experimentării, și proiectarea sistemului care este făcut, și trebuie să se schițeze importanța părții umane a procesării informației.

În timpul scrierii, nu se pot da rezultatele finale asupra testelor de domeniu utilizării instrumentelor semantice web. Cu toate acestea, câteva lecții și concluzii pot fi derivate deja din experimentele practice de pâna acum.

Testările cu instrumentele semantice web și studiile de caz în domeniu necesită o proiectare a experimentului foarte atentă. Grupurile viitoare de utilizatori supuși testărilor și cerințele testelor trebuie echilibrate cu grijă ca să permită testarea statistic-empirică adecvată a ipotezelor care trebuie formulate explicit în avans. Datele empirice adunate în asa experimente pot fi bogate, incluzând metodele variate calitative, așa cât și metodele cantitative.

Studiul de caz validează abordarea apărată aici a setului de instrumente furnizat și tehnologiilor pentru construirea soluțiilor cunoștințelor de management , ca opus furnizării sistemului de cunoștințe de o mărime ce se potrivește pentru tot. Cu toate acestea, integrarea instrumentelor, necesită câteva componente adăugatoare la arhitectură care se lipesc împreună cu funcționalitatea componentelor. Este de asemenea o necesitate pentru o librărie a transformărilor ontologice așa ca filtrarea și deducerea obișnuită pentru potrivirea necesității diferitor subsisteme.

Construind un motor de cercetare dintr-o ontologie utilizând QuizRDF este un proces de un clic în contrast cu crearea prezentării cu Spectacol pe baza ontologică în care cerința programării este complexă. Cu toate acestea, motorul de cercetare QuizRDF, nu este un mecanism cu pârghii a cunoștințelor ontologice care merg odată cu modelul comun de date, în timp ce prezentarea Spectacol poate fi comandată pentru extragerea automată a ontologiei.

Ontologiile obținute prin procesarea limbilor naturale sunt ontologii vizibile în afară de clasa solidă ierarhică. Această situație va fi ușurată prin asigurarea extragerii automate a ontologiei prin cunoștințele de bază depozitate care conțin informațiile de domeniu negăsite în textele și ghidurile de modelare a proceselor. Cu toate acestea, este posibil de asemenea capitalizarea avantajelor extragerii ontologiei automate care include printre altele o selectare gradată a conceptelor, relațiile între concepte și marcarea automată a paginilor cu concepte. Aceasta este în special important pentru semantic web unde abordarea automată și ontologia vizibilă vor predomina.

Cazul businessului pentru cercetarea bazată pe ontologie și navigare este în special solid pentru intreprinderea virtuală, așa ca EnerSearch, a căror principale valori conducătoare este crearea și răspândirea cunoștințelor. Pentru acest tip de intreprindere, castigurile de la ontologiile implicate pot compensa riscurile importante tehnologice implicate in utilizarea tehnologiilor semantice avansate.

Organizarea virtuala asigura fondul testului prolific pentru validarea idelor care subliniaza managementul cunostintelor prin metodele semantice web. Ele au caracterstici generale fiind asa incat metodele semantice promit sa fie foarte benefice. EnerSearch este asa o organizatie virtuala cu cunostinte intensive in care una din cele mai importante idei ale businessului este sa produca si sa transfere cunostintele de la cercetatori la experti pentru industriile interesate. Astfel, managementul cunostintelor interioare, dar chiar mai important cele exterioare, este o functie principala in care metodele semantice pot dovedi ca fiind foarte utile.

3.9 O perspectivă de viitor: Exploatarea de la P2P Semantic web-ul pentru managementul cunoștințelor

În ultimii câțiva ani, se vede o crestere a interesului a potențialului ambelor computerizare P2P și utilizarea mai multor abordări formale la cunostințele managementului incluzînd dezvoltarea ontologiilor. În penultimul sub-capitol s-au discutat posibilitatile ambelor abordări care pot oferi mai multe cunostințe efective și eficiente a managementului. În special, se studiază cum cele 2 paradigme pot fi combinate.

Această lucrarea a prezentat un set de instrumente inovatoare pentru procesarea informației semantice și astfel pentru o mai selectivă și mai rapidă accesare a utilizatorului. Acest mediu de instrumente se adresează la 3 arii de discutii:

Căpătarea ontologiilor și legătura lor cu cantitățile mari de date.

Pentru motive de scalaritate acest proces poate fi bazat pe extragerea automată a informației și pe tehnologia procesării limbii naturale.

Pentru motive de calitate acest proces de asemenea necesită ființe umane în lanț pentru construirea și manipularea ontologiilor utilizînd editorii de ontologie.

Păstrarea și menținerea ontologiilor și exemplele lor

Se dezvoltă o schemă de depozitare RDF care asigură tehnologia datelor de bază și simpla formă de motivare a surselor de informare web.

Interogarea și navigarea semantică îmbogățită prin sursele de informare

Se dezvoltă un motor îmbogățit de cercetare semantică, navigare și instrumentele de împărțire a cunoștințelor care utilizează mașinile de procesare semantică a datelor asigurate de Semantic Web.

Tehnologia dezvoltată este văzută ca utilă într-un număr mare de studiu de caz. Este îmbunătățită accesarea informației și organizarea mai bună pe internet. Tehnologia este de asemenea utilizată pentru facilitarea partajării cunoștințelor tehnologice și reutilizarea pentru managementul relației clientului și managementul cunoștințelor într-o organizare virtuală.

Se observă de asemenea un număr mare de defecte în abordarea curentă. Ontologiile ajută la stabilirea terminologiilor în acordanța care sunt pe înțelesul tuturor utilizatorilor. Calculatoarele sunt apte să proceseze informația bazată pe semantica procesabilă a mașinii lor. Oamenii sunt apți să înțeleagă această informație bazată pe conectarea ei la semantica lumii reale. Cu toate acestea,construirea unor astfel de ontologii care sunt prelucrate înainte și rezultatul unei comune înțelegeri a grupurilor mai mari de utilizatori nu este o cerință minoră. Un model de „protocol” pentru conducerea rețelei care menține procesul elaborării ontologiilor este o adevărată provocare pentru a face Semantic Web o realitate. Cea mai mare muncă pentru ontologii le vede în termenii unei teorii izolate conținînd potențialul unui număr mare de concepte, relații și constrîngeri care în continuare vor detașa semanticile formale de la ele. Și invers, pentru a angaja potențialul lor complet pentru Semantic Web,ele trebuie realizate ca niște rețele intercalate care fac posibilă legătura cu necesitățile heterogene în procesul comunicării care este supus medierii. Rețeaua ontologiilor și natura lor semantică sunt acele care fac cercetarea necesară pe viitor. Astfel provocarea în munca curentă a ontologiilor este răspunsul la ce unește rețelele ontologiei împreună cu spațiul și timpul. În locul procesului principal sus-jos se cere un proces distribuțional al ieșirii și alinierii ontologiilor. Sprijinul propriu-zis metodologic și al instrumentelor pentru construirea rețelelor unde nodurile reprezintă ontologii mici și specializate departe de a fi bine înțelese în special nu pentru așa schimbări de mediu dinamic și zgomotos așa cum e web-ul în prezent și cum va fi în viitor. În acest sub-capitol, se descrie punctul de vedere în termenii setării pașilor viitori care trebuie parcurși pentru a aduce rezultatele descrise în capitolele de înainte în potențialul lor complet.

3.9.1 O viziune a managementului modern de cunostinte

Cunoștințele sunt unul din cel mai crucial factor pentru întrepriderea din prezent. Mai mult, managementul cunoștinîelor, este identificat ca strategic unei capacităti importante. Mai clar, MK este o cerere interdisciplinară, incluzînd resursele de management umane, organizarea întreprinderii și considerațiile culturale atat cât și IT. Cu toate acestea, este un consens răspîndit că IT-ul joaca un rol important ca un element de posibilitate pentru multe aspecte ale soluționării KM.

În trecut, IT-ul pentru managementul cunoștințelor era axat pe managementul cunoștințelor de container utilizînd documentele text ca principalele surse de cunoștințe depozitate. După cum s-a demonstrat în lucrare, tehnologia semantic web în special ontologiile și mașinile procesabile referitoare la date, pavează calea intensificării soluțiilor KM care sunt bazate pe cunoștințele semantice referitoare la granulozitate. Deși abordările timpurii ale KM bazate pe semantic web și soluțiile lor arată beneficiile ontologiilor și metodele relatate, însă există încă un număr mare de probleme deschise la cercetare care trebuie adresată ca să se facă tehnologiile semantic web foarte efective în timpul aplicării soluțiilor KM ca fiind discutate mai jos.

3.9.1.1 Integrarea cunoștințelor

Aplicațiile industriale KM necesită minimalizarea supra dezvoltarea de orice tip pe cît mai posibil. Deci o integrare fără obstacole a creării cunoștințelor, conținutului specificaței datelor meta, și accesarea cunoștințelor, de exemplu, răspunderea sau navigarea într-un mediu de muncă este cerută. Strategiile și metodele sunt necesare pentru sprijinirea creării automate a cunoștințelor sau semi-automat ca efectele activității care sunt oricum executate. Un exemplu de o astfel de abordare este utilă pentru formele care sunt generate din ontologii. Din moment ce elementele formate sunt apoi legate de ontologia subliniată, completarea acestor forme rezultă în crearea datelor meta a caror mape sunt direcționate spre ontologie.

3.9.1.2 Categorizarea cunoștințelor

Un nou domeniu care derivă din semantică are de-a face cu categoriile de intrare semnantice și relațiile cu obiectele prin observarea interacțiunilor utilizatorului sau modurile atitudinii utilizatorului și se ia în considerare contextul curent al utilizatorului. Altfel spus, semantica derivată este strâns legată de învățarea ontologiei în timp ce scopul ei este să reducă întrecerea construirii și menținerii ontologiei. Sistemul P2P de cunoștințe de management este ideal potrivită pentru a lua avantaje de la semantica derivată, deoarece multe acțiuni de lucru a cunoștințelor tipice au implicit semantica atasată la ele așa că:

Trimiterea mesajelor mail cu subiect descriptiv

Organizarea documentelor în dosare

Gruparea cunoștințelor

Dezvolatarea schematelor

3.9.1.3 Conștiința contextului

Accesarea atît cît și prezentarea cunoștințelor trebuie să fie dependentă de un context. Din moment ce contextul este setat de o cerintă curentă de business și astfel de procesare a businessului fiind manuită, o integrare strânsă a procesului managementului de business și managementul cunoștințelor este cerută. Abordarea KM care poate atinge elementele cunoștințelor asigură un punct promițător de început pentru serviciile deștepte de hotărâre care vor transmite activ cunoștințele relevante pentru executarea cerinței la mână. De exemplu, abordarea cerinței deștepte utilizează cunoștințele de cerere care sunt executate atât cât și conținutul documentelor fiind mînuit de răspunsurile dinamice definite propuse pentru cunoștințele depozitate. Răspunsurile transmise asigură cunoștințele care sunt de o mare impotanță pentru contextul dat, care este, cerinta executată și în documentele procesate. Astfel de transmitere a cunoștințelor dependente de context este de o abordare promițătoare pentru evitarea supraîncărcării cu informatii a cunoștințelor lucrătorului. Serviciile conștiente de localizare sunt o specializare a acestei tehnici. Ele asigură cunoștințele lucrătorului cu cele mai relevante elemente ale cunștințelor depinzînd de unde este ea/el situat, de exemplu, la temelia construcției site-ului sau la un târg comercial.

3.9.1.4 Personalizarea

Contextualizarea trebuie să fie completată de personalizare. Luând în considerare experiența utilizatorului și necesitățile lui/ei personale este o condiție esențială, pe de o parte, pentru evitarea supraîncărcării cu informații, și pe de altă parte pentru transmiterea cunoștințelor la nivelul corect de granulozitate. Din nou, tehnologia semantică web asigură o bază promițătoare din moment ce ontologiile și datele meta asociate transmit informații semantice despre atitudinea utilizatorului și interesele lui.

Personalizarea poate fi sprijinită de tehnologii așa ca statisticele și datele minierate. Cu toate acestea, soluțiile viitoare ale cunoștințelor managementului se vor baza pe aplicațiile mai sofisticate ale datelor minierate care sunt actual foarte explorate: depozitarea documentelor va fi minată de relații interesunte, date integratoare din lanțul de valori ale întreprinderii. De exemplu, răspunsul clientului trebuie să fie minat în conjuncție cu datele producției ca să se găsească greșelile în pașii urmăriți de sinestător.

3.9.1.5 Construirea cunoștințelor portale

Dezvoltarea cunoștințelor portale servind necesitățile companiilor sau comunității este mai mult sau mai puțin un proces manual. Ontologiile și datele meta relatate asigură baza concepției promițătoare pentru generarea acestor cunoștințe portale. Desigur, modelele conceptuale ale domeniului, utilizatorii și cerințele sunt necesare printre altele. Generația cunoștințelor portale trebuie completată cu evaluarea (semi)-automată a portalelor. Din moment ce mediul businessului și strategiile se shimbă foarte repede, portalele KM trebuie să fie updatate în acest mediu schimbător rapid. Evoluția portalelor include de asemenea aspectul uitării cunoștințelor vechi.

Soluțiile KM vor fi bazate pe combinația funcționalităților internetului și funcțiunilor mobile într-un viitor foarte apropiat. Tehnologiile semantic web sunt o abordare promițătoare pentru înfruntarea necesităților mediilor mobile, așa ca conștiința localizării personalizării și adaptarea prezentării informației la capacităti specifice a diviziunilor mobile, care sunt, prezentarea informațiilor cerute la un nivel apropiat de granulozitate. În esentă, angajatorii trebuie să aibă acces la aplicatiile KM oricând și oriunde. Cu toate acestea, ca sa fie posibil să aibă de-a face cu cantități mari de cunoștințe trebuie să fie serviți la diferite nivele de granulozitate. De exemplu, în timpul cercetării pe ecranul monitorului pot de asemenea aparea alte linkuri relatate și multe detalii, dar pe bara de sus trebuie sa fie restricționate părțile de cunoștințe până la minimum de simple.

3.9.1.6 Colectivele practicii

Imoprtanța împărtășirii cunoștințelor și re-utilizarea cunoștințelor de management pentru ca să se împărtășească cele mai bune practici și ca să se prevină dublarea eforturilor duce la un interes foarte mare a practicilor colective. Studiile recente de etnografie a practicelor de muncă indică modul în care oamenii actuali muncesc cateodată, diferă fundamental de modurile de organizare a muncii descrise în manual, schemele de organizare și descrierile muncii. Termenul „colectivul de practică” descrie grupurile informale aplicate în contextul cunștințelor de management. Ele în mod caracteristic nu sunt o comandă formală dar o rețea informală, fiecare împărtășind in parte o agendă comună și interese comune. Într-un exemplu, se regăsește faptul că o mulțime de cunoștințe împărtășite printre inginerii de fotocopiere au loc schimbări informale, deseori în jurul punctului de cafea. Atât cât și locale, comunitățile geografice, tind să aibă o muncă flexibilă și globalizarea duce la interesul sprijinului comunităților globale utilizand tehnologia internetului. Provocarea pentru organizații este să sprijine comunitățile și să le facă efective. Tehnologia Semantic Web poate fi utilizată pentru sprijinul comunităților de practică mai efectiv: ontololgiile, ca modele de domeniu consens adresează direct interesul pentru aceste comunități- cum sa reprezinte și să motiveze modelul lumii impărtășite sau conceptualizate.

3.9.1.7 Computerizarea P2P și implicațiile ei pentru KM

Computerizarea P2P combinată cu tehnologia semantică web va fi o alternativă interesantă și efectivă pentru o centralizare mai mare a soluțiilor KM care sunt implicate curent de soluțiile bazate pe ontologie. Termenul „P2P” devine obișnuit pentru IT până la jumatatea anului 2000. Aplicația pe larg responsabilă a fost Napster, o aplicație de copiere a muzicii. Multe aplicații similare P2P apar aproximativ în același timp, așa că Gnutella, Kazaa și Freenet. Aplicațiile P2P schimbă efectiv computerul individual al utilizatorului de la diviziunea primara de expoziție la o sursă activă de computerizare pe bază de internet. Succesul acestor aplicații inițial duce la interesul exploatării arhitecturii P2P în aplicațiile businessului. Uniformizând ciclul liber de CPU și capacitatea organizării dorinței PC, este anticipată, aducând o mare flexibilitate și o mai bună revenire de la investițiile companiei IT. Pe scurt, P2P permite înalta descentralizare a arhitecturii rețelei de calculator, și calculatoarele sunt apte să interacționeze unele cu altele cu un control mic sau centralizat.

Scenariile P2P se deschid pe calea derivării conceptualizarii consens printre angajatorii întreprinderii într-un mod de jos în sus. Soluțiile viitoare de cunoștințe ale managementului trebuie să fie aproape libere de administrație ca să poată fi utilizate de oricine incluzând personele private și companiile mici de cooperare probabil ca o parte a companiei virtuale. Se discută mai departe relațiile între tehnologia P2P și KM.

3.9.1.8 Organizațiile virtuale și influiența lor

Organizațiile virtuale devin tot mai mult importante în scenariile businessului caracterizate de decentralizare și globalizare. Evident, operabilitatea între diferite surse de cunoștințe așa ca increderea este un trebuie în aplicațiile KM inter-organizaționale. Procesul setării unei organizații virtuale poate avea de asemenea profit din descrierile semantice a competențelor și experiențelor partenerilor în perspectivă. Aceasta dă posibilitatea unei potriviri a procesului semantic selectând cea mai apropiată colectare de parteneri din grupul potențial de parteneri interesanți.

3.9.1.9 Sistemele de învățare

Integrarea în lina aplicațiilor KM, de exemplu, priceperea managementului cu învățarea, este un domeniu important care permite o mare întrepătrundere în aceste 2 arii. Soluțiile KM și Învățarea trebuie să fie integrate din ambele puncte de vedere organizațional și IT. Soluțiile KM care au o noțiune explicită a contextului și un profil al utilizatorului asigură un mediu excelent pentru comandarea situației de învățare la necesitățile specifice a celui care învață. Mai clar, interoperabilitatea și/sau integrarea standartelor de date(meta) a comunităților de învățare, de exemplu, LOM sau Ariadne, cu standartele de date meta semantice web sunt necesare pentru o astfel de integrare. Atașând datele meta semantice la modulele de învățare permite contextului configurația specifică a modulelor de învățare și adaptarea lor la necesitățile specifice utilizatorului. Desigur, ontologiile utilizate pentru specificarea modulelor de învățare a datelor meta trebuie să fie aliniate la ontologii definind contextul și profilul utilizatorului.

3.9.1.10 Grila Cunoștințelor

Domeniul aplicațiilor de mai departe a KM și Semantic Web va fi Grila de Cunoștințe în special cu privire la aplicațiile de știință. În subiecte așa ca genomie, astrofizică, bioinginerie și biochimie sunt surse masive de date, cu toate acestea acessul este mic la aceste date. Astfel, sursele acestor date sunt plagiate cu aceleași efecte așa că cunoștințele în WWW. Ele nu sunt aproape digerabile de software și de oameni și necesită o subliniere a infrastructurii așa încât oamenii să poată împărtăși mai bine experiențele, analizele fiind mai ușor refăcute, și datele fiind mai ușor integrate. De exemplu, portalele cunoștințelor pot fi utilizate la asistarea analiștilor la selectarea combinarea și gruparea cunoștințelor în domeniile științelor din viață. Din moment ce științele de viață evoluează foarte repede, așa cât și terminologia în domeniu, un important aspect de mai departe este asociația noilor cuvinte care sunt arătate în noile documente cu conceptele apropiate din perspectiva ontologică.

3.9.1.11 Evaluarea esențială intelectuală

Pentru determinarea rezultatelor managementului cunoștințelor și învățării, cunoștințele trebuie explicate în același mod ca și alte bunuri. Ca o parte principală evaluarea cunoștințelor va fi structurată prin evedențierea cunoștințelor în baza căreia evaluarea propriu-zisă este făcută.

3.9.2 O viziune asupra ontologiilor: semnificația rețelelor dinamice

După cum s-a argumentat mai devreme, ontologiile împreună cu 2 aspecte esențiale ajută la aducerea web-ului la potențialul lui deplin:

Ontologiile definesc semanticile formale pentru informații, în consecință permit procesarea informației de calculator.

Ontologiile definesc semanticele lumii reale, care fac posibilă legătura conținutului procesabil a mașinilor cu sensul pentru oameni bazat pe terminologiile consensuale.

În special, utlimul aspect este încă departe de a fi studiat la extinderea lui completă: cum pot fi utilizate ontologiile la comunicarea semanticii lumii reale între oameni și agenții artificiali? La răspunderea acestei întrebări se va demonstra că cea mai curentă muncă asupra ontologiilor este în parte nereușită, în faptul că ignoră probleme principale în construirea și utilizarea lor. Cea mai mare parte a muncii asupra ontologiilor în termenii teoriei izolate care acoperă potențialul mare de concepte și relații constrânge atașarea de mai departe a semanticii formale a lor. Aici se ia un punct de vedere mai larg a ontologiilor: Ontologiile trebuie să aibă o arhitectură de rețea și ontologiile trebuie să fie dinamice. Astfel ontologiile au de-a face cu:

Neomogenitatea în spațiu: ontologiile ca rețele de înțeles. Chiar de la început, neomogenitatea a fost o cerință esențială pentru rețeaua ontologică. Instrumentele cu care sunt tratate definițiile conflictuale și suportul solid în intervievarea teoriilor locale sunt esențiale pentru producerea tehnologiilor practicabile și scalarizate deoarece au fost tolerate greșit cu privire la hiperlinkare.

Dezvolatarea în timp: tehnologiile active. Originar, o ontologie trebuie să reflecte adevărul unui anumit aspect al realității. Aceasta a fost cerința sfântă a unui filosof să găsească un astfel de adevăr. În zilele noastre ontologiile sunt utilizate pentru schimbarea înțelesului între diferiți agenți. Ei pot doar asigura aceasta dacă reflectă consensul inter-subiectiv. Prin definiție, aceasta poate rezulta doar din procesul social. Pentru acest motiv, ontologiile nu pot fi înțelese ca un model static. O ontologie este mai cerută pentru schimbarea înțelesului deoarece shimbarea înțelesului poate influența și modifică ontologia . În consecință, evaluarea ontologiilor descrie un proces mai mult al modelului static. Având protocoalele pentru procesul evaluării ontologiilor este o adevărată provocare. Evaluarea în timp este o cerință esențială pentru ontologiile utile. Ca o practică a schimbărilor constante în fiecare zi a ontologiilor care transmit infomații necesită aceste procese să fie sprijinite solid de versificarea și trebuie însoțite de modelele procesului care ajută la organizarea evaluării consensuale.

În secțiunea următoare, se va lua un punct de vedere filosofic asupra ontologiilor, ajutând la clarificarea naturii lor propriu-zise. Apoi se va discuta în detaliu aspectele neomogenității în spațiu și timp.

3.9.2.1 Ontologiile și cum să scăpăm de un paradox

Un student la filosofie în anul întâi a auzit despre cercul vicios pentru explicarea posibilității noastre de a comunica cu ajutorul schimbării de înțeles și creând înțelegerea între ființele umane. Pe de o parte, oamenii pot doar să comunice și să schimbe ințelesurile bazate pe înțelegerea comună a simbolurilor și a intențiilor. Astfel un set convenit de simboluri și interpretări a consensului este o condiție esențială pentru comunicare. Pe de altă parte, un așa set de simboluri și interpretări, consensul poate fi doar stabilit ca rezultat al comunicării. Cu alte cuvinte, rezultatul unei comunicări cu succes în același timp, este o condiție principală pentru aceasta. În consecință, existența ei este cerută, pentru explicarea existenței ei. Studentul în anul întâi la filosofie poate de asemenea învăța cum să rezolve această situație paradoxală. Trebuie să fie un proces care subliniază faptul că luând ambele părți ca intermediare și mișcări frecvent repetate care se bazează pe ceva ce se transmite între extremități. Aceasta poate face o comunicare de succes și o împărtășire a înțelegerii setului doar a ambelor părți la aceeași monedă. Cititorul poate găsi argumentele ca fiind foarte filosofice. Cu toate acestea, se subliniază principalele diferențe între ontologiile văzute ca modele adevarate a lumii reale sau trepte într-un proces de evaluare a organizării consensului. Pentru acest motiv, un argument scurt al naturii ciclului de înțelegere și comunicare va fi apropiat. Dintr-o perspectivă abstractă filosofică se pare că este un miracol ca 2 ființe umane să se înțeleagă una pe alta. Înțelegerea și intenția nu poate fi schimbată sau exprimată direct. Dat nici nu se poate accesa înțelesul actual care este perceput și înțeles de partenerul nostru. Se poate doar exprima intenția prin unele acțiuni care influențează percepția partenerului. Se poate doar ghici, presupune că el înțelege prin analizarea atitudinii lui din moment ce este reflectat în percepția noastră.(Hegel,1812). Astfel, stabilirea înțelesului și comunicării este un proces prin definiție. Oamenii pot doar stabili înțelesurile împărtășite și le pot comunica între ei printr-un proces în care ei coordoneaza unele acțiuni ale lor pentru obținerea scopurilor comune. Deci încă de la început poate fi doar un proces social care creează înțelegerea împărtășită, care servește ca bază de schimburi a înțelesurilor și a simbolurilor de comunicare. Urmând acest argument este foarte clar că ontologia la care fiecare se înscrie nu există. Însă ontologiile apar ca o condiție esențială și rezultă din cooperarea în anumite domenii reflectând cererea, limitelor sociologice și ale domeniului. Web-ul împletește bilioane de oameni împreună ca să-i sprijine în necesitățile lor de informare. Similar, ontologiile pot fi văzute doar ca o rețea de ontologii împletite. Această rețea de ontologii a suprapus și a exclus parțile, și natura ei trebuie să fie dinamică deoarece dinamicitatea procesului este subliniată. Acest punct de vedere asupra ontologiilor ca rețea dinamică a înțelesului reprezentat formal este ceea ce se subliniază aici. Cea mai mare parte a muncii despre punctul de vedere asupra ontologiilor în termenii teoriei izolate care acoperă potențialul unui număr mare de concepte, relații și constrângeri este detașată de semantica formală de aici. Aici se ia un punct de vedere mai larg asupra ontologiilor. Pentru recapitulare, sunt 2 dimensiuni principale în care mediatorii de comunicare diferă de la munca actuală a ontologiilor: ontologiile trebuie să aibă o arhitectură a rețelei și trebuie să fie dinamice.

3.9.2.2 Neomogenitatea în spațiu:Ontologia și rețelele de înțelesuri

O insulă de înțelesuri trebuie împletită pentru a forma o structură complexă care permite schimbul de informații asupra domeniului, cerințele și limitele sociologice. Aceasta are 2 implicații practice. În primul rând sprijinul uneltelor trebuie să fie asigurate pentru definirea modelului domeniului local care exprima o obligație a grupului de agenți care împărtășesc un anumit domeniu și cerințe, și pot să fie de acord cu acest scop asupra punctului de vedere a unei lumi unite. O grămadă de muncă este deja făcută în acest domeniu și un sprijin metodologic important este valabil. În al doilea rând, aceste metode locale trebuie să fie împletite cu alte modele așa că practicele sociale ale agenților care utilizează ontologiile pentru facilitarea necesităților lor comunicaționale. Puțină muncă a fost facută în domeniul discutat. Nu se mai dicută despre o singură ontologie, dar despre o rețea de ontologii. Legăturile trebuie definite între aceste ontologii și rețeaua trebuie să permită suprapunerea ontologiilor cu conceptualizarea conflictorie, și chiar contradictorie. Încă de la început, neomogenitatea este o cerință esențială pentru această rețea ontologică. Uneltele care au de-a face cu definițiile contradictorii și sprijinul solid în intervievarea teoriilor locale sunt esențiale pentru a face această tehnologie practicabilă și scalabilă.

Gnutella, o rețea P2P este pentru cazul discutat. Agenții sunt capabili să intre și să plece din rețea dinamic. Ei de asemenea pot comunica cu mediul local al altor agenți. Această rețea este dinamic setată și prăbușită în conformitate cu necesitățile de unire a agenților din grup. Munca actuală asupra ontologiilor care se centreaza fie pe teoriile domeniilor locale sau pe principii, structuri și conținuturile stratului ontologiei de sus-dreapta sunt departe de a sprijini acest punct de vedere.Ce este necesar se centrează pe:

Conceptualizarea legăturii locale care are de-a face cu definițiile neomologice punctele de vedere personalizate

Sprijin în configurarea ușoară și re-configurarea acestor rețele în conformitate cu necesitățile de comunicare a coalițiilor agenților; și

Metodele și instrumentele care ajută agentii la organizarea consensului permițându-le schimbul de înțelesuri.

Ontologiile asigură comunicarea între diferiți agenți. Ele sunt „corecte” dacă îndeplinesc acest scop.

3.9.2.3 Dezvoltarea în timp: Ontologiile active

Originar, o ontologie trebuie să reflecte „adevărul” a unui anumit aspect din realitate. Este o cerintă sfântă pentru un filosof să găsească acest adevăr. Astăzi ontologiile sunt utilizate pentru schimburi de înțelesuri între diferiți agenți. Ele pot doar asigura aceasta dacă reflectă un consens inter-subiectiv. Prin definiție ele pot fi doar rezultatul unui proces social. Aceasta dă ontologiilor un statut dublu pentru schimbul de înțelesuri:

Ontologiile ca condiție esențială pentru consens. Agenții pot schimba înțelesurile doar când sunt deja de acord cu corpul împărtășit al înțelesului reflectând punctul de vedere consens în lume.

Ontologiile ca rezultat al consensului. Ontologiile ca modele consens a înțelesului pot deriva ca rezultat al procesului unde agenții sunt de acord cu un anumit model în lume și cu înterpretarea lui.

Astfel, ontologiile sunt atât o condiție esențială pentru consens și împărtășirea informației cât și rezultatele lor. Pentru acest motiv, ontologiile nu pot fi înțelese ca un model static.

3.9.3 P2P Ontologii și Cunoștințe

În economia actuală bazată pe cunoștințe, competivitatea întreprinderii și calității muncii de viață sunt direct legate de abilitatea de a crea efectiv și de a împărtăși cunoștințele atât în interiorul cât și în afara organizațiilor. În acestă secțiune se va discuta soluțiile pentru managementul de cunoștințe bazat pe integrarea paradigmei P2P cu accesul informației bazat pe ontologie care este tohnologia semantic web. În primul rând se discută neajunsul ambelor abordări în timpul realizării izolației. În al doilea rând se definește provocarea în combinarea lor și în sfârșit se schițează avantajele unei astfel de abordări unificatoare.

3.9.3.1 Neajunsurile ontologiilor și paradigmei P2P ca ontologii izolate

Computerizarea P2P este curent o tendință în intranet și în aplicațiile pentru internet. Analiști ca Gartner Group așteaptă creșterea rapidă a importanței pentru soluțiile managementului de cunoștințe în organizațiile și companiile mari. Companii ca Microsoft, IBM, Intel, SAP, HP au anunțat soluțiile primare în acest domeniu. Soluțiile derivate din P2P sunt potrivite în special pentru creșterea decentralizării naturale a organizațiilor actuale, fiind într-o singură întreprindere sau într-o rețea de organizații dinamice. Ele fac posibilă pentru diferiți participanți menținera diferitor puncte de vedere a lumii în timpul schimbului de informații. Ele de asemenea sustrag elemente asociate cu mai multe soluții tradiționale care se bazează pe un server sau pe un număr mic de servere centralizate. În același timp, deoarece se bazează pe cercetarea cuvântului cheie și o mai simplă reprezentare a tehnicilor de cunoștințe, astăzi soluțiile P2P sunt foarte limitate. Ele nu pot suporta usor introducerea noilor concepte facându-le dificile să determine dacă 2 termeni sunt echivalenți și în general pot sprijini doar nivelele automate limitate, toate tipurile de funcționalități în care tehnologiile semantice web sunt dispuse să le sprijine. Statutul curent a soluțiilor cunoștințelor de management sunt încă bazate pe un număr relativ mic de depozitări înalt centralizate a cunoștințelor cu ontologiile ca concepte de bază pentru cunoștințele incoerente.

În contrast computerizarea P2P oferă perspectiva schimbării multor din aceste limitări. Esenta lui P2P este că nodurile din rețea să exploateze direct resursele prezente la alte noduri ale altor rețele fără intervenția altui server central. Succesul extraordinar al rețelelor așa ca Napster și Gnutella, și de inițiativele industriei foarte vizibile așa ca JXTA lui Sun, atât cât și grupul de munca P2P incluzând HP, IBM și Intel au arătat că paradigma P2P e în special puternică atunci când vine să împărtășească file-urile de pe Internet fără vreo depozitare centrală, fără administrație centralizată și cu un file transmis dedicat numai necesităților utilizatorilor într-un mod viguros și scalabil. În același timp soluțiile prezente de P2P sprijină doar actualizarea limitată, cercetarea și functionalitatea recuperării. Soluțiile curente P2P au urmatoarele limitări:

În multe proiecte P2P este discutat ca o soluție la nivelul protocolar și cu ajutorul distribuirii spațiului pe disc. Cu toate acestea, aceasta este de o importanță minoră pentru îmbunătățirea serviciilor de cunoștințe ale managementului. Aici este de fapt actuală împărtășirea informației și cunoștințele care necesită să fie sprijinite și nu organizare a depozitării discului sau traficului de rețea.

Existând soluții așa ca Napster sau Gnutella ele asigură sprijinul limitat în informare și împărtășirea cunoștințelor. Napster sprijină doar cercetarea bazată pe cuvântul cheie a titlurilor muzicale și numelor de autor, Gnutela nu asigură vreun sprijin de cercetare definit anticipat. Fiecare client Gnutella este complet liber în modul cum interpretează problema.

Eforturile industriei conducătoare așa ca JXTA de Microsistemul Sun sunt limitate la serviciile P2P pentru o potrivire încordată. Nu este asigurat nici un sprijin pentru ontologiile împărtășite. Problemele sunt specificate în formatele arbitrare XML. Nu este nici un folos din utilizarea oportunităților de a folosi schema RDF/RDF pentru exprimarea vocabularului împărtășit. În final, limitele JXTA a răspunsurilor pentru utilizarea resurselor într-o localizare singură, în timp ce multe probleme necesită combinarea informației recuperate din diferite resurse a localizărilor diferite.

Selectarea nobilă curentă nu este bazată pe conținut. Aceasta necesită îmbunătățirea pentru problemele de rutină pentru cunoștințele viitoare nobile mai mult decât cele arbitrare.

Defecte fac și sistemele curente de P2P nepotrivite pentru cunoștințele împărtășirii scopurilor. Cheia pentru succesul combinării soluțiilor P2P cu tehnologiile semantice web este folosită pentru semanticele derivate. Semanticele derivate pot construi pe baza ontologiilor grele și/sau vizibile ce diferiți individuali, organizații și departamente au creat. Se consideră o suprapunere între definițiile ontologiilor și utilizarea conceptelor și relațiilor cu datele actuale pentru extragerea ontologiilor împărtășite pentru setarea individuală sau pe grupuri a oamenilor. Uneltele inteligente vor utiliza aceste definiții pentru a asigura că cunoștințele vor fi structurate apropiat așa încât să poată fi găsite usor. Cunoștințele de management pot avea loc într-un mod distributiv fără trecerea prin administrarea centrală.

3.9.3.2 Provocările integrării Peer to Peer a ontologiilor

Se are ca scop pentru cunoștințele de management bazate pe P2P abordarea care integrează avantajele tehnologiei cunoștințelor de management bazate pe semantic web dezvoltate în proiectele de succes IST așa ca Spre-Cunostinte, Knownet, sau Comma. Fig.3.6. ilustrează avantajele intenționate. Redă o comparație calitativă a beneficiilor adunate de utilizarea sistemului KM împotriva cantității de cunoștințe din acel sistem. Desigur, la ontololgiile modelelor explicite pot crește beneficiile aduse de orice soluție de cunoștințe a managementului, deoarece ele pot îmbunătăți acuratețea accesului cunoștințelor și împărtășirii lor. Cu toate acestea, solutiile descrise pot produce beneficii chiar la investiții zero-în contrast cu sistemele convenționale de cunoștințe a managementului care necesită o setare extensivă și scumpă a fazei. Depozitările cunoștințelor convenționale a managementului încă vor aparea ca și altele, un puternic egal în rețea. Deci, soluția combinării Semantic Web-ului cu P2P poate întotdeauna executa un sistem sofisticat dar centralizat conventional.

Provocările pentru o astfel de abordare sunt:

Serviciile selectării Peer-ului: Pentru a primi răspunsul corect fără a bombarda cu întrebări rețeaua trebuie să se întrebe corect Peer. Selectarea bazată pe mecanismele ontologiile trebuie să exploateze cu acest scop similaritatea ontologiilor.

Variațiile ontologiilor.Diferite Peer-urilor fi utilizate diferit, astfel suprapunând ontologiile. Alinierea, vizualizarea uneltelor și cartografierea poate fi regăsită în analizele cunoștințelor Peer-ului utilizând metodele derivate din domeniul semanticii derivate.

Lipsa preciziei ontologice. Ontologiile vor fi produse de diferite interacțiuni ale utilizatorilor așa ca clasificare în dosare sau utilizarea datelor meta. Definițiile ontologiilor vor fi nesigure și ontologiile „baltite”(ude) vor fi mai degrabă o normă decât o excepție. Un motor deductibil pentru aceste ontologii trebuie să fie capabil să întrebe și să răspundă la întrebările Peer-ului, într-un mod viguros, scalabil .

Alunecarea ontologică. În mediul P2P nu se poate aștepta la vreo menținere de ontologii. Ca rezultat, trebuie să se proiecteze mecanismele că să permită ontologiilor să se actualizeze singure pentru a face față la alunecarea ontologică. Bazată pe întrebări și răspunsuri în altă rețea a P2P ontologiile vor trebui să adapteze definițiile lor în conformitate cu acele rețele.

Fiecare din aceste provocări va necesită o cercetare importantă în tehnologia ingineriei ontologice.

3.9.3.3 Serviciul selectării Peer-ului

Este evident că succesul rețelei P2P constă în calitatea Peer-ului care fiecare membru a rețelei îl selectează.

Exemplu:Analiza investițiilor. Dacă un analist investitor din marketul TIME execută o întrebare specifică domeniului, este foarte improbabil ca o colegă de-a lui/ei care se specializeaze în domeniul științelor de viață să știe răspunsul. Corespunzător, întrebarea este mai degrabă îndreptată la colegii care lucrează în acest domeniu pentru a primi mai multe răspunsuri utile.

Selectarea Peer-ului în rețelele existente P2P este tipic bazată pe parametrii rețelei relatate, așa ca timpul ping, numărul de hopuri din rețea, etc.Este evident că într-o ontologie bazată pe serviciile P2P, se dorește mai degrabă selectarea Peer-ului pe baza proximității lor conceptuale asupra ontologiei lui-posibil incluzând informații contextuale.

Continuând exemplul de mai sus, se poate aștepta ca colegii să suprapună cerințele și de asemenea ontologiile deoarece descriu punctul lor de vedere al domeniului.

Deci, îndreptarea problemelor trebuie să depindă într-un fel de măsurarea similarității între ontologii care pot fi utilizate la selectarea Peer-ului cu ontologiile similare, astfel Peer-ul pare să aibă răspunsuri la întrebări sau Peer-ul pare să înteleagă problemele. Până aici nici o noțiune viguroasă a distanței conceptuale și similaritatea semantică între ontologii nu exista în literatura curentă; este necesară dezvoltarea și evaluarea.

3.9.3.4 Avand de-a face cu variațiile ontologice

Diferite Peer-e vor utiliza diferite deși suprapuse ontologii. Alinierea, artografierea și vizualizarea uneltelor vor trebui să facă fată diferitelor ontologii, chiar dacă nici o aliniere nu este explicit specificată.

Exemplu: Întreprinderea virtuală a studiului de caz. Doua SME-suri, să le numim proiectare.com și producere.com au fost de acord asupra cooperării și împărtășirii resurselor de cunoștințe pentru a vedea și a concluziona tehnologiile în marketurile lor. Deci, ele ambele au colectat anunțuri de producție, dar le-au analizat din diferite unghiuri, proiectare.com trebuie să știe ce posibilități îi oferă noile tehnologii(ce) în timp ce producere.com trebuie să știe cum să manuiască aceleași tehnologii noi(cum). Ce-ul și Cum-ul se referă la diferite puncte de vedere a conceptelor în 2 organizații diferite.

Câteva din alinieri și cartografieri pot fi regăsite în analizele cunoștințelor Peer-ului utilizând metodele domeniului derivat a semanticelor derivate.

Clasificare a acelorași anunțuri sub diferite concepte la 2 companii diferite poate fi explotată prin propunerea unei alinieri mai generale între ce-ul lui proiectare.com și cum-ul lui producere.com. Cu atât mai mult, se poate traduce automat întrebările „ce” pentru proiectare.com în „cum” pentru producere.com permițând utilizatorului să navigheze 2 Peer-uri și ontologiile lor în timp ce este reamintit vizual despre sublinierea diferențelor și punctelor comune.

3.9.3.5 Concluzia riguroasă

Aplicațiile curente bazate pe ontologie se bazează pe o inginerie atentă a termenilor în ontologie. Termenii sunt definiți atent pentru a obține relații maxim utile și clare între ele. Toate tehnicile curente de deducție pentru ontologii se bazează pe aceste relații pure. Același lucru ține de aplicațiile curente bazate pe ontologiile multiple. Ontologiile multiple pot fi curent integrate într-o inginerie atentă și îndemânată.

În setarea P2P, ontologiile vor fi obținute prin o mică intervenție umană sau deloc. Aceste ontologii deci, nu vor avea aceeași înaltă calitate ca ontologiile curente ingineriate uman, și multe din relațiile din ontologie vor fi incomplete sau chiar incorecte. De exemplu, definițiile claselor inferioare nu vor fi sigure sau exemplele uneori vor fi clasificate nereușit. Ca rezultat multe din tehnicile deductibile existente esuează la producerea rezultatelor utile a ontologiilor „ude”. Chiar și un exemplu clasificat nereușit este suficient pentru nevalidarea relațiilor din clasele inferioare, și chiar o valoare gresită pentru un singur atribut este suficient pentru a face o clasă neconsistentă.

Exemplu: Analizele investițiilor: Un analist investitor în TIME market poate eronat să clasifice greșit informația despre compania daneză Excel Dată în categoria „Software spreadsheet”. Cunoștințele complementare pot descrie ca Excel dată este o companie și deci, teoria logică este neconsistentă, conducând la răspunsurile arbitrare „logice în cel mai rău caz” la orice întrebare, de exemplu ca Bill Gates este un produs.

Ce este necesar pentru setarea P2P sunt formele mai viguroase care fac față cantităților limitate ale incompletății și inconsistenței. Așa tehnici viguroase deductibile vor fi apte să identifice când o relație de clasă inferioară „aproape se ține”, sau când o ontologie este „aproape consistentă”. Continuând exemplul, clasificare greșită a Excel Data și inconsistentă corespunzatoare trebuie „conținută” în mici nișe. Apoi răspunsurile greșite despre Excel Data vor fi date, iar Bill Gates încă nu se va ști ca fondator al Microsoftului.

Munca existentă în domeniul reprezentării cunoștințelor într-o concluzie aproximativă și conținutul local al inconsistenței sunt așteptate ca să asigure scheletul cerut pentru atacarea problemei motivării cu ontologiile „ude”.

3.9.3.6 Manuirea alunecării ontologice

Alunecarea ontologică este un fenomen natural care apare aproape în fiecare domeniu.

Exemplu: Analizele investitorii. Noțiunile despre capacitățile software-ului și hardware-ului s-au schimbat simțitor în marketul TIME in timp de câțiva ani. Primul comerț aproape exclusiv se referea la businessul vanzărilor consumatorului. Între timp s-a schimbat și înțelesul sau și astăzi de asemenea include business sper business, consumator la consumator, business la angajator, etc,interacțiuni.

O astfel de alunecare ontologică înseamnă că ontologiile trebuie menținute constant. Trebuie regulat actualizate definițiile termenilor și relațiilor într-o ontologie. O astfel de menținere este posibilă cu ajutorul aplicațiilor curente deoarece ele toate angajează o singură ontologie într-o localizare centralizată.

Într-un mediu P2P nu se poate aștepta ca să se întâmple vreo menținere a ontologiilor. Ca rezultat, trebuie să se proiecteze mecanismele care permit ontologiilor să se actualizeze singure, ca să facă față alunecării ontologiei. Bazată pe întrebări și răspunsuri din o altă rețea P2P, ontologiile vor trebui să-și ajusteze definițiile în conformitate cu rețelele: dacă o altă ontologie dă un răspuns diferit la întrebare, este posibilă o actualizare; e posibil bazată pe o încredere de la altă ontologie; facând aceasta pe o scară alunecoasă a definițiilor cu o adevărată valoare; utilizarea metaforelor din domeniul științei sociale.

Combinarea ontologiilor și a paradigmei P2P poate asigura direcțiile promițătoare pentru cercetările de viitor și dezvoltarea uneltelor discutate în posibilitățile de mai jos.

3.9.4 P2P pentru cunoștințele de management

Se propune dezvoltarea și validarea soluțiilor bazate pe managementul cunoștințelor P2P unde cunoștințele sunt actualizate și cercetate într-un mod complet decentralizat, astfel mișcându-ne de la limitările soluțiilor curente a managementului de cunoștințe, care sunt organizate în jurul unui singur sau a unui numar mic de grupuri de cunoștințe centralizate. Pentru acest scop trebuie să se rezolve serviciile selectării Peer-ului bazate pe structura cunoștințelor și a conținutului.

3.9.4.1 P2P pentru ontologii

Tehnologiile ontologice trebuie mișcate la nivelul următor prin permiterea semanticii derivate de la modul în care cunoștințele sunt accesate și utilizate. Ontologiile centralizate sunt prea statice în timp ce ele sunt definite într-un proces lent și centralizat în timp ce interesele/perspectivele utilizatorilor reflectă schimbări rapide și frecvente. Se propune dezvoltarea tehnologiilor ontologice care dă participanților libertatea de a utiliza structurile lor ontologice. Sistemul Cunostințelor de management P2P este apt să ia avantaje din diferențe. Vor veni dinamic cu ontologii care constituie numitori comuni pentru grupurile de participanți atât cât și propuneri pentru cartografierea între ontologii. Astfel se poate ajunge la concluziile semantice fără ontologiile centralizate.

3.9.4.2 Ontologiile pentru cunoștințele de management P2P

Cu soluțiile bazate pe P2P , abordările existente bazate pe cunoștințele managementului ontologic nu rămân aceleași. Ontologiile dau participanților acuratețea pentru găsirea răspunsurilor la problemele lor, dar ontologia utilizată trebuie schimbată; de exemplu: concluzionarea ontologiei trebuie adaptată sau tehnicile vizualizării noi trebuie investigate ca să aibă de-a face cu distincția între ontologiile locale și cele împărtășite. Utilitatea semanticelor derivate da o libertate participantului, dar uneltele ontologice trebuie adaptate la întâlnirea provocârilor noilor paradigme.

3.9.4.3 Construirea comunităților

Deoarece comunitățile nu sunt definite de „ce depozitare tu folosești” dar mai degrabă de „ce cunoștințe sunt mai importante pentru tine”, oamenii au posibilități noi de a forma comunități luând avantajele comunicării ale P2P.

În ultimii câțiva ani, se vede o creștere a interesului pentru computerizarea P2P și utilizarea abordărilor mai formale la cunoștințele managementului, incluzănd dezvoltarea ontologiilor. În același timp, nimic nu s-a făcut pentru combinarea puterii acestor abordări.

Se începe prin discutarea a catorva cerințe principale pentru cunoștințele managementului eficient și efectiv. Apoi se examinează cerințele ontologiei ca schimb de comunicație și informație a rețelelor heterogene și dinamice. Se propune o combinație de ontologii și paradigme P2P ca un mod de a oferi mai multe capacități ale intensificării cunoștințelor managementului.

Argumentul a fost acela că doar prin aducerea împreună a Semantic Web și a tehnologiei P2P se poate complet realiza potențialul lor la intensificarea dramatică a capacităților oferite de soluțiile cunoștințelor managementului de astăzi.

Capitolul IV. Prezentarea aplicației

4.1 FORMULAREA PROBLEMEI: Posibilă clasificare Ontologică a Proiectelor de Cercetare și Dezvoltare disponibile în România

În acest capitol este prezentată o soluție posibilă a unui exemplu practic, care se bazează pe tehnologia Ontologică prezentată în capitolele precedente. Ca domeniu de realizare a fost aleasă mulțimea proiectelor de cercetare și dezvoltare disponibile pe teritoriul României. Această mulțime include mai multe tipuri de proiecte, fiecare din ele având un set de caracteristici proprii, unele fiind specifice, altele comune pentru toate. Studiind modul de descrierea a lor pe Internet am putea menționa lipsa unei structuri integrate care va permite utilizatorului o navigare rapidă prin conținutul acestora. Sau, altfel spus, dacă un utilizator doreste să-și caute un proiect cel mai potrivit, el trebuie să se bazeze numai pe navigarea și parcurgerea mai multor site-uri. De aici se deduce similitudinea problemei cu cea descrisă în capitolele precedente, care se referă la dificultatea găsirii informației, și care este unul din dezavantaje principale ale Web-ului actual.

Surse majore a de informare în domeniu sunt Site-uri de specializare:

www.cncsis.ro

http://www.finantare.ro

http://www.academiaromana.ro

http://www.mct.ro

http://www.infoeuropa.ro

Pentru crearea Ontologiei a fost analizată structură semantică a Proiectelor și dedusă următoarea ierarhie a claselor (varianta HTML a fost generată cu ajutorul utilitarului Protege) prezentată în Figura 4.1.

Cu toate că Ontologia obținută a fost populată numai cu patru Instanțe care conțin înregistrările de tip „Grant”, important este că descrierea claselor este folosită pentru înțelegerea semantică a datelor decătre mașini.

4.2 REZUMATUL SOLUȚIILOR

O soluție perfectă pentru o astfel de problemă va fi crearea unei singure Ontologii, care va fi folosită de către toți utilizatorii, însă, cum este menționat și în capitolele precedente, această variantă pare cel mai des imposibilă, inexistența unei singure organizații coordonatoare de proiecte elaborate, fiecare având la bază criterii diferite. A doua variantă de rezolvare apare atunci când fiecare organizație va crea o Ontologie proprie, și atunci problema se pune astfel încât apare nevoia de un modul de Aliniament, la fel descris în capitolele precedente. Însă aceste două soluții (cu o singura Ontologie, sau cu mai multe în cadrul fiecărei organizații), cu toate că par perfecte, nu reflectă situația actuală în care se află baza informațională din acest domeniu. În realitate avem o mulțime de baze de date, fiecare fiind coordonată de organizația proprietară. Interfața cu utilizatorul fiind posibilă doar prin intermediul interogărilor, și paginilor generate dinamic, care nu mai conțin structura inițială a relațiilor din bazele de date. Așadar, soluția propusă în această lucrare se bazează mai mult pe situația reală creată în domeniului Proiectelor de Cercetare și Dezvoltare în România. Pașii necesari soluționării problemei sunt următorii:

Crearea unor tehnici de extragere a Ontologiei din sursele altor site-uri care conțin informația despre Proiecte. Tehnicile trebuie automatizate, deoarece volumul de date poate fi destul de mare, iar prelucrarea lor manuală poate fi costisitoare.

În cazul în care proiectantul acestor tehnici obține acces legal la Bazele de Date a tutoror organizațiilor, accesul la ele poate fi cu succes realizat de către serverul Ontologic, care va uni toate sursele eterogene de stocare a datelor, și va furniza la ieșire acces la depozitul astfel obținut prin intermediul protocoalelor SOAP sau HTTP. Așadar, se realizează o unificare și în pasul următor nu se mai ține cont de forma de reprezentarea a Datelor Inițiale.

În cazul în care proiectantul nu are access la Datele Fizice, e nevoie de tehnici de extragere automată din sursele în format HTML. În prezent există tehnici de acest gen, doar că se pune problema adoptării lor astfel încât la ieșire sa se obțină un depozit într-un format RDF (preferabil), sau eventual în formatul unei Baze de Date. Ambele soluții, ca și în subpunctul precedent, ușor se integrează în Depozitul Serverului Sesame, ce permite integrarea datelor, și procesarea lor ca fiind un singur Depozit de Date.

Etapa a doua a problemei stabilite se referă la mulțimea aplicațiilor care pot accesa Ontologia și o pot folosi pentru realizarea diferitelor scopuri. Specific problemei managementului de cunoștințe este faptul că fiecare Agent sau Aplicație software poate avea structură și scopuri diferite, însă reprezentarea Ontologică este acceptată de către ei ca o soluție comună de reprezentare a Cunoștințelor și Datelor. Din punct de vedere Software, în această etapa se recomandă folosirea tehnologiei „Sesame”, în cazul dat acesta poate fi folosit și ca un Framework aparte sau ca Framework-ul de dezvoltat de Hewlett-Packard, care se numeste „Jena”. O altă soluție poate fi realizată și cu ajutorul tehnologiei XML, și anume XSL-ului, care poate fi redefinit astfel încât să înțeleagă sintaxa RDF-ului ce va da posibilitatea generării interfeței cu utilizator prin intermediul HTML-ului. Deoarece acest domeniu este destul de vast în lucrarea de față este folosit numai Fraimwork-ul „Jena”, celelalte soluții au fost descrise ca posibile direcții alternative de dezvoltare.

4.3 TEHNOLOGII PRINCIPALE

Aplicația prezentată în continuare înglobează mai multe instrumente de dezvoltare cum ar fi:

Tehnologia Java și mediul de dezvoltare Jbuilder;

RDF limbaj de descriere a resurselor

Protege – editor Ontologic

Framework-ul Jena pentru crearea aplicațiilor Web-ului Semantic;

RDQL – limbaj pentru interogarea RDF-ului;

Tehnologia Java:

Pentru partea aplicativă tehnologia java este folosită din două motive. Primul este legat de independența de platformă pe care o oferă aceasta tehnologie. Al doilea motiv este legat de Framework-ul Jena dezvoltat de Hewlett-Packard, care este realizat sub forma pachetelor Java. Ca mediu de dezvoltare a fost folosit JBuilder, datorită facilităților oferite .

(http://java.sun.com).

RDF:

Modelul Resource Description Framework (RDF), are un statut de recomandare dat de către W3C, are ca scop standardizarea legată de definirea și folosirea metadatelor, care descriu resursele Web-ului. Ca urmare, RDF este la fel de bun și pentru reprezentarea datelor. Un dezavantaj mare a RDF-ului este lipsa mecanismului de reprezentare a relațiilor prin axiome.

Un bloc de bază constructiv al RDF-ului este — tripletul «obiect — atribut — obiect», care este des notat sub forma A(O,V). Se citește astfel: obiectul O are atributul A cu mărimea V. Această relație mai poate fi reprezentată sub forma unei muchii notată cu A, care leagă două noduri, O și V: [O]-A—>[V]. Notația aceasta este destul de folositoare, pentru că RDF-ul ne dă posibilitatea să schimbăm locurile obiectelor cu al atributelor. Așadar, orice obiect poate juca un rol de atribut, care în prezentarea grafică corespunde unui lanț cu două muchii marcate (http://www.w3.org/RDF).

Protege:

Protege-ul este unul dintre cele mai puternice Editoare de Ontologii din prezent, reprezentând o soluție foarte puternică cu licență generală. Alt avantajul il prezinta numeroasele plugin-uri pentru diverse scopuri accesibile pe site-ul oficial. Majoritatea au un scop translator al datelor în alte formate precum: XML, UML, Jena, Sesame, etc(http://protege.stanford.edu).

Framework-ul Jena reprezintă un mediu de programare pentru RDF, RDFS și OWL, incluzând și un motor de inferență bazat pe reguli. Jena este open source și a aparut din lucrările de cercetare ale „HP Labs Semantic Web Programme”. Fraimwork-ul Jena (http://jena.sourceforge.net) include:

API-urile pentru RDF;

Citirea și scrierea grafurilor RDF sub forma lor inițială de Tripleturi;

API-urile OWL;

Stocarea în memoria temporară și permanentă.

RDQL

Limbajul RDQL (http://www.w3.org/Submission/2004/SUBM-RDQL-20040109) prezintă un limbaj foarte puternic de interogare a grafurilor RDF. Sintaxa acestuia este usor de înțeles, pentru că este asemănatoare cu SQL, însă modul de funcționare și căutarea prin Tripleturile RDF, necesită experiență, și nu este atât de asemănator cu Bazele de Date.

4.4 Prezentarea Aplicației „Onto-Poiect”

Aplicația prezentată în continuare cu denumirea „Onto-Proiect”, are ca scop prezentarea unei soluției posibile de Interfață de Căutare a proiectelor de Cercetare și Dezvoltare. Datorită complexității acestui domeniu aplicația nu prezintă o soluție finală de aplicație cu utilizator, ci un prototip a acestuia, cu câteva funcții de bază care explică ideea principală de acces la Ontologie. Mai mult, cele 3 funcții de bază demonstrează multe din ideile teoretice descrise în capitole precedente, una dintre care este Interoperabilitatea.

4.4.1 Prezentarea Generală

În Figura 4.2 este arătată arhitectura generală care stă la bază Interacțiunei care are loc între aplicația „Onto-Proiect” și Ontologii.

Cum se vede și din tabel toate interacțiunile au sensuri biderecționale, de la Redactorul Ontologic „Protege” pâna la aplicația cu Interface cu utilizator „Onto-Proiect”. Dezvoltarea aplicației s-a început cu construirea Ontologiei Proiectelor (Figura 4.1) cu ajutorul instrumentului Protege (Figura 4.3). Acest proces nu este ireversibil, și Ontologia poate fi schimbată la nevoie oricând. După ce Ontologia este creată ea se convertește din format specific Protege-ului în format RDF.

Mulțimea fișierelor RDF am numit ca „Depozitul Ontologic”, ce fizic reprezintă un derectoriu cu fișierele necesare. Am prezentat Depozitul sub forma unei structuri stratificate, care are la baza sintaxa XML-ului, această reprezentare specifică și faptul că cele două straturi prezentate, la randul lor, pot fi updatate cu alte straturi superioare dacă e nevoie.

Framework-ul Jena accesează fisierele RDF, prin metode proprii încorporate, și realizează, astfel o comunicare între RDF și aplicația „Onto-Proiect”. Interogarile RDQL, pot fi stocate și prelucrate în modelele care se află în memoria temporară, gestionate decătre Jena.

Aplicația „Onto-Proiect” prezintă o implementare a Frameworkului Jena și tehnologiilor Java. Figura 4.4 prezintă o diagramă UML, generată automat de Jbuilder, prezintă structura generală a claselor și metodelor utilizate. De menționat și locul pachetelor Jena, și metodelor accesate din acesta.

Ea realizează două funcții principale accesând fișierul RDF prin Frameworkul Jena. A treia funcție prezintă un Analizator de cod XML, și accesează codul fișierului .rdf direct, arătând interoperabilitatea metodelor XML.

Așadar 3 funcții de bază a aplicației sunt:

Căutarea proiectului dorit după 4 cuvinte cheie, prin parcurgerea grafului RDF automat cu ajutorul Framework-ului Jena și cu ajutorul Interogării prin limbaj RDQL;

Căutarea avansată permite căutarea după introducerii directe a codului limbajului RDQL:

Parserul (Analizatorul) XML parcurge nodurile fișierului RDF, afișând toate nodurile și valorile acestora.

Funcția cea principală „Căutare” (Figura 4.5) a Interfeței aplicației permite utilizatorului să-și caute Proiectul dorit dintr-o mulțime de proiecte diferite, după un anumit numar de cuvinte cheie.

4.4.2 Prezentarea Interfeței

În tabela următoare am prezentat meniul principal al aplicației cu funcțiile ei de bază.

Meniului „Utilitare”, aceasta incluzând trei funcții principale ale aplicației.

În fereastra „Căutare” (Figura 4.5) avem mai multe câmpuri în care trebuie introduse cuvinte-cheie, pentru o căutare în fișierul RDF, care în cazul nostru reprezintă o ontologie despre granturi, ce are o structură complet semantică, dar conține doar câteva înregistrări (numarul acestora poate fi extins la nevoie) pentru a simplifica prezentarea. Apăsând butonul o.k. va fi afișată lista celor mai potrivite granturi, și anume Denumirea și câte un link din Internet care arată unde se află documentul. Criteriile de Interogare și de Afișare, la fel pot fi extinse în faza de proiectare a aplicației. Aici e important să subliniem că Ontologia descrisă este realizată în limbajul RDF, care poate fi ușor îmbunătățit și cu alte straturi Ontologice, precum limbajul OWL, care este la fel suportat de către Framework-ul Jena, ce practic înseamnă că aplicația dată va rula la fel de bine și pe limbajul OWL.

Fereastra „Căutare avansată” (figura 4.6) este dedicată utilizatorilor avansați, care vor introduce codul RDQL direct. Rezultatul va fi afișat după apăsarea butonului o.k. Funcția aceasta poate fi de folos atât pentru testarea Ontologiei, cât și pentru răspunderea la întrebări mai detaliate, care nu pot fi incluse in cadrul ferestrei „Căutare”. Rezultatul se afișează în forma Tripleturilor (nodurilor) care au forma (x; y; z), unde „y” este prezentat ca o legatura între „x” și „z”.

Fereastra „Parser XML”, prezintă un exemplu de parcurgere a fișierului RDF, cu ajutorul Parserului (Analizatorului) XML. Acest exemplu, dovedește noțiunea de interoperabilitate prezentată în capitolele anterioare (Figura 4.7), prin faptul că nodurile fișierului RDF sunt parcurse de către parserul XML. Simularea de față arată că Ontologia poate fi bine utilizată de către mulțimea aplicațiilor care acceptă formatul XML, însă adevărata putere a ei se dovedește numai prin utilizarea instrumentelor specifice limbajelor Ontologice, precum Jena sau Sesame.

4.4.3 Direcțiile viitoare de dezvoltare

Aplicația „Onto-Proiect” face parte din mulțimea aplicațiilor posibile din domeniu a proiectelor de Cercetare și Dezvoltare. În Figura 4.8 sunt prezentate posibile direcții de dezvoltare a altor aplicațiilor folosind tehnologiile prezentate în aceasta lucrare. Aceste direcții sunt:

Construirea mai multor straturi de adâncime Ontologică, cu ajutorul limbajelor OWL, OIL, DALM, Logica descriptiva, etc. De remarcat că Framework-ul Jena înțelege structura OWL-ului, de acea acest strat de adâncime nu necesită schimbarea structurei prezintate în Figura 4.8.;

Alte aplicații, se referă la mulțimea altor funcții nerealizate în aplicația „Onto-Proiect”;

Agenții pot fi dezvoltati în paralel cu celelalte aplicații, doar în multe cazuri necesită construirea mai multor straturi de adâncime semantică.;

O direcție destul de interesantă în acest domeniu poate fi prezentată de către tehnologia Servleturilor Java, care înglobează funcțiile și facilitățile Framework -ului Jena. Aceasta va permite o navigarea distribuită cu ajutorul protocoalelor a Ontologiei, sau a rezultatelor interogării a acesteia.

Concluzii

În ziua de azi Web-ul este reprezentat ca o mulțime de documente de tip Hipertext legate între ele cu ajutorului linkurilor. Limbajul de markare html „explică” browserului cum anume trebuie să fie afișat documentul vizualizat, și nu prezintă nici într-un fel informațiile privind conținutul lui. După ideile fondatorului, Webul Semantic va permite agentului artificial să prelucreze informația nu numai după structura ei, ci și după conținut.

Scopul pe care îl are Berners-Lee este întradevăr genial – el vrea să transforme Webul contemporan într-un creier gigantic, care să aibă toate cunoștințele, pe care la un moment actual le posedă omul. Fiecare utilizator va fi capabil prin efectuarea unui singur clic să ajungă la informația dorită. După părerea lui Berners Lee deja în anul 2005 Webul Semantic trebuie să schimbe Web-ul actual. Aceasta înseamnă că Web-ul va fi capabil să înțeleagă solicitările într-un limbaj natural. Tehnologia nouă va scuti utilizatorul de necesitatea alegerii unui singur link între mai multe găsite greșit. Acum utilizatorii vor lansa agenții, care pas cu pas vor filtra conținutul, memorând linkurile utile.

Nici aceasta nu este tot. Aplicațiile-Agente vor ajuta în căutarea cumpăratorilor și respectiv vânzătorilor avantajoși, vor lega cercetătorii de restul lumii, pentru că se știe că majoritatea descoperirilor au apărut la granița între mai multe științe. Din păcate cercetătorii, care aparțin domeniilor diferite, sunt disjuncți, pentru că vorbesc limbi diferite – aceiași termeni pot avea înțelesuri diferite în domenii diferite. Rețeaua nouă va fi ca un Babilon legendar, în care cercetătorii vor putea comunica, și nu numai comunica, ci și înțelege unul pe altul.

În lucrarea de față am studiat domeniul Web-ului Semantic, și am încercat să prezint ideile de bază a acestora în conextul denumirii lucrării, „Sistem de Informare bazat pe reprezentare ontologică a cunoștințelor”. Pentru un exemplu aplicativ am ales domeniul Proiectelor de Cercetare și Dezvoltare și consider că am putut rezolva problema definită în această lucrare, pentru că am reușit să construiesc un prototip al aplicației ce poate interoga Ontologii de nivelul RDF prin intermediul limbajului RDQL. Soluția propusă poate fi văzută ca o soluție posibilă a problemei puse și poate corespunde acestei definiții. Din punct de vedere al cercetării domeniului ales, am descris în lucrarea de față principalele direcții de dezvoltare ale Web-ului Semantic și am indicat tehnologiile preferabile pentru aceasta, cum ar fi: Sesame, Jena, RDF, RDQL, XSLT, OWL etc.

Anexa

Cod fisierilor RDFS:

Clase.rdfs

<?xml version='1.0' encoding='UTF-8'?>

<!DOCTYPE rdf:RDF [

<!ENTITY rdf 'http://www.w3.org/1999/02/22-rdf-syntax-ns#'>

<!ENTITY kb 'http://protege.stanford.edu/kb#'>

<!ENTITY rdfs 'http://www.w3.org/2000/01/rdf-schema#'>

]>

<rdf:RDF xmlns:rdf="&rdf;"

xmlns:kb="&kb;"

xmlns:rdfs="&rdfs;">

<rdfs:Class rdf:about="&kb;Academia_Romana"

rdfs:label="Academia_Romana">

<rdfs:subClassOf rdf:resource="&kb;National"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Cercetare"

rdfs:label="Cercetare">

<rdfs:subClassOf rdf:resource="&kb;Tip_Proiect"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Cu_Terti"

rdfs:label="Cu_Terti">

<rdfs:subClassOf rdf:resource="&kb;National"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Dezvoltare"

rdfs:label="Dezvoltare">

<rdfs:subClassOf rdf:resource="&kb;Tip_Proiect"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Finantare"

rdfs:label="Finantare">

<rdfs:subClassOf rdf:resource="&kb;National"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Grant"

rdfs:label="Grant">

<rdfs:subClassOf rdf:resource="&kb;National"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Guvern_Romanesc"

rdfs:label="Guvern_Romanesc">

<rdfs:subClassOf rdf:resource="&kb;Finantare"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;International"

rdfs:label="International">

<rdfs:subClassOf rdf:resource="&kb;Cercetare"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;N_Eorupean"

rdfs:label="N_Eorupean">

<rdfs:subClassOf rdf:resource="&kb;Nivel"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;N_National"

rdfs:label="N_National">

<rdfs:subClassOf rdf:resource="&kb;Nivel"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;N_Regional"

rdfs:label="N_Regional">

<rdfs:subClassOf rdf:resource="&kb;Nivel"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;National"

rdfs:label="National">

<rdfs:subClassOf rdf:resource="&kb;Cercetare"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Nivel"

rdfs:label="Nivel">

<rdfs:subClassOf rdf:resource="&kb;Dezvoltare"/>

</rdfs:Class>

<rdfs:Class rdf:about="&kb;Proiect"

rdfs:label="Proiect">

<rdfs:subClassOf rdf:resource="&rdfs;Resource"/>

</rdfs:Class>

<rdf:Property rdf:about="&kb;Proiecte_Slot_7"

rdfs:label="Proiecte_Slot_7">

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

<rdfs:Class rdf:about="&kb;Tip_Proiect"

rdfs:label="Tip_Proiect">

<rdfs:subClassOf rdf:resource="&kb;Proiect"/>

</rdfs:Class>

<rdf:Property rdf:about="&kb;denumire"

rdfs:label="denumire">

<rdfs:domain rdf:resource="&kb;Proiect"/>

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

<rdf:Property rdf:about="&kb;durata"

rdfs:label="durata">

<rdfs:domain rdf:resource="&kb;Proiect"/>

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

<rdf:Property rdf:about="&kb;post_direct_proiect"

rdfs:label="post_direct_proiect">

<rdfs:domain rdf:resource="&kb;Proiect"/>

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

<rdf:Property rdf:about="&kb;tip_finantare"

rdfs:label="tip_finantare">

<rdfs:domain rdf:resource="&kb;Proiect"/>

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

<rdf:Property rdf:about="&kb;varsta_maxima"

rdfs:label="varsta_maxima">

<rdfs:domain rdf:resource="&kb;Proiect"/>

<rdfs:range rdf:resource="&rdfs;Literal"/>

</rdf:Property>

</rdf:RDF>

Instante.rdfs

<?xml version='1.0' encoding='UTF-8'?>

<!DOCTYPE rdf:RDF [

<!ENTITY rdf 'http://www.w3.org/1999/02/22-rdf-syntax-ns#'>

<!ENTITY kb 'http://protege.stanford.edu/kb#'>

<!ENTITY rdfs 'http://www.w3.org/2000/01/rdf-schema#'>

]>

<rdf:RDF xmlns:rdf="&rdf;"

xmlns:kb="&kb;"

xmlns:rdfs="&rdfs;">

<kb:Grant rdf:about="&kb;Proiecte_Instance_10"

kb:durata="2"

kb:post_direct_proiect="Doctor in Stiinte"

kb:tip_finantare="Buget de Stat"

kb:www="http://www.fsea.ugal.ro/proiect1.htm"

kb:varsta_maxima="35"

rdfs:label="Proiecte_Instance_10">

<kb:denumire>Program Pentru Proiecte Multianuale de Cercetare Stiintifica/Creatie Artistica Pentru Tineri Tip-AT</kb:denumire>

</kb:Grant>

<kb:Grant rdf:about="&kb;Proiecte_Instance_11"

kb:durata="3"

kb:post_direct_proiect="Doctor in Stiinte"

kb:tip_finantare="Buget de Stat"

kb:www="http://www.fsea.ugal.ro/proiect2.htm"

kb:varsta_maxima="70"

rdfs:label="Proiecte_Instance_11">

<kb:denumire>Program Pentru Proiecte Multianuale de Cercetare Stiintifica/Creatie Artistica- Tip A</kb:denumire>

</kb:Grant>

<kb:Grant rdf:about="&kb;Proiecte_Instance_12"

kb:durata="3"

kb:post_direct_proiect="doctorat"

kb:tip_finantare="Buget de Stat"

kb:www="http://www.fsea.ugal.ro/proiect3.htm"

kb:varsta_maxima="30"

rdfs:label="Proiecte_Instance_12">

<kb:denumire>Program Pentru Proiecte Multianuale de Cercetare Stiintifica/Creatie Artistica Pentru Tineri Doctoranzi tp-TD</kb:denumire>

</kb:Grant>

<kb:Grant rdf:about="&kb;Proiecte_Instance_13"

kb:durata="3"

kb:post_direct_proiect="Conferentiar"

kb:tip_finantare="Buget de Stat"

kb:www="http://www.fsea.ugal.ro/proiect4.htm"

kb:varsta_maxima="65"

rdfs:label="Proiecte_Instance_13">

<kb:denumire>Program Pentru Proiecte Multianuale de Cercetare Stiintifica/Creatie Artistica- Tip A_Consortiu</kb:denumire>

</kb:Grant>

</rdf:RDF>

Cod RDQL:

Pentru fereastra Căutarea:

select ?z ?www where

(?x,<http://protege.stanford.edu/kb#www>,?www)

(?x,<http://protege.stanford.edu/kb#denumire>,?z)

(?x,<http://protege.stanford.edu/kb#varsta_maxima>,?varsta_maxima)

(?x,<http://protege.stanford.edu/kb#durata>,?durata)

(?x,<http://protege.stanford.edu/kb#tip_finantare>,?tip_finantare)

(?x,<http://protege.stanford.edu/kb#post_direct_proiect>,?post_direct_proiect)

AND ?varsta_maxima<="30"

AND ?durata<="3"

AND ?tip_finantare=~/Buget/||?tip_finantare=~/Stat/i

AND ?post_direct_proiect=~/doctorat/i

Bibliografie:

[1] Dieter FENSEL, Ontologies: A Silver Bullet for Knowleadge Management and Electronic Commerce, Springer 2004.

[2] IEEE INTELEGENT SISTEMS; MAY/JUNE 2003; From Open IS Semantics to the Semantic Web: The Road Ahead.

[3] http://www.w3.org/Submission/2004/SUBM-RDQL-20040109/

[4] Michael C. Daconta, Leo J. Obrst, Kevin T. Smith: The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management, Published by Wiley Publishing, Inc., Indianapolis, Indiana 2003.

[5] John Davies, Dieter Fensel, Frank van Harmelen: TOWARDS THE

SEMANTIC WEB Ontology-driven Knowledge Management, JOHN WILEY & SONS, LTD 2003.

[6] http://www.openrdf.org/index.jsp

[7] http://phpxmlclasses.sourceforge.net/rdql.html

[8] http://jena.sourceforge.net/documentation.html

[9] http://protege.stanford.edu/protege-rdf/protege-rdf.html

[10]Grigoris Antoniou, Frank van Harmelen: A Semantic Web Primer (Cooperative Information Systems): The MIT Press (April 1, 2004).

[11]Stefan Tanasa, Cristian Olaru, Stefan Andrei: Java de la 0 la expert, editura Polirom 2003.

Copyright Notice

© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.

Acest articol: . Sistem de Informare Bazat pe O Reprezentare Ontologica a Cunostintelor (ID: 161370)

Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.

. Sistem de Informare Bazat pe O Reprezentare Ontologica a Cunostintelor

Copyright Notice

Datumul Geodezic

Proiectarea Unei Centrale Fotovoltaice de 50kw

Simularea cu Mef a Comportarii Barelor cu Pereti Subtiri cu Senele cu Sectiuni Z Continue Peste Reaze

Transmisia

Simularea Configuratiei Electronice a Elementelor

Optimizarea Procesului de Testare a Produselor Intr O Firma Producatoare de Cablaje Auto

Copyright Notice

Similar Posts