Conducator științific : Asist. Dr. Ing. Alexandru Butean Îndrumător: Asist. Dr. Ing. Alexandru Butean Absolvent: Nică Elena Specializarea :… [601677]

1
UNIVERSITATEA “LUCIAN BLAGA” DIN SIBIU
FACULTATEA DE INGINERIE
DEPARTAMENTUL DE CALCULATOARE ȘI INGINERIE ELECTRICĂ

PROIECT DE DIPLOMĂ

Conducator științific : Asist. Dr. Ing. Alexandru Butean
Îndrumător: Asist. Dr. Ing. Alexandru Butean

Absolvent: [anonimizat] : Calculatoare

– Sibiu, 2016 –

2
UNIVERSITATEA “LUCIAN BLAGA” DIN SIBIU
FACULTATEA DE INGINERIE
DEPARTAMENTUL DE CALCULATOARE ȘI INGINERIE ELECTRICĂ

SISTEM PENTRU DETECȚIA
INFECȚIILOR NOSOCOMIALE
FOLOSIND ÎNVĂȚAREA
AUTOMAT Ă

Conducator științific : Asist. Dr. Ing. Alexandru Butean
Îndrumător: Asist. Dr. Ing. Alexandru Butean

Absolvent: [anonimizat] : Calculatoare

– Sibiu, 2016 –

3

4

5

6

7
Cuprins
CAPITOLUL I. INTRODUCERE …………………………………………………………………………………….. 9
1.1 Prezentarea temei …………………………………………………………………………………………………… 9
1.2 Motivația alegerii temei ………………………………………………………………………………………… 10
1.3 Cerințe generale …………………………………………………………………………………………………… 11
1.4 Utilitate ……………………………………………………………………………………………………………….. 11
CAPITOLUL II. CONSIDERAȚII TEORETICE ……………………………………………………………… 12
2.1 Infecții nosocomiale ……………………………………………………………………………………………… 12
2.1.1 Infecții nosocomiale – definiție ………………………………………………………………………… 12
2.1.2 Surse de agenți patogeni …………………………………………………………………………………. 13
2.1.3 Moduri și căi de transmitere …………………………………………………………………………….. 14
2.1.4 Clasificări ………………………………………………………………………………………………………. 14
2.1.5 Măsuri de prevenire ………………………………………………………………………………………… 15
2.2 Antibiograme. Analize medicale. Proceduri …………………………………………………………….. 16
2.2.1 Antibigrama …………………………………………………………………………………………………… 16
2.2.2 Analize medicale ……………………………………………………………………………………………. 17
2.2.3 Proceduri medicale …………………………………………………………………………………………. 17
2.3 Sisteme de detecție a infecților spitalicești ………………………………………………………………. 19
2.4 Informatică medicală …………………………………………………………………………………………….. 22
2.5 Impactul științei calculatoarelor în medicină ……………………………………………………………. 26
2.5.1 Introducere …………………………………………………………………………………………………….. 26
2.5.2 Utilizarea calculatorului ………………………………………………………………………………….. 27
2.5.3 Avantajele calculatorului utilizat în medicină …………………………………………………….. 30
2.6 Învățarea automată ……………………………………………………………………………………………….. 31
CAPITOLUL III. DEZVOLTARE ………………………………………………………………………………….. 33
3.1 Cercetare în domeniu ……………………………………………………………………………………………. 33
3.1.1 Control of Nosocomial Infections By Data Mining ……………………………………………. 33
3.1.2 Learning from imbalanced data in surveillance of nosocomial infection ………………. 35
3.1.3 Automated detection of nosocomial infection: evaluation of different strateg ies in an
intensive are unit 2000- 2006 ……………………………………………………………………………………. 38

8
3.1.4 Automatic Detection of Patients with Nosocomial Infection by a Computer -Based
Surveillance System:A Validation Study in a General Hospital ……………………………………. 40
3.1.5 Predicting Nosocomial Infection by Using Data Mining technolo gies ………………….. 42
3.1.6 Comparison of Automated Strategies for Surveillance of Nosocomial Bacteremia … 44
3.1.7 Artificial Intelligence Techniques for Monitoring Dangerous Infections ………………. 45
3.2 Concluzii în urma cercetării …………………………………………………………………………………… 46
3.3 Proiectarea sistemului …………………………………………………………………………………………… 47
3.3.1 Algoritmi folosiți ……………………………………………………………………………………………. 47
3.3.2 Analiza și specificarea cerințelor ………………………………………………………………………. 49
3.3.3 Proiectarea bazei de date …………………………………………………………………………………. 50
3.3.4 Arhitectura sistemului …………………………………………………………………………………….. 54
3.4 Dezvoltarea aplicatiei ……………………………………………………………………………………………. 57
3.4.1 Mediul de dezvoltare ………………………………………………………………………………………. 57
3.4.2 Structura modulelor …………………………………………………………………………………… 60
3.4.3 Interfața cu utilizatorul ……………………………………………………………………………………. 67
CAPITOLUL IV. CONCLUZII ………………………………………………………………………………………. 70
4.1 Experimente și rezultate …………………………………………………………………………………….. 70
4.2 Limitări ……………………………………………………………………………………………………………. 71
4.3 Dezvoltări ulterioare ………………………………………………………………………………………….. 71
4.4 Participare la concursuri …………………………………………………………………………………….. 72
CAPITOLUL V. BIBLIOGRAFIE ………………………………………………………………………………….. 73

9
CAPITOLUL I. INTRODUCERE

1.1 Prezentarea temei

Infecția nosocomială este acea infecț ie contractată în unitățile sanitare cu paturi care se
supraadaug ă bolii pentru care pacientul s -a internat, la 48 de ore de la internare sau 30 de zile de
la externare. Infecțiile intra spitalicești determină un procent ridicat al mortalității și morbidității
pacienților în aceste spații.[1] De aceea se fac numeroase st udii și se încearcă combaterea
acestora sau măcar detectarea precoce pentru a economisi atât resurse, timp cât și cel mai important viața pacienților. Frecvența cea mai ridicată și consecințele cele mai grave ale
infecțiilor nosocomiale se înregistrează în secțiile de terapie intensivă. Global estimările din
ultimii 10 ani arată că 5,5 -7,5 % din totalul pacienților internați contactează infecții nosocomiale.
În România, rapoartele (cele oferite de spitale) sunt doar 0,2 -0,25%. Aceste date sunt relativ mici
deoarece activitatea de identificare, evaluare și validare a unei infecții dobândite în spital este
greoaie, medicul epidemiolog neavând la dispoziție instrumente informatice valide care să -i
sprijine munca .

În momentul de față , în spitalele din România supravegherea infecțiilor se face manual de
către personal medical specializat, astfel riscul unei erori sau al omiterii acestora este inevitabil.

10
De aceea proiectul propune dezvoltarea unui sistem ce poate detecta persoanele predispuse
infecției, în urma unei analize asupra bazei de date, folosind algoritmi de inteligență artificială.
Conform cercetării asupra sistemelor similare am constatat că trecerea la detecția
computerizată urmată de verificarea unui medic, a salvat mai mul t de 65% din timpul
personalului responsabil de detecția infecțiilor și au identificat infecții mult mai rapid decât metoda manuală. Cele mai multe infecții care au fost ratate de supravegherea calculatorului ar fi
putut fi identificate cu adăugări și core cții la modelele logice medicale
.
Se estimează că aproximativ 4 100 000 de pacienți contactează o infecție nosocomială în UE
în fiecare an. [19] Numărul deceselor de cel puțin 37 000 reprezintă o consecință directă a acestor
infecții. Cele mai frecvente sun t infecții ale tractului urinar, urmate de infecții ale tractului
respirator, infecțiile de după intervențiile chirurgicale, infecțiile fluxului sanguin și altele.
Aproximativ 20 -30% din aceste infecții pot fi prevenite prin programe intensive de igienă și
control.

1.2 Motivaț ia alegerii temei

Infecțiile nosocomiale au un mare impact asupra procentului de mortalitate, în special în
secțiile de terapie intensivă, unde prezența acestora este semnificativ mai mare. Acest fapt se
datorează condiției clinice g rave a pacientului care duce la efectuarea procedurilor invazive și
tratamentele intensive prelungite. Aceste motive fac controlul și prevenirea infecțiilor nosocomiale importante pentru instituțiile de sănătate.
Întotdeauna am avut dorința de a ajuta oam enii și cred că medicii și personalul medical
sunt cei care pot oferii cel mai mult ajutor persoanelor, pentru care aceștia sunt ultima speranță.
Prin acest proiect se poate aduce un ajutor atât pacienților cât și cadrului medical. Astfel pot să
fructifi c informațiile dobândite pe parcursul facultății ajutând unitatea sanitară să -și desfășoare
activitatea mai ușor.
În prezent infecțiile nosocomiale sunt depistate standard de către un personal medical pe baza
unor analize ale căror rezultate au ieșit din limitele admise și de asemenea starea pacientului
infectat prezintă simptome specifice.

11
În concluzie, am ales acest proiect pentru a începe o schimbare în această direcție, pentru
ca supravegherea infecțiilor nosocomiale să capete o importanță și pentru ca riscul expunerii la
aceste infecții să fie diminuat.

1.3 Cerinț e generale

Momentan nu există sistem computerizat de supraveghere, dar se urmărește dezvoltarea
acestei probleme, realizând analize în laboratoare mult mai corect și eficient, așa ajutând foarte
mult la depistarea infecției. De asemenea se urmărește dezvoltarea unui sistem mult mai avansat din punct de vedere administrative al monitorizării și supravegherii naționale a infecțiilor
nosocomiale .
Sistemul propune de zvoltarea unui sistem ce poa te înlocui într -o bună parte act ivitatea
personalului medical răspunză tor. Astfel sistemul pe baza datelor introduse de personalul
medical face corelații și încearcă să detecteze pacientul cu cea mai mică probabilitate de
infectare.

1.4 Utilitate

Medicina este una din ramurile importante ale lumii, avâ nd numeroase subdomenii
fiecare dintre ele ocupându- se cu o parte a corpului uman. Infecț iile nosocomiale pot ataca întreg
corpul, nu există o anumită secțiune de acț iune, a tacă zona mai sensibilă . Astfel acest subiect este
prezent î n toate subdomeniile medic inei, devenind foarte important atunci când scopul principal
este vindecarea pacientului și nu agravarea situaț iei. Un sistem bine supravegheat ș i un sistem de
management bine pus la punc t pot min imiza sansele de apariție a unei astfel de infecții .
În concluzie un sistem de detecție a infecțiilor nosocomiale ajută mult în tratarea bolilor,
dând sansa medicului să -și analizeze cazul cor espunzător. Pe lângă aceasta se economisește
foarte mult timp a l personalul medical, fiind necesară doar o supraveghere a sistemul.

12
CAPITOLUL II . CONSIDERA ȚII TEORETICE

2.1 Infecții nosocomiale
2.1.1 Infecții nosocomiale – definiț ie

Infecția nosocomială sau infecția intraspitalicească , este acea infecție care nu este
prezentă sau care nu se află în perioada de incubație în momentul în care pacientul s -a internat în
spital și se supraadaugă bolii pent ru care pacientul s -a internat.[1]
Infecțiile nosocomiale pot să fie în legătură cu deficiențe de igienă, steriliza re, manevre
sau îngrijiri medicale. Acest tip de infecție se produce într -un spital, fie între pacienți de boli
diferite care ajung în contact unii cu alții, fie de la bolnavi sau purtători proveniți din rândul
personalului de îngrijire. De obicei această infecție este post -operatorie.[1]
Infecțiile nosocomiale se manifestă clinic pe parcursul internării actuale, dar este posibil
să se manifeste și după externare. În patologia infecțioasă generală, rata acestor infecții este de 5 –
20% , incidența maximă, de 28-30%, apare în serviciile de reanimare. Aceste infecții sunt
responsabile de 70% din decesele înregistrate în serviciile de chirurgie generală. Infecțiile
nosocomiale sunt de obicei severe, deoarece sunt implicați germeni de spital multirezistenți la
antibiotice și afectează persoane cu diverse deficiențe de organ sau imunodeprimați. Pentru ca o
infecție să fie considerată nosocomială, ea trebuie să apară în 48 de ore, sau mai mult, de la
internarea în spital, sau în maximum 30 de zile de la externare. [1]
Etimologia cuvântului "nosocomial" (spitalicesc) se regăsește în limba greacă, în
cuvântul nosokomeion , în care ( nosos = boală, iar komeo = a îngriji).[1]
Inciden ța este î n creștere peste tot î n lume, cauzele sunt comune dar ș i diferite, î n raport
cu gradul de dezvoltare a l unei țări sau regiuni. Teoretic, orice agent patogen din lumea
virusurilor, bacteriilor, parazi țiilor sau micetelor, pot produce infecție nozocomial ă, în funcție de:
– condițiile generale dintr -o unitate medico -sanitară,
– natura gazdelor umane,
– particularită țile agenților patogeni circulanți,

13
– specificul prestațiilor efectuate,
– situația din populația generală, etc.
În mod frecvent cele mai grave infecții nosocomiale sunt cauzate de agenți patogeni cu
rezistență mare în mediu, iar pentru unele bacterii, aceasta se caracterizează prin plurirezistență
la antibiotice (stafilococi, E.coli, Klebsiella, Proteus, Pseudomonas aeruginosa, Yersinia,
Campylobacter ). La acestea se adaugă virusurile hepatice, HIV, virusurile cu poarta de intrare la
nivelul căilor respiratorii, micete, paraziți etc.

2.1.2 Surse de agenți patogeni

Infecț iile nosocomiale pot provenii de la:
-bolnavi cu boli netransmisibile – care pot prezenta forme atipice de boală transmisibilă sau
sunt purtători de agenți patogeni;
-bolnavi cu boală transmisibilă – care pot fi purtători ai altor agenți patogeni.

În infecții nosocomiale, purt ătorii de agenți patogeni , în afară celor 3 categorii clasice
(preinfecțioși, să nătoși și foști bolnavi), se mai clasifică și în raport de zona anatomică pe care o
colonizează în:
– nazali,
– faringieni,
– nazofaringieni,
– tegumentari,
– fecali,

14
– urinari,
– vaginali.
Sursele de agenți patogeni pot proveni din următoarele categorii populaț ionale:
– personalul medico -sanitar de bază,
– stagiari (medici, studenți, elevi),
– personalul auxiliar ( întreținere, bucătărie, spălătorie, magazii)
– vizitatori.
2.1.3 Moduri și căi de transmitere

Modul direct presupune transmiterea agenților patogeni prin r elații între bolnavi, între
aceștia ș i personalul medico -sanitar, cu ocazia efectuării diferitelor prestații și în cadrul „modului
de viață” specific serviciilor de asistență spitalicească sau de ambul ator, cu aglomerații și condiții
igienico -sanitare cu risc.
Modul indirect este predominant de oarece, frecvent, intervin agenți patogeni cu
rezistenț ă mare, av ând astfel posibilitatea de a fi vehiculați prin aer, apă, pulberi de sol, obiecte
(inclusiv instrumente medico -chirurgicale, mobilier, elementele băilor și WC -urilor, ter mometre,
spatule), medicamente ș i produse biologice cu administrare fracț ionată și expuse contaminării;
deasemeni, m âinile bolnavilor și diferitelor categorii de personal care vi n în raport cu aceș tia.[2]

2.1.4 Clasific ări

Sectoarele din spital cu risc crescut de infecții nosocomiale sunt:
-secțiile de ATI(Anestezie și terapie intensivă);
-secțiile de chirurgie – arsuri;
-secțiile de hematologie -oncologie.

Formele clinice cele mai frecvente de infecții nosocomiale sunt:
-infecțiile urinare
-infecții de cateter
-pneumonii

15
-infecțiile plăgilor operatorii.

2.1.5 Măsuri de prevenire

Măsurile preven ționale generale includ:
– preocup ări pentru ca proiectarea și realizarea construcțiilor pentru asistența medico -sanitar ă să
dispună de circuite multiple și alte facilită ti care s ă evite diseminare a agenților patogeni;
– asigurarea unei igieniz ări zilnice corecte, decontaminare, dezinsecție și deratizare periodică ;
– folosirea corect ă a circuitelor pentru persoane și materiale;
– reglementarea accesului vizitatorilor;
– asigurarea unor operațiuni corecte de preg ătire și efectuarea steriliz ării instrumentarului și a
altor materiale;
– păstrarea în rezerv ă a unor antibiotice cu spectru larg pentru intervenția de urgenț ă în caz de
infecție nosocomial ă produs ă de agenți rezistenți la antibioticele utilizate.[2]

În cazul apariției unei îmbolnă viri de tip nosocomial se va efectua, cu caracter de urgenț ă:
 ancheta epidemiologic ă, intervenții epidemiologice, clinice și cu laboratorul pentru
depistarea și izolarea bolnavilor;
 se vor institui mă suri de protecție a celorlalti bolnavi, mai ales cei cu risc;
 se suspendă intern ările;
 se desf ăsoară investigații complexe pentru depistarea și eliminarea cauzelor care au
determinat îmbolnă virile;
 se suspendă total sau parț ial, pe termene variate, activitatea serviciului, timp în care se
vor efectua renovă ri și reprofil ări;
 în cazul repet ării unor episoade epidemice, unitatea poate fi desființat ă;
 educația și instruirea personalului medico- sanitar va completa procesul de combatere.[2]

16
2.2 Antibiograme. Analize medicale. Proceduri

2.2.1 Antibigrama
Antibiograma este o metodă care stabilește pe o cultură bacteriană de laborator
sensibilitatea sau rezistența unei bacterii față de un antibiotic , care este preconizat de a fi folosit
în tratamenul bolii, cauzate de bacterie. Eficiența unui tratament cu antibiotice este condiționată
în primul rând de sensibilitatea agentului patogen față de an tibioticul respectiv, fapt apreciat in
vitro prin antibiogramă.[1 3]
Există 2 metode prin care se poate determina sensibilitatea germenilor la antibiotice:
metoda difuzimetrică (Kirby -Bauer) și metoda diluțiilor (MIC — concentrația minimă
inhibitorie). Cea mai frecvent utilizată datorită simplității și costului redus este metoda
difuzimetrică.[1 3]

Metoda difuzimetrică se bazeaz ă pe proprietatea substanț elor antimicrobiene de a difuza
în mediul de cultur ă dat, în care se î nsămânțează cultura de testat. În aceast ă metod ă se
recomand ă utilizarea unui mediu Mueller -Hinton f ără glucoz ă. Pentru a realiza aceast ă metod ă se
depune o cantitate de substan ță antimicrobian ă pe suprafa ța unui mediu de cultur ă, pe care s -a
însămânțat bacteria de testat. În acest moment se produc 2 fenomene: substanț a antimicrobian ă
difuzeaz ă și bacteria cre ște. În zonele î n care substan ța antimicrobian ă realizeaz ă concentra ții
mai mari dec ât concentra ția minimă , bact eria nu cre ște. Astfel î n urma test ării o tulpin ă
bacterian ă poate fi definit ă în raport cu un medicament ca fiind:
 sensibilă -atunci câ nd concentra ția minim ă inhibitoare este de 2 -4 ori mai mic ă
decât nivelul medicamentului)
 rezistentă – dacă concentra ția minim ă inhibitoare este mai mare decâ t nivelul
medicamentului
 intermedia ră (moderat sensibi lă) dacă concentra ția minimă inhibitoare este
apropiat ă de nivelul medicamentului.

17
Metoda difuzimetric ă este mai u șor de executat, mai economică și asigur ă o
reproductibilitate de aproximativ 90% . [6]

2.2.2 Analize medicale

Infecțiile pot fi determinate de microorganisme cum ar fi: bacterii, paraziți, virusuri sau
ciuperci. Antibioticele pot trata o infecție declanșată de o bacterie dar datorită contactulu i repetat
cu acestea pe parcursul tratamentului, bacteriile devin mai puternice și își modifică
sensibilitatea. Antibiograma fiind analiza ce se recomandă pentru a determina ce antibiotic
distruge bacteria. Această tehnică se realizează în laborator, test andu- se sensibilitatea bacteriilor
la antibiotice. Spre exemplu: o infecție nosocomială a căilor urinare; în acest caz se recoltează urină, apoi se multiplică bacteriile din produsul prelevat pe medii de cultură și sunt testate pe mai
multe antibiotice. Me dicul de laborator va stabili o listă cu tratamente posibile însă doar
specialistul va da pacientului indicațiile de tratament în funcție și de alte criterii. De obicei aceste teste sunt gata în 48 de ore. Însă testul antibiogramei se realizează doar dacă s-a constatat în
urma analizelor că numărul de leucocite din corpul pacientului este mare. [7]

2.2.3 Proceduri medicale

Metodologia de supraveghere în sistem sentinela a infecțiilor nosocomiale și a rezistenței
microbiene[5]
Sistemul sentinela – metodă utilizată pentru estimarea unei incidențe reale a
infecțiilor nosocomiale.
SEPTICEMIA:
 pacient care are cel puțin o hemocultură pozitivă pentru un patogen identificat;
SAU

18
• pacient care are cel puțin unul din simptomele: febră , frisoane, hipotensiune
ȘI
• 2 hemoculturi pozitive pentru g ermeni care fac parte din floara normală a
tegumentului ;
Această metodă este folosită pentru că este rentabilă în supravegherea sănătății publice
prin supervizarea detaliată a activității, de asemenea are un cost redus.
Pentru a declara că o infecție este prezentă în secția respectivă, aceasta trebuie susținută
de teste de diagnostic. În cazul în care testele dovedesc că exisă infecție se vor colecta date atât
despre pacient (data internării, sex, vârstă, data externării, diagnostic,etc.) cât și despre infecția
nosocomială apărută (tipul,data apariției, etc.). Toate datele sunt completate în fișa specială.
De asemenea și datele din laborator conturează infecția nosocomială. La nivelul
laboratoarelor se fac teste pe antibio tice determinând sensibilitatea sau rezistența acestora la
anumite bacterii.

Atribuții și flux informațional
1.Unitatea- sentinela.
 Managerul – coordonează și monitorizează supravegherea infecțiilor nosocomiale și
rezistența microbiană pe secțiile de semnate ;
 Medicul șef al secției sentinela –implementează și coordonează activitatea sistemului;
 Medicul șef al compartimentului de prevenire și control al infecției nosocomiale –
organizează sistemul de supraveghere prin desemna rea echipei de lucru, atribuții pentru
fiecare, instruirea personalului, alegerea formularelor utilizate etc.;
 Medicul șef al laboratorului de microbiologie – organizează realizarea investigațiilor.
2.Direcția de sănătate publică județeană
• Alege persoana ce asigură suport tehnic profesional;
• Implementează metodologia folosită.

19
3.Centrele regionale de sănătate publică
• Intruie ște direcțiile sanitare teritoriale;
• Validează datele din fi șierele de supraveghere.
4.Institutul Național de Sănătate Publică
• Asigură coordonarea metodologică a supravegherii infecțiilor nosocomiale;
• Elaborează și pune la dispoziție centrele de sănătate publică regionale, formatul de
raportare a bazelor de date, fișa de supraveghere, materiale;
• Pregătește baza materială.

2.3 Sisteme de detecție a infecților spitalicești

Existența sistemelor de prevenire a infecțiilor nosocomiale în sănătate pot contribui la
îmbunătățirea calității serviciilor de sănătate. De asemenea, pot reduce costurile cu tratament pentru pacienții îmbolnăviți. Analiza informaților disponibile permite prevenirea eficientă a
acestor infecții și să clădească noi cunoștințe care pot ajuta la identificarea eventualelor infecții
nosocomiale.
Infecțiile nosocomiale au un mare impact în mortalitate, în special în secțiile de terapie
intensivă, unde prezența infecțiilor nosocomiale este semnificativ mai mare. Aceasta se întâmplă
pentru că sistemul imunitar este compromis la pacienții din această unitate, de altfel și prezența
procedurilor invazive și tratamentele folosite. Aceste motive fac controlul și prevenirea
infecțiilor nosocomiale importante pentru instituțiile de sănătate. Deci prezența acestor infecții poate fi folosită la evaluarea calității serviciilor.
Sunt mai mulți factori care contribuie la prezența infecțiilor nosocomiale: starea de
imunitate a pacientului, vârstă, durata de spitalizare, administrarea medicamentelor, diagnosticul
și metodele de tratare, etc. Pe lângă asta, mulțimea de microorganisme existente în unitatea de
sănătate, pentru că și un mic defect în programu l de prevenire a infecțiilor poate contribui ușor la
apariția infecției.

20
Prin urmare prevenirea infecțiilor nosocomiale este foarte importantă. Această p revenire
poate fi indeplinită de efectuarea predicției folosind date ce sunt capabile să caracterizeze starea
pacientului, ca și perioadă de spitalizare și procedurile efectuate în cursul acestei perioade.
Prevenirea și controlul infecțiilor nosocomiale se face prin supravegherea epidemiologică
ce constă în colectarea, prelucrarea, analiza, interpretarea datelor necesară pentru cunoașterea
factorilor de risc și detecția infecților nosocomiale.
În cazul unei infecții nosocomiale medi cii din spitale trebuie să c onfirme asta prin
diagnosticare , menționând în actele medicale. Șefa asistentă din fiecare secție tr ebuie să
completeze Fișa cazului de infecție nosocomiala fiind ulterior verificată corectitudinea
datelor. [5]
Aceste fișe completate vor fi trimise Compartimentului de Supraveghere și Control a
infecțiilor nosocomiale.
Personalul din Compartimentului de Supraveghere și Control a infecțiilor nosocomiale
controlează secțiile în care au apărut cazuri de infecț ii nosocomiale pentru a verifica dacă mai
există pacienți nediagnosticați, infecții neînregistrate și neanunțate. [5]

Compartimentului de Supraveghere și Control a infecțiilor nosocomiale verifică la un
interval stabilit datele primite stabilind un raport față de numărul cazurilor de infecții
nosocomiale apărute. În cazul în care numărul cazurilor este mai mare decât s -ar fi așteptat se
declara izbucn ire epidemică. Secția în care a apărut este răspunzătoare de gestionarea situației și
rezolvarea acesteia. Aceste infecții apărute sunt declarate la Direcția de Sănătate Publică
Județeană. [5]

Pentru mai bine de 20 de ani înainte de interesul recent pentru ef ectele adverse, infecțiile
nosocomiale sau supravegherea și raportarea acestora, au fost necesare pentru acreditarea
spitalului. În 1970 institutul Centers for Desease Control a eliberat orientări naționale și au oferit
cursuri de instruire a personalului ce controla infecțiile pentru a raporta ratele de infectare
folosind o metodă standard. Cu toate acestea detecția efectivă a infecțiilor nosocomiale s -a bazat
în principal pe metode manuale, dar aceste metode consumă timp.[4]

21

Un număr de grupuri au dezvoltat aplicații pentru a sprjinii spitalele în detectarea
infecțiilor nosocomiale, folosind metode de detectare computerizate. Aceste aplicații folosesc de
obicei baze de date clinice din microbiologie și alte date și produc pe baza acestora un raport pe
care laboranții îl utilizează pentru a evalua dacă este prezentă o inf ecție nosocomială [Figura
2.1], a ceastă abordare a fost extrem de eficientă. Ca o comparație între sistemele de supraveghere
computerizate și supravegherea manuală sensibilitățile au fost 90% și respective 76%.[4]

Analiza a arătat că trecerea la detecția computerizată urmată de verificarea unui medic, a
salvat mai mult de 65% din timpul personalului responsabil de detecția infecțiilor și au identificat
infecții mult mai rapid decât metoda manuală. Cele mai multe infecții care au fost ratate de
supravegherea calculatorului ar fi putut fi identificate cu adăugări și corecții la modelele logice
medicale.

Figura 2.1: Sistemul de detecție utilizat pentru infecții nosocomiale [4]

22
2.4 Informatică medical ă

Informatica medicală a evoluat ca un nou domeniu într -o perioadă relativ scurtă de timp.
Apariția sa se datorează într -o anumită măsură multiplelor provocări cu care s e confruntă
medicina de astăzi. Ca un exemplu, medicii trebuie să: fie mai eficienți, reducă erorile de
medicație și să aibă informații legate de pacienți la îndemână în orice situație de urgență.
Tehnologia are potențialul de a ajuta fiecare dintre aceste ramuri . Odată cu apariția Internetului ,
calculatoarelor de mare viteză, de recunoaștere a vocii, wireless și tehnologia mobilă, doctorii
din prezent au mai multe instrumente performante la dispoziția lor. Cu toate acestea tehnologia
avansează mai repede în raport cu puterea de asimilare a doctorilor.[3]
Definiția informaticii medicale este una dinamică datorată schimbării rapide a ambelor
domenii atât medicină cât și tehnologie. Următoarele sunt trei definiții citate frecvent [3]:

"este domeniu științific care se ocupă cu resurse, dispozitive și metode formalizate pentru
optimizarea stocării, recuperarea și gestionarea informațiilor biomedicale pentru rezolvarea problemelor și de luare a deciziilor"

"aplicarea de calculatoare, comunicații și tehnologia informației și a sistemelor în toate
domeniile de m edicină – îngrijire medicală, educație medicală și de cercetare medicală"
"reprezintă înțelegere, competențe și instrumente care să permită schimbul și utilizarea
informațiilor pentru a oferi asistență medicală și pentru a susține un mediu sănătos."

Istoria tehnologiei informației în medicină

Tehnologia informației a fost omniscientă în domeniul medicinei pentru aproximativ 3
decenii. În acest timp am fost martori la progrese astronomice în domeniul tehnologiei: includerea calculatoarelor personale, imagini de înalta rezoluție, internetul și wireless, fiind doar
câteva din descoperiri. [3]

23
La început nu a existat nici o strategie sau viziune cu privire la modul de avansare în asistența
medicală cu ajutorul calculatorului. Acum avem implicarea instituțiilor de stat și a mai multor
firme private care pun la cale progresul tehnologiei din domeniul medical.
Sunt prezentate câteva din numeroasele evoluț ii notabile în domeniul medical[3]:

 Calculatorul. Primul calculator pentru acest scop a fost lansat în 1946. IBM a
dezvoltat primul calculator personal în 1982 cu capaciate de 16k memorie.
Calculatoarele au fost mai întâi destinate pentru diagnostic medical și tratament de
către Ledly și Lusted în 1950. Ei au susținut că calculatoarele ar putea arhiva și
procesa informații mai rapid decât oamenii.
 Originea informaț iei medicale . Se consideră că originea termenului „informatică
medicală” datează din 1960 în Franța ( Informatique Medicale).
 MEDLINE La mijlocul anilor 1960 MEDLINE și MEDLARS au fost create
pentru a organiza literatura medicală din lume.
 Inteligenț a artificială. Proiectele de inteligență artificială (ex.MYCIN –
universitatea din Pittsburg) si INTERNIST(Stanford) au aparut în anii 1970.
 Internet. Dezvoltarea internetului a început în 1969 odată cu cre area proiectului
ARPANET. World Wide Web a fost conceput de Tim Berners -Lee în 1990 și
primul browser web în 1993. Internetul este coloana vertebrală pentru bibliotecile digitale medicale, schimbul informației și baza aplicaților web medicale.
 Inregistrar ea electronică. S-a discutat despre acest concept în 1970 și
recomandată Institutului de Medicină în 1991.
 Tehnologia portabilă. PalmPilot PDA a apărut în 1996 ca primul dispozitiv de
calcul portabil.
 Proiectul genomului uman. În 2003 HGP(Human Genome Project) a fost finalizat după 13 ani de cercetare internațională. Pentru a mapa toate genele umane a fost
unul dintre cele mai mari realizări din istoria științifică.

24
Barierele întâlnite în informatică medicală [3]:
 Timp insuficient . Aceasă critică a rulat de -a lungul celor mai multe discuții.
Doctorii ocupați se plâng că nu au suficient timp pentru a citi, învăța noile
tehnologii. Ei apelează la suport IT local pentru sfaturi în tehnologie.
 Costul. Tehnologii precum arhivarea imaginilor, sistemele de comunicați și fisele
medicale electronice sunt costisitoare.
 Schimbarea fluxului de lucru. Modificări semnificative în ceea ce privește fluxul
de lucru apar pentru a integra tehnologia. De exmplu: doctorii pot fi obișnuiț i cu
comenzile pentru laborator pri n completatea unui cereri scrise de mâna către
asistența medicală care va plasa comandă. Acum ei trebuie să se învețe să
utilizeze sistemul computerizat. În cazul majorităț ii tehnologiilor noi cei mai mulți
utilizatori au dificultăți în a schimba obiceiurile lor, acest lucru economisind atât timp cât și bani.
 Confidențialitate . În 1996 a fost creată o organizație pentru portabilitatea,
confidențialitatea și securitatea informaților personale de sănătate, care a fost
bazată în mare parte pe documentație scri să de mâna.

Dezvoltarea de dispozitive medicale în 1800
Pe parcursul anilor 1800 medicii și oamenii de știință din domeniul biomedical au
dezvoltat instrumente pentru a examina și a înțelege corpul uman. Dispozitive, cum ar fi termometru, microscop și k ymograph au dezvăluit modul în care corpurile sănătoase și bolnave
au funcționat. În 1816, medicul francez Rene Laennec a inventat stetoscopul. Acest tub simplu din lemn, a permis medicilor să audă și să ofere un diagnostic bolilor de piept. A devenit un obiect semnificativ în biomedicină. Un alt instrument ce a fost dezvoltat pe parcursul secolului
este oftalmoscopul , putându- se observă în interiorul anumitor organe, cum ar fi ochi și esofag
Numeroase instrumente au devenit echipamente de rutină. [11]

25
Razele X au conturat diagnosticul
Fizicianul german Wilhelm Roentgen a descoperit razele X în 1895. Acest lucru a
schimbat modul în care medicii ofereau diagnostic și tratau bolile. Aparatul cu raze X a devenit
un instrument medical puternic în următorii 30 de ani, mai ales în timpul primului război
mondial. Doctorii puteau vedea în profunzimea corpului, fără a utiliza o intervenție chirurgicală
de explorare.[Figura 2.3] [11]
Razele X nu au fost folosite doar pentru diagnostic. Cancerul putea fi tratat folosind
radioterapie de tipul razelo r X. Cu toate acestea, expunerea la radiații neprotejate cu raze X
cauzau arsuri și cancer. Mulți pacienți și radiologi în secolul al 20 -lea au murit din cauz a
expunerii excesive, înainte ca riscurile să fie înțelese. Prin utilizarea unor măsuri adecvate de
siguranță, razele X au fost principala tehnologie imagistică până în anii 1970. Alte mașini de
formare a imaginii, cum ar fi CT, PET și scanner RMN au fost dezvoltate. Spre deosebire de mașinile cu raze X tradiționale, au oferit imagini detaliate ale structurii complexe ale corpului,
cum ar fi creierul. [11]
Revoluția calculatorului în medicină
Utilizarea calculatoarelor a fost una dintre cele mai importante schimbări tehnologice în
medicina secolului 20. Calculatoarele au ajuns în centrul îngrijirii medicale din 1950. Mașinile
computerizate din spitale monitorizau pacienții continuu . De asemenea, au permis asiguratorilor
și serviciilor de sănătate să urmărească înregistrările pacienților la o scală mare. Procesarea imaginii, cum ar fi RMN sau PET au fost posibile datorită introducerii unor calculatoarele mai
performante care puteau reconstitui imagini ale corpului. Mai multe teste de diagnosticare au fost
realizate datorită mașinilor de laborator automate care au efectuat teste mai rapid și mai
precis. [11]

26
2.5 Imp actul științei calculatoarelor î n medicin ă
2.5.1 Introducere

Termenul “medicină” poate fi descris prin expresia ”ajutor reciproc”. De la persoanele
instruite în domeniul sănătății din zilele noastre se așteaptă diagnosticarea și tratarea, după caz
ajustarea tratamentului până la vindecare, doctorii pot recomanda schimbări în regimul alimentar,
administrare de medicamente, pot folosi echipament de monitorizare a funcțiilor vitale și efectuarea
de operații, pe scurt aplicarea oricărei tehnol ogii necesare pentru nevoile pacientului.
S-a găsit o cale de infiltrare în domeniu ce susține atât teoretic cât și practic vindecarea și
descoperirea de noi tratamente. Computerul a fost folosit în acest sistem al sănătății în diferite moduri.
Exemple de avansare a tehnologiei în acest sens se găsesc în operațiile pe cord deschis, aparate de
dializă, scanere de tomografie asistate de calculator. [9]
Cele dintâi funcții ale calculatoarelor în medicină au f ost pentru înregistrarea pacienț iilor,
facturare și eliberare de chitanțe.[Figura 2.2]

Figura 2.2: Sistemul inițial de gestionare al unităților medicale [9]

27
Progresul științific din domeniul calculatoarelor se datorează într -o bună parte infiltrării în
domeniul medical . Au luat naștere concepte cum ar fi: inteligență artificială, algoritmi genetici, re țele
neuronale pe baza funcționă rii organismelor vii. Pe de altă parte și medicina s -a dezvoltat foarte mult
o dată cu apariția sistemelor de calcul. Medicina a avut și are nevoie de sprijin în diagnosticarea și
tratarea bolilor, sprijin ce a venit din partea științei calculatoarelor. Aplicațiile software și hardware au
fost soluția diferitelor probleme ce păreau imposibil de rezolvat.
Dezvoltarea unor sisteme de calcul precum și a unor tehnici de interpretare a imaginilor
furnizate de acestea au dus la o extindere a domeniului fiind mult mai ușor de depistat a numite boli
(exemplu de aparat: RMN) [10].
2.5.2 Utilizarea calculatorului

Calculatoarele au devenit o parte importantă din orice spital, contribuind de la lucruri mărunte
cum ar fi stocarea datelor paciențiilor până la aplicații mult mai complexe cum ar fi operații pe cord deschis, raze x, teste clinice, toate sunt acum computerizate. Aceste mașini de calcul ajută la reali zarea
obiectivelor și procedurilor medicale mult mai eficient și rapid.
Există multe avantaje ce le oferă calculatoarele, făcându -le un necesar obligatoriu în domeniul
medical. Următoarele secțiuni prezintă câteva aspect din aplicațiile calcu latorulul asupra medicinei
[8]:
2.5.2.1 Calculatorul în administrarea medical ă

28
Calculatorul joacă un rol important în fiecare birou medical. Prezintă o contribuție foarte mare
în administrarea unui spital prin simpla lui prezență în toate procesele cum ar fi: înregistrarea rețetelor,
pontajele angajaților, păstarea evidenței concediilor medicale, etc. Aceste lucruri minore ar consuma
mult mai mult timp dacă s -ar face manual de către un personal dar cu ajuto rul calculatorului aceste
obiective sunt mult mai simplu de îndeplinit și durează mai puțin.
În cele mai multe birouri medicale, contabilitatea este de asemenea computerizată ceea ce ajută
la înregistrarea zilnică a tuturor tranzacțiilor financiare. De asemenea reduce și șansa de fraudă,
putând ca orice informaț ie să fie stocată în siguranță și disponibilă pentru orice control.
Un calculator, de asemenea ajută la înregistrarea de nume și detalii despre doctori și asocieri
de persoane, ceea ce este folosito r când vine vorba de înregistrările medicale ale pacienților,
tratament e anterioare, teste, diagnostică ri, simptome, etc. Aceste informații sunt foarte folositoare
pentru doctori, în special în caz urile de urgenț ă sau atunci când se dorește începerea unui nou
tratament. Mulți doctori, în zilele noastre, folosesc calculatorul pentru a oferii consult online pentru
persoanele ce nu pot ajunge la spital. Ultimul dar nu cel din urmă aspect: prescripțiile medicale sunt generate de calculator ceea ce reduce greșel iile de tratament.

2.5.2.2 Calculatorul în dezvoltare medicală

Utilizarea calculatorului este de asemenea asociată cu dezvoltarea și invenția în domeniul
medical. Multe studii au fost duse la bun sfârșit cu ajutorul lor. Spre exem plu: studierea anumitor
celule, microorganisme, bacteri , etc. au devenit mult mai ușor de abordat folosind calculatorul.
Se poate folosi în prezentări electronice a diferitelor boli și tratamente ce pot fi folosite
pentru intruirea viitorilor doctori.
Docto rii pot comunica între ei instant la nivel global transmițându -și date despre noi boli
și trata mente ajutând la revoluția medicinei.
2.5.2.3 Calculatorul în procedurile medicale

Calculat oarele din spitale de asemenea au un rol vital pentru numeroase scopuri specifice în
afară de administrare, contabilitate sau programări. Lirelmente ajuta doctorii în efectuarea de operații,

29
în special în intervenții chirurgicale laparoscopice, prin intermediul cărora introduce ustensile pentru
operații și o mică camera printr -o incizie făcută în zona operației, ceea ce duce la realizarea operației
cu ajutrul calculatorului și monitoarelor pentru a -l îndruma.
Multe dintre instrumentele și mașinile chirurgicale de ultima generație au fost dotate cu un mic
și în același timp puternic “calculator” pentru ca fiecare procedură ce a fost realizată să poată fi
înregistrată și monitorizată pentru a evita complicații. Procesarea imaginilor în domeniul medical cum
ar fi raze X [Figura 2.3 ], tomograf [ Figura 2.4], etc. sunt controlate și examinate cu ajutorul unui
calculator. De asemenea ajută la realizarea unor teste clinice și biologice variate care sunt folositoare în diagnosticarea corectă a diferitelor boli.

Figura 2.3: Aparatul pentru raze X

Figura 2.4: Tomograf

30
Este aproape imposibil pentru oameni să noteze orice diagnostic al organelor interne ale
pacienților în schimb cu ajutorul calculatorului făcându- se foarte ușor. Mulți pacienți cu
probleme grave de sănătate ale căror bătăi de inima, mișcarea plămânilor și supravegherea
funcționarii creierului ce trebuie înregistrate sunt monitorizate în permanență de un sistem de
calcul. Pacienții a căror viață depinde de aparate sunt conectați la un sistem specializat
computerizat.
2.5.3 Avantajele calculatorului utilizat în medicină

Există avantaje semnificative ale utilizării calculatoarelor în instituțiile medicale. Acum,
importanța lor a crescut semnificativ, datorită faptului că procedurile trebuie să fie rapide, iar serviciile medicale trebuie să fie mai precise.
Pentru a rezuma, avantajele calculatoarelor folosite în spitale ar putea fi [12] :
 ajută la realizarea "testelor" precise și examene medicale.
 monitorizează pacienții și furnizează alerte medicale, care sunt mai precise și în timp util.
 sunt utile pentru cole ctarea și stocarea istoricului medical al unui pacient.
 acestea cresc în mod semnificativ nivelul de precizie al diagnosticului.
 fac procesul contabil și de facturare al spitalului mai eficient și mai precis.
 ajută la actualizarea istoricului medical al p acienților.

Astfel, posibilitățile și utilizările calculatoarelor din domeniul medical sunt nelimitate.
Acestea facilitează spitalele și clinicile peste tot în lume, oferind elemente importante de precizie
și eficiență la diverse proceduri medicale și non -medicale, care sunt efectuate în fiecare zi, în
aceste locuri.

31
2.6 Învățarea automată

Învățarea automată este unul dintre sub-domeniile de bază ale Inteligenței Artificiale, ce
se preocupă cu dezvoltarea de algoritmi și metode ce permit unui sistem informatic să învețe
date, reguli, chiar algoritmi.
Învățarea automată presupune în primul rând identificarea și implementarea unei
modalități cât mai eficiente de a reprezenta infor mații, în sensul facilitării căutării, reorganizării
și modificării lor. [20]
Alegerea modului de a reprezenta aceste date ține atât de concepția generală asupra
modului de rezolvare a problemei, cât și de caracteristicile datelor cu care se lucrează. Înv ățarea
nu se poate face pe baza unui set foarte mare de cunoștințe, atât din cauza costurilor mari
presupuse de acumularea unor baze de informații mari cât și din cauza complexității memorării și
prelucrării unui volum mare de informații. În același timp însă, învățarea trebuie să ducă la
formularea de suficiente “reguli” atât cât să permită rezolvarea unor probleme dintr -un spațiu
mai larg decât cel pe baza căruia s -a făcut învățarea. Adică învățarea trebuie să îmbunătățească
performanța unui sistem nu doa r în rezolvarea repetată a unui același set de probleme, ci și în
rezolvarea unor probleme noi. Acest lucru presupune o generalizare a unei metode de rezolvare pentru a acoperi un număr cât mai mare de instanțe posibile, dar și păstrarea unei specializări
suficiente pentru a fi identificate corect instanțele acceptate. Aceasta se poate face fie inductiv,
generalizând o problemă plecând de la un set de exemple, fie deductiv, plecând de la o bază de
cunoștințe suficiente asupra universului problemei și extrăg ând date și reguli esențiale. Pentru a

32
putea face acest lucru, un algoritm de învățare trebuie să fie capabil să selecteze acele elemente
semnificative pentru rezolvarea unei instanțe viitoare a problemei.
O altă componentă esențială al unui algoritm d e învățare este metoda de verificare, o
metodă capabilă să confirme dacă generalizările făcute sau regulile deduse se apropie mai mult
de soluția ideală decât starea anterioară a sistemului.
Studiul învățării automate a dus la descrierea a numeroase metod e, variind după scop,
date de antrenament, strategia de învățare și modalitatea de reprezentare a datelor
Specificarea unei metode de învățare automată presupune definirea următoarelor date
[21]:
• scopul metodei și baza de cunoștințe necesară;
• formalismul de reprezentare a datelor utilizate și a celor învățate;
• un set de operații asupra datelor disponibile și învățate;
• un spațiu general al problemei în care se va specifica soluția;
• opțional, reguli euristice pentru căutarea în spațiul problemei.

33
CAPITOLUL II I. DEZVOLTARE
3.1 Cercetare î n domeniu
3.1.1 Control of Nosocomial Infections By Data Mining

Autori : D. Benhaddouche A. Benyettou
Ideea principală
Infecțiile nosocomiale reprezintă un domeniu în care s -au efectuat numeroase studii
știntifice, prin care se evaluază eficiența prevenirii acestora, mai ales în secțiile de terapie
intensivă. Predicția acestor infecții nosocomiale se realizează prin implementaera unui program .
Pentru realizarea acestuia s -au folosit: data mining, rețele neuronale și arbori de decizie. Aceste
infecții pot fi predicționate pe baza informațiilor din baza de date ce sunt introduse în
permanență, folosind algoritmi specifi ci.
Studiul a fost realizat la spitalul universitar din Oran, Algeria, luându -se drept date de test
baza de date din anul 2008 ce conține peste 1500 de pacinți. O parte din date au fost introduce manual și o altă parte deduse de calculator. În final baza d e date conține 17 atribute și 1520 de
înregistrări.
Datele necesare algorimului sunt: sexul pacientului (M/F), vârstă, infecții
nosocomiale anterioare, imunosupresie ( scădere sau diminuare a imunității organismului după
iradiere, droguri, toxine microbiene ), antibioticoterapie, chimioterapie, I.M.C.(indice de masă
corporală), motivul spitalizării, intubație, KT Central, cateter, durata spitalizării, infecție nosocomială.
Rezultate
În acest studiu s -au implementat mai mulți algoritmi și s -au urmărit rezulatatele fiecăruia
(Figura 3.1). Unul dintre aceștia este algoritmul AD Tree ( arbore de decizie) funcționând doar
pe o bază de date cu o clasă de atribut ce este formată numai din 2 valori (clase). Motiv pentru
care s -a modificat baza de date, atributul de clasă este “IN” ce poate lua 5 valori. Prima valoare
indică dacă pacientul a contactat o infecție iar celelalte 4 valori indică tipul infecție contactată; ca o soluție putem avea numai 2 valori pentru un atribut, grupând aceste valori în 2 grupe: “da” –

34
dacă pacientul este infectat sau “nu”- dacă nu s -a depistat infecție. Un alt agloritm testat este J48
(numit și C4.5) care generează arborele de decizie diferit de AD Tree, atributele putând lua mai
mult de 2 valori. Prin acest algoritm se poate identifica mai bine tipul infecției. Algoritmul ID3 a
fost aplicat pe o parte din baza de date, atributele alese reprezintă o fracțiune din toate atributele.
În urmă testării algorimilor au rezulatat următoarele date:

Figura 3.1: Rezultatele algoritmilor
Limitări
Rata de eroare a infecțiilor nosocomiale a fost mai mult sau mai puțin ridicată, acest lucru
se datorează lipsei de informații din baza de date. Prezența probelor biologice ale pacientului
îmbunătățesc prevenirea infecțiilor nosocomiale posibile . Dezavantajul este că aceastea sunt
costisitoare ca resurse și timp și trebuie realizate prin c erere către laborator sau medic pentru a fi
efectuate.

35
3.1.2 Learning from imbalanced data in surveillance of nosocomial
infection

Autori: Gilles Cohen, Me´lanie Hilario, Hugo Sax, Ste´phane Hugonnet,
Antoine Geissbuhler

Ideea principală
Principalul motiv al acestul articol este de a identifica pacienții ce au contactat una sau
mai multe infecții nosocomiale. Aceste infecții reprezentând o problemă importantă în spitale
(detecția la t imp a acestora). Astfel pentru a identifica cazurile de infecție nosocomială se poate
analiza standard prin supravegherea unui personal a înregistrărilor, da r acest mod consumă timp
și nu se poate aplica în cazul unor spitale mari. O altă cale este de a supraveghea pacienții cu
ajutorul unui sistem computerizat, identificându -se cazurile de infectare.
Pentru a determina cazurile de infecție în acest articol s e compară rezultatele obținute
de 5 algoritmi de învățare. Ca arbore de decizie s -a folosit C4.5, în care fiecare nod testează o
singură variabilă și calea de la rădăcină la o frunză reprezintă o conjuncție a condițiilor necesare
pentru o clasificare data. Naive Bayes calculează probabilitatea posterioară pentru fiecare clasă
dată a noului caz, atribuind clasa cea mai probabilă . IB1 este de fapt K -nearest -neighbors, un
algoritm de clasificare, în timp ce Adaboost construiește iterativ un arbore de decizie cu un
singur nod, concentrându- se la fiecare pas pe clasificările greșite anterior. Support vector
machines (SVM) este un algoritm de învățare automată bazat pe Structural Risk Minimization
(SRM), în principiu pe teoria învățării statistice. Principiul SRM urmărește să minimizeze limita
superioară a erori de generalizare.

Rezultate
Datele de test aparțin spitalului universitar din Geneva, Switzerland ce conțin 11% cazuri
infectate și 89% cazuri fără infecții (Tabel 3.1). Astfel la testarea algoritmilor s -au modificat
aceste procente pentru a urmării acuratețea lor.

36

Algoritm Sensibilitate Specificitate CWA Acurate țe
IB1 0.19 0.96 0.38 0.88
Naive Bayes 0.57 0.88 0.65 0.85
C4.5 0.28 0.95 0.45 0.88
AdaBoost 0.45 0.95 0.58 0.90
SVM 0.43 0.92 0.5 0.86
Tabel 3.1: Rezultatele algoritmilor cu o proporție de 11% -da și 89% -nu
Algoritm Sensibilitate Specificitate CWA Acurate țe
IB1 0.01 0.99 0.26 0.88
Naïve Bayes 0.21 0.96 0.40 0.88
C4.5 0.00 1.00 0.25 0.89
AdaBoost 0.04 1.00 0.28 0.89
SVM 0.05 0.99 0.29 0.88
Tabel 3.2: Rezultatele algoritmilor cu o proporție de 50% -da și 50% -nu ( subesantionare
aleatoare)
Algoritm Sensibilitate Specificitate CWA Acurate țe
IB1 0.19 0.96 0.38 0.88
Naïve Bayes 0.68 0.83 0.72 0.81
C4.5 0.49 0.87 0.59 0.83
AdaBoost 0.73 0.87 0.77 0.85
SVM 0.60 0.89 0.67 0.86
Tabel 3.3: Rezultatele algoritmilor cu o proporție de 50% -da și 50% -nu ( supraesantionare
aleatoare)
Sensibilitate = TP / (TP+FN);
Specificitate = TN / (TN+FP);
Acuratețe = (TP+TN) / N;
CWA = wi * sensibilitate + (1 -wi) * specificitate;
unde : N = TP + TN + FP + FN – numărul total de cazuri;
TP – cazurile positive depistate;
TN – cazurile negative depistate;
FP – numărul cazurilor gresite positive;
FN – numărul cazurilor gresite negative;
CWA – precizia mediei ponderate a clasei;
wi – ponderea asociată clasei i.

37
Din (Tabel 3.1) se observă că algoritmul AdaBoost are o acuratețe de 90%, cea mai bună
dintre cei 5 algoritmi dar este mai slab decât Naive Bayes în detectarea cazurilor pozitive de
infecție nosocomială. De fapt, Naive Bayes ocupă ultimul loc în ceea ce privește rata de precizie
din cauza performanțelor sale slabe asupra clasei majoritare (specificitatea de 0.88, mai mică
decât toate celelalte), dar atinge ce mai mare sensibilitate de 0.57, cu 12% mai mare decât
AdaBoost . În (Tabel 3.2) și (Tabel 3.3) se prezintă performanțele obținute pe datele de te st
ajustate (esantionate).

Limitări
Principalul obstacol al cercetării, tipic în diagnosticul medical, îl reprezintă prezența
cazurilor rare. Această problemă a fost abordată în 2 moduri. Primul se bazează pe generarea de
cazuri sintetice atât pentru subesantionare cât și pentru supraesantionare, dar trebuie îndeplinită
constrângerea ce impune cazurilor sintetice să răm ână în interiorul unui anumite clase. Această
constrângere este rezolvată folosind subclasele. A două abordare impune folosirea unui algoritm prin care parametrii de regularizare dependenți sunt introduși în așa fel încât să se obțină o marjă mai mare de eroare în clasele mici.

38
3.1.3 Automated detection of nosocomial infection: evaluation of
different strategies in an intensive are unit 2000 -2006

Autori: S. Bouzbid , Q. Gicquel, S. Gerbier, M. Chomarat, E. Pradat, J. Fabry, A. Lepape,
M. -H. Metzger

Ideea principală
Scopul acestui studiu este de a evalua 7 strategii diferite pentru detecția automată a
infecțiilor nosocomiale în secția de terapie intensivă folosind sistemul de informații al spitalului,
ce conține: baza de date microbiologică, baza de date cu prescripți e antibiotice, baza de date
medico -administrativă și informații de gestiune. Spitalul în care s -a realizat studiul se află în
Lyon, Franța, implicând 1499 de pacienți internați în secția de terapie intensivă între anii 2000 și
2006. S-au dezvoltat diferiți algoritmi și strategii folosind aceste date, determinând atât
individual cât și prin combinații de algoritmi/strategii cazurile posibile de infecție .
S-au studiat 4 strategii bazate pe folosirea unei singure baze de date:
• Algoritmul microbiologic : selectarea tipului de prelevare a probelor și a agenților
patogeni se bazează pe datele locale folosite în sistemul informatic al laboratorului de
microbiologie;
• Algortimul pentru rețetele de medicamente : antibioticele prescrise au fost selectate
folosind c odul ATC( sistemul de clasificare anatomică, terapeutică și chimică a
medicamentelor);
• Algoritmul medico -administrativ ;
• Informații de gestiune : detecția infecției nosocomiale din fișele medicale se
bazează pe extracția manuală a datelor de către un med ic epidemiolog.
Folosind bazele de date s -au realizat 3 algoritmi prin combinarea acestora: (1)algoritmul
pentrru rețetele de medicamente sau algoritmul microbiologic, (2)algoritmul pentrru rețetele de
medicamente și algoritmul microbiologic, (3) algoritmu l pentrru rețetele de medicamente sau
algoritmul microbiologic sau algoritmul medico -administrativ.

39
Rezultate
Sensibilitatea, specificitatea, valoarea predictivă negativă sau pozitivă au fost calculate,
comparând fiecare sursă de date cu metoda de referin ță. Intervalul de încredere de 95% a fost
calculat prin metoda exactă binomială.
Pentru toate tipurile de infecție, “algoritmul pentru rețetele de medicamente sau
algoritmul microbiologic” a rezultat cea mai mare sensibilitate . Această combinație a celor 2
metode poate detecta aproape toate infecțiile nosocomiale în detrimentul unei specificități
scăzute. Cel mai bun raport între specificitate și sensibilitate a fost obținut pentru algoritmul
microbiologic. Rezultatele studiului arată posibiliateta avanta joasă de folosire a mai multor
sisteme pentru a îmbunătății detectarea și potențialul de dezvoltare și utilizarea sistemelor informatice de monitorizare a infecțiilor nosocomiale.

Limitări
Acest studiu are unele limitări în ceea ce privește validarea internă și externă. În ceea ce
privește validitatea internă, supravegherea se bazează pe notificarea manuală de către medicii
secției de terapie intensivă. Studiul a fost realizat într -o singură secție de terapie intensivă (ATI).
De altfel ar trebui ca stu diul să fie extins și în alte secții ATI cu diferite tipuri de recrutare și
îngrijire a pacienților înainte ca rezultatele să poată fi generalizate în ceea ce privește
performanța metodelor automatizate de detectare.

40
3.1.4 Automatic Detection of Patients with Nosocomial Infection by a
Computer -Based Surveillance System:A Validation Study in a General
Hospital

Autori: L. Pokorny, PT; A. Rovira, MD; M. Martı´n- Baranera, MD, PhD; C. Gimeno,
MD;C. Alonso- Tarre´s, MD, PhD; J. Vilarasau, MD, PhD

Ideea principal ă

Obiectivul acestui articol este de a valida un sistem automat de detecție a pacienților cu
infecții nos ocomiale di n secția de terapie intensivă (ATI). Riscul infecților n osocomiale în
această secție este de 5 -10% mai mare decât în celelalte secții din spital. S -a propus crearea unui
algoritm ce să utilizeze datele stocate în calculator pentru a supraveghea automat pacienții, în
vederea detectării unui infecții. Baza de dat e conține pacienții ce au fost internați mai mult de 48
de ore pentru diferite probleme medicale. De asemenea sistemul informatic conține și rezultatele testelor din laboratorul de microbiologie, eliberare de rețete, diagnostic la momentul externării și
date administrative.Comitetul de infecții a stabilit 3 crit erii pentru o infecție nosocomiala
suspectă: raportul micr obiologic pozitiv pentru cultura unui eșantion obținut între 48 de ore de la
internarea în AT I și după 48 de ore după externarea din AT I, ini țierea tratamentului cu
antibiotice 48 de ore de la internarea în ATI și diag nosticul clinic al infecției.

Rezultate

Datele obținute de studiul de supraveghere a infecților nosocomiale în secția de terapie
intensivă din 1999 până în 2002 din spitalul din Barcelona (Spania), au fost folosite ca date
standard cu care s -au comparat alte date introduse. Obiectivele acestui studiu sunt:
1. Pentru a determina ratele de infectare în secțile de terapie intensivă;
2. Pentru a descrie organismele infectate și rezistanța lor la antibiotice;
3. Pentru a evalua diferențele dintre microorganismele responsabile de infecție și
rezistența la antibiotice;
4. Pentru a compara evoluția cifrei de utilizare a antibioticelor în terapie intensivă.

41
Mai multe tipuri de combina ții ale celor 3 criterii de suspiciune de infec ție au fost luate in
considerare. Sensibilitatea, specificitatea, valori predictive pozitiv e si negativ e au fost calculate
pentru toate combina țiile d e criter ii bazate pe calculator (Tabel 3. 4).

Tabel 3.4: sensibilitatea, specificitatea, predicționarea valorii pozitive sau negative pentru
diferite combinații ale celor 3 criterii pentru infecții nosocomiale

AB – tratament cu antibiotice;
DX – diagnostic;
MICRO – raportul microbiologic pozitiv pentru o cultura;
PPV – valoare predictiv ă pozitiv;
NPV – valoare predictiv ă negativ.

Limit ări
Sistemul automatizat a folosit datele din sistemul informatic al spitalului depistâ nd
cazurile de infecție nosocomială. Cu toate acestea nu toate cazurile de infecție nosocomială au
putut fi depistate din cauza lipsei datelor cuprinzătoare din baza de date.

42
3.1.5 Predicting Nosocomial Infection by Using Data Mining technologies

Autori: Eva Silva,Luciana Cardoso, Filipe Portela, Antonio Abelho, Manuel
Filipe Santos si Jose
Ideea principal ă
Articolul prezintă rezultatele obținute de cei 2 algoritmi folosiți în predicția infecților
nosocomiale, bazându- se pe date reale. Aplicația foloseș te tehnicile de clasificare Data Mining
(DM) și Nai ve Bayes cu care se poate reduce incidenț a infecțiilor prin predic ționarea acestora.
Prevenirea acestor infecții poate fi realizată prin predicționarea pe baza datelor stocate în baza
de date, ce trebuie să conțină atribute capabile să caracterizeze starea de sănătate a pacienților.
Tehnologia D ata Mining poate fi folosită pentru a crea modele predictive și aplicate altor date ale
pacientului în scopul realizării predic ției. Aceste modele pot fi folosite pentru a identifica
cazurile posibile de infecție nosocomiala, permi țând oamenilor din domeniul sănătății să
planifice și să pună în aplicare măsuri specifice și eficiente de prevenire a infecției.
SVM este un algoritm puternic care se bazează pe teoria învățării statistice și g ășește cele
mai bune planuri de decizie care împart datele în diferite seturi, ce pot fi folosite pentru a modela
problem e complexe. Naive Bayes de asemenea se bazează pe probabilități condiționate, fiind
foarte rapid și scalabil.
Rezultate
S-au creat 3 clase:
• Clasa vârstei : încadrarea paciențilo r în grupe în funcție de vârstă;
• Intubație : încadrarea dipo zitivelor invaz ive legate de intubație într -o singură clasă;
• Cateterizarea1 :încadrarea dipozitivelor invaz ive legate de cateterizare într -o singură
clasă ( cateter2 urinar, cateter periferi c și cateter central).

1 . CATETERÍSM s. n. (Med. ) Introducere a unui cateter într -un canal normal sau într -o cavitate a organismului în
scopul stabilirii diagnosticului.
2 . CATÉTER n. Instrument medical tubular cu care se examinează un canal sau o cavitate; sondă.

43
Se consideră 4 scenarii în funcție de variabilele alese:
 Absența factorilor de risc(Scenariu 1);
 Absența intubației( Scenariu 2);
 Absența cateterizării(Scenariu 3);
 Toate variabilele(Scenariu 4).
Aceste 4 scenarii au fost induse în confor mitate cu cele 3 seturi de date: Abordarea A(set de
date fără date dublicate), Abordarea B(set de date cu date duplicate) și Abordarea C(set de date
cu date dublicate și vârstă variabilă încadrată în clase).
SVM Naïve Bayes
Specificitate Sensibiliate Acuitate Specificitate Sensibiliatte Acuitate
Scenariu 1 si
Abordarea B 0.763 0.919 0.838 0.733 0.941 0.825
Scenariu 2 si
abordarea B 0.741 0.942 0.831 0.733 0.941 0.825
Scenariu 1 si
abordarea C 0.731 0.793 0.766 0.733 0.941 0.825
Scenariu 3 si
abordarea C 0.675 0.845 0.754 0.733 0.941 0.825
Tabel 3.5: Rezultatele obținute la cele mai bune modele cu cei 2 algoritmi
În cadrul acestei lucrări, sensibilitatea a fost reprezentată de prezicerea non -apariției unui
infecții (TP
TP+FN, TP- cazuri pozitive adevărate, FN -cazuri negative false), iar specificitatea fiind
capacitatea de predicție a apariției infecției ( TN
TN+FP, TN-cazuri negative adevă rate, FP -cazuri
positive false); Acuitate =TP+TN
TP+FP+TN+FN
Cele mai bune modele au fost selectate lu ând în considerare valorile sensibilității, deoarece
este important să se identifice toate non -aparițiile de infecție (Tabel 3.5). Cea mai bună valoare a
sensibilității este 94.20% și este rezul tată în cazul 2 (scenariu 2 și abordarea B) când folosește
modelul SVM. Deci, pentru toate combinațiile de situații și tehnici, acesta este mo delul cu cea
mai bună predic ție a non- apariției unui infecții.
Cercetări viitoare -îmbunătățiri
Pentru îmbunătățir ea performanței se poate realiza din nou studiul pe o altă bază de date cu
alte tehnici de Data Mining adaptând pe alt e variabile în modelul predictiv . Un alt plus acest ui
studiu s -ar putea aduce prin crearea unui sistem ce poate detecta infecțiile în timp real.

44
3.1.6 Comparison of Auto mated Strategies for Surveillance of
Nosocomial Bacteremia
Autori : Cristina Bellini, MD; Christiane Petignat, MD; Patrick Francioli, MD; Aline
Wenger, Biologist, FAMH; Jacques Bille, MD; Adriana Klopotov, MS; Yannick
Vallet, MS; Rene´ Patthey, MS; Giorgio Zanetti, MD, MS

Ideea principal ă

Obiectivul studiului este schimbarea stilului de supraveghe re al infecțiilor nosocomiale
din sânge în spitale. Astfel prin introducerea unui algoritm computerizat se identifică culturile de
sânge contaminate. Scopul este de a compar a diferite strategii de implementare a supravegherii
automate a infecțiilor. Sistemul se bazează pe o bază de date eletronică în care s -au colectat date
administrative și microbiologice despre pacienți.

Rezultate
Studiul a fost realizat pe o perioadă de peste 3 ani într -un spital din Elveți a, evaluându –
se performanța sistemului implementat pentru supravegherea infecțiilor nosocomiale de sânge,
ulterior pe baza acestora s -au făcut îmbunătățir i.
Sistemul automat de detecție a fost evaluat rezultând o sensitivitate de 96% și o
specificitate de 94%.

Limit ări
O limitare a articolului poate fi considerată încadrarea (compararea) în s tandardul impus
de specialiști în boli infecțioase. Sistemul de sup raveghere diferă în 2 aspecte de criteriile de
supraveghere impuse: (1) Standardul impune 2 categori de boli infecțioase de sânge (infecții care
sunt documentate microbiologic și sepsis1 clinic fără documentație). Supravegherea automată a
sepsisului clinic ar necesita o prelucrare complexă a datelor clinice, care nu sunt toate în sistemul
informatic al spitalului. ( 2) Standardul clasifică rezultatele positive de cultură de sânge pentru o
infecție nosocomială c a o confirmare a laboratorului după expluderea unei contaminări a culturii
și a unui focar bacterian.
1 .sepsis – afecțiune sistemică produsă de invadarea microbiană a părților componente ale organismului, care în mod normal sunt
sterile.

45
3.1.7 Artificial Intelligence Techniques for Monitoring Dangerous
Infections
Autori: Evelina Lamma, Paola Mello, Anna Nanetti, Fabrizio Riguzzi, Sergio
Storari și Gianfranco Valastro (Italia)
Ideea principală
Se prezintă implementarea unui sistem de monitorizare a infecțiilor nosocomiale ce este
capabil să gestioneze aspectele diferite ale acestei probleme, sistem numit MERCURIO.
Obiectivele acestui sistem: validarea datelor microbiologice și crearea în timp real a sistemului
de informații epidemiologice. De asemen ea s-a integrat un modul statistic ce monitorizează
infecțiile nosocomiale apărute în spital. Cu alte cuvinte sistemul trebuie să identifice situațiile critice pentru un singur pacient sau pentru unitatea sanitară și să furnizeze un raport privind
numărul cazurilor de infecție nosocomială pe fiecare secție în parte. Pentru atingerea acestor
obiective s -au folosit sisteme expert, Data Mining și tehnici statistice.
Rezultate
Evaluarea sistemului s -a făcut pe un set de date cu 368 de antibiograme. Rezultatel e
primite au fost: 98.5% pentru acuratețe și sensitivitate, 98% pentru specificitate și 2% alarmă
falsă. (acuratețe = TP/TP+FP, sensitivitate = TP/TP+FN, specificitate = TN/FP+TN,
Alarmă falsă =1 – specificitate ; TP – cazuri positive adevărate, TN – cazuri negative adevărate,
FP – cazuri positive false, FN – cazuri negative false);
Dezvoltări viitoare
Se intenționează utilizarea algoritmilor de învățare în scopul extinderii cunoștințelor bazei
de date. Se vor lua în considerare mai multe norme generalizate sau de asociere cu mai multe
niveluri: în acest caz, pe lângă o baza de date a tranzacțiilor, va exista și o ierarhie între
elemente. Prin urmare, regulile de asociere care pot fi învățate pot conține elemente din diferite
niveluri ale ierarhiei. În cazul bazei de date microbiologice, se poate exploata o ierarhie între bacterii, între antibiotice și s -ar putea învață reguli de asociere care stabilesc o relație între
familia bacteriei respectiv familiei de antibiotice.

46
3.2 Concluzii în urma cercetă rii

Problema infecțiilor nosocomiale a fost și este un subiect de actualitate existând
numeroase articole de studiu în acest domeniu, urmărindu- se evitarea acestora prin orice metodă.
Detecția infecțiilor nosocomiale se realizează standard prin supravegherea de catre personal sau
computerizat pe baza unui algoritm ce poate stabilii un posibil pacient infectat. Pentru realizarea
acestui sistem în articolele studiate s -au folosit diferiți algoritmi, unii cunoscuți alții stabiliți de
autori, dar toți având același scop.
Potrivit articolelor studiate algoritmii de învățare automată sunt cei mai folosiți, algoritmi
precum Naïve Bayes, IB1, SVM, AdaBoost. Aceștia au fost folosiți pe diferite date de test,
stabilind procentul de acuratețe. În funcție de numărul cazurilor de infecție și a celor neinfectate
sunt stabilite procentele pentru sensibilitate, specificitate, acestea fiind cele mai comune, dar s -au
analizat și diferite caracteristici în funcție de ar ticol.
Fiecare articol în parte are propria strategie de testare și folosește un set propriu de date
de test. Astfel rezultatele nu pot fi comparate ca procente ci trase doar concluzii referitoare la eficiența algoritmului folosit.
În articolul “Learning from imbalanced dată în surveillance of nosocomial infection”
algoritmul AdaBoost are cea mai mare acuratețe dar algoritmul Naïve Bayes îl depășește în
detecția infectiior.
Articolul “Predicting Nosocomial Infection by U sing Dată Mining technologies”
folosește de asemenea Naive Bayes stabilind diferite scenarii de testare. Algoritmul Naive Bayes
este un algoritm de învățare automată bazându -se pe probabilități condiționate, este de asemenea
un algoritm rapid și scalabil. Pentru a folosi acest algoritm s -a utilizat o baza de date cu
informatiile pacienților luând în vedere atributele ce trebuie să fie capabile să descrie starea de

47
sănătate a pacientului. Algoritmul SVM (Support Vector Machines) este folosit în acest articol
stabilind cele mai bune decizii, bazându- se pe teroria învățării statistice.
Cei 2 algoritmi (Naive Bayes și SVM) au fost aplicați în diferite situații stabilite în care s –
au făcut diferite modificări( pacienți fără intubație, absența factorilor de risc, etc.) determinând diferite baze d e date de test. În funcție de baza de date testată cei doi algoritmi au rezultat diferite
procente. Cel mai bun procent al sensibilități i ( prezicerea non -apariției infecției) l- a avut
modelul SVM (94,2%). Folosind algoritmul Naive Bayes pe scenariile sta bilite au rezultat
aceleași procente pentru toate situațiile (sensibilitate=94,1%). Diferența dintre cele 2 rezultate nu
este sesizabilă, dar in ceea ce priveste acuitatea diferenta este cu aproape un procent mai mare(
Naive Bayes=82,5%, SVM=83,1%).
Studi ile în acest domeniu s -au realizat în afară țării, local nu există sistem computerizat
de supraveghere. Dar se urmărește dezvoltarea acestei probleme, realizând analize în laboratoare
mult mai corect și eficient, așa ajutând foarte mult la depistarea infec ției. De asemenea se
urmărește dezvoltarea unui sistem mult mai avansat din punct de vedere administrativ al monitorizării și supravegherii naționale a infecțiilor nosocomiale.
Deci conform articolelor studiate principiul de bază al detectării infecției co nstă în
colectarea unui baze de date ce trebuie să conțină date relevante despre pacient și un algoritm bine stabilit de învățarea automată (Naive Bayes, SVM, AdaBoost, ID3, etc. ) impreună cu
tehnici de Data Mining .

3.3 Proiectarea sistemului

3.3.1 Algoritmi folosiț i

Algoritmii ce i- am folosit fac parte din domeniul de Machine learning ce pot învăța pe
baza unui set de antrenament un comportament într -o anumită situație. Astfel se poate prezice
riscul unui pacient la infectare cu ajutorul situaților din datele de antrenament. Pentru depistarea
acestor infecții intra spitalicești am folosit Naïve Bayes și Suport Vector Machines (SVM).

48
Clasificarea este o tehnică de învățare supervizată care utilizează o mulțime de exemple
etichetate pentru antrenare ș i încearcă să găsească regulile după care sunt împărțite cel mai bine
mulțimile de antrenament.
3.3.1.1 Naive Bayes

Figura 3.2 Formula lui Bayes
Clasificatoru l Naïve Bayes este o metoda de învățare baysiană ce este folosită în multe
aplicații practice. Se numeș te “naïve” deoarece include presupunerea că valorile atributelor sunt
în mod condiționat independente, având în vedere clasificarea instanței.
Naïve bayes ca și mulți algoritmi de învățare cuprinde 2 et ape: antrenarea sistemului si
utilizarea acestuia. Pentru antrenare s e folosesc date relevante situaț iei testate iar pentru testarea
sistemului se introduce date noi . Complexitatea algorimului crește o dată cu creșterea numărului
de clase de clasificare. În cazul tratat s -au folosit 2 clase: infecție ș i non- infecție, as tfel rezultatul
sistemul predicționează proporția fiecă rei clase.

49
3.3.1.2 Support Vector Machine

SVM este o tehnică ce se bazează pe teoria învațării statistice, găsind un hiperplan ce împarte
optim setul de date de antrenament. De asemenea acest algoritm poate lucra cu vectori de
dimensiune mare și oferă o fiabilitate ș i perfo rmanțe ridicate în cazul învățării datelor neliniare
separabile.
Ideea algor itmului SVM este de a găsi un hiperplan care î mparte optim setul de date de
antrenament. Hiperplanul optim se poate distinge prin marginea de separare maximă dintre toate
punctele de antrenare și hiperplan. Pentru o problemă într -un spațiu bidimensional cum este și
cazul nostru ( clasa infectare ș i clasa non-infectare) algoritmul caută după o dreap tă care separă
“cel mai bine” punctele din clasa “infectare” de punctele din clasa “ non -intectare”.

3.3.2 Analiza și specificarea cerințelor

Așa cum am prez entat această temă, actual infecț iile nosocomiale sunt detectate de către
persona l medical pe baza rezultatelor analizelor pacienților. Conform cercetării î n domeniu,
pentru a depista aceste infecții se folosește învăț area automata. Î nvățarea automată reprezintă
unul din sub- domeniile de bază ale Inteligenței Artificiale, ce se preocupă cu dezvoltarea de
algoritmi și metode ce permit unui sistem informatic să învețe date, reguli, chiar algoritmi.
Învățarea automată presupune în primul rând identificarea ș i implementarea unei modalități cât
mai eficiente de a reprezenta informații, în sensul facilitării căutării, reorganizării și modificării lor. Alegerea modului de a reprezenta aceste date ține atât de concepția generală asupra modului
de rezolvare a probl emei, cât și de caracteristicile datelor cu care se lucrează.

50
Algoritmii folosiți ( Naïve Bayes și SVM) impun următoarele cerinț e:
• Salvarea datelor de antrenament astfel înc ât să poată fi interpretate;
• Interpretarea rezultatelor celor 2 algoritmi;
Naïve Bayes :
• Salvarea î n format string a atr ibutelor dupa care se calculează probabilitatea ;
• Luarea î n considerare a termenului de 48 de ore de la internare la introducerea
datelor ;
• Calcularea probabilitații a fiecarei perechi atribut/clasa î n parte ;
• Calcularea probabilitaț ii de infectate/non -infectare pentru cazul introdus.

SVM :
• Conversia datelor de antrenament î n format numeric ;
• Conversia datelor de test î n format numeric ;
• Integrarea librariei LibSVM ce foloseș te ca parametri la metodele sale datele
convertite;
• Stabilirea pe baza datelor , clasa din care face parte noul caz (infectare/non –
infectare).

3.3.3 Proiectarea bazei de date

Pentru a facilita procesul de identificare a posibilelor IN, am realizat o bază de date care
conține informații referit oare la starea pacientului, istoricul acestuia (dacă a mai avut sau nu o
infecție nosocomială) precum și date de laborator folosite în depistarea corectă a unei infecții. Am
folosit date cu același procentaj: 50% cazuri cu infecție și 50% cazuri fără infec ție.
În cad rul bazei de date create se află informaț iile medicale pe care cei doi algori tmi le folosesc
pentru a predicț iona un nou caz. Aceste date sunt stocate într -o bază de date de tip MySQL, acesta
fiind unul dintre cele mai des folosite sisteme de baze de date.

51
Tabela diagnostice

Figura 3.5: Tabela Diagnotice
 ID_DIAGNOSTIC – cheia primară a acestei tabele;
 DENUMIRE – pentru a salva diagnosticele.

Tabela Date_pacienti

Figura 3.4: Tabela Date_Pacienti

În această tabelă se află datele generale despre pacienți :
 ID_PACIENT – este cheia primară a tabelei, fiind un număr de identificare a înregistrării;
 NUME_PRENUME – numele si prenumele pacientului, necesar pentru identificarea lu i;
 CNP –cod numeric personal – pentru fiecare pacient;

52
 DATA_NASTERII – folosită pentru a calcula vârsta pacientului;
 DATA_INTERNARE – pentru a verifica daca au trecut 48 de ore de la internare până în momentul
declanșări infecț iei;
 ID_DIAGNOSTIC – cheie străină din tabela diagnostice ce indică diagnosticul pacientului pentru
care a fost internat;
 ID_SIMPTOM – cheie străină din tabela sim ptomatologie ce indică simptomul pentru care se
calculează probabilitatea de infectare ;
 ID_POARTA_INTRARE – cheie străină ( tabela poarta_intrare) , indică partea corpulu i prin care
microorganismul a pătruns în organismul pacientului;
 IN_ANTERIOARA – indică dacă pacientul a mai avut o astfel de infecț ie in trecut.
 DATA_ANTRENAMENT – face diferența între datele de antrenament ș i datele de test introdus e.
Tabela simptomatologie

Figura 3.6: Tabela Simptomatologie
 ID_SIMPTOM – cheia primară a acestei tabele;
 DENUMIRE – pentru a salva simptomele;
 TIP_INFECTIE – în funcț ie e simptomul prezent poate d etermina un anumit tip de infecție.
Tabela poarta_intrare

Figura 3.7: Tabela Poarta de intrare

53
– în această tabelă sunt salvate zonele prin care microorganismul a atacat corpul.
 ID_POARTA_INTRARE – cheia primară a tabelei ce indică unic o î nregistrare;
 DENUMIRE – există standard aceste zone: cateter, pulmonar ă, urinară, digestive, sinus, plagă,
tegument, altele, necu noscută.

Structura completă a bazei de date este:

Figura 3.3 Diagrama bazei de date

54
3.3.4 Arhitectura sistemului

Figura 3.8 Diagrama sistemului

Pentru realizarea acestui sistem am urmărit diagrama reprezentată în (Figura 3. 8) astfe l
funcționarea poate fi descrisă astfel: în baza de date au fost introdus e informații medicale, tot
ceea ce ț ine de analize de laborator, diagnostice, istoric, proceduri, etc. Aplicația este realizată în
limbajul de programare C# în mediul Visual Studio 2013, acesta primește ca input datele unui
nou pacient. Posibilitatea alegerii algoritmului folosit permite predicția probabilității ca pacientul
ale cărui date au fost introduce să fie infectat în cazul algoritmului Naïve Bayes, respectiv clasa
din care face parte în cazul algoritmului SVM.
Algoritmul Naïve Bayes se folosește pentru a clasifica date neetichetate cu ajutorul unor
estimări folosind date de antrenare etichetate. Conform cu teorema Bayes se poate obține probabilitatea posterioară cunoscând proba bilitatea anterioară, probabilitatea ca un pacient să
prezinte o infecție.

55
Urmărind etapele algoritmului pentru antrenarea sistemului am introdus inițial un număr
mic de înregistrări. În această etapă algoritmul “învață” cazurile date manual în care se sp ecifică
din ce clasă fac parte: infecție sau non -infecție. Se calculează probabilitatea pentru fiecare clasă
în parte de forma atribut/clasă, dar pentru a evita problema dată de o probabilitate 0 ce are efecte
devastatoare pentru rezultat se utilizează uni formizarea (normalizarea) lui Laplace.
Cea de a doua etapă a algoritmului este utilizarea clasificatorului. Aici se dau ca input datele
pacientului după care se urmăresc atributele conform schemei din Figura 3.3 .4.1. Datele sunt
analizate și va rezulta p robabilitatea de infectare și non- infectare a pacientului
.

Pentru algoritmul SVM atât datele de antrenament cât și de test trebuie să fie în format
numeric, deoarece acest algoritm acest format primește. Folosind librăria LibSVM împreună cu
datele din baza de date algoritmul va rezulta clasa din care face parte pacientul (infecție sau non –
infecție).

56
Diagrama Use case

Figura 3.9: Diagrama Use Case a sistemului

Conform Figuri i 3.3.4.2 utilizatorul poate avea următoarele facilită ți:

1. Vizualizarea pacienților
Conform diagramei , utilizatorul are acces la lista pacienților, putând să urmărească care
sunt datele personale ale acesto ra. De asemenea printre aceste înregistrări se află și
datele de antrenament, putându- se urmării dacă cazul a fost predicționat corect.

57
2. Calcularea probabilității de infectare
Utilizatorul introduce datele noului pacient în formularul din aplicație. În cazul în care
nu au trecut 48 de ore de la internarea acestuia va aparea mesaj de informare. Daca totul
este completat ( mai ales câmpurile obligatorii ) utilizatorul poate afla probabilitatea de
infectare alegând tot odată atributele de care să țină cont. Cu cel de -al doilea algoritm
utilizatorul poate afla clas a din care face parte: infectare sau non -infectare .
3. Salvarea pacientului
În cazul algoritmului Naive Bayes dacă probabilitatea de infectare este mai mare de 80% utilizatorul poate salva datele pacientului infectat pentru a urmării evoluția lui medicală.

3.4 Dezvoltarea aplicatiei

3.4.1 Mediul de dezvoltare

Aplicaț ia a fost dezvoltată în Visual Studio 2013 în limbajul de programare c#, împreună
cu Workbench î n care s -a salvat baza de date.

58
Visual Studio include un set complet de instrumente de dezvoltare pentru generarea de
aplicații ASP.NET, Servicii Web XML, aplicații desktop și aplicații mobile. Visual Basic, Visual
C++, Visual C# și Visual J# toate folosesc același mediu de dezvoltare integrat (IDE) care le
permite partajarea instrumentelor și facilitează crearea de soluții folosind mai multe limbaje de
programare. Aceste limbaje permit să beneficieze de caracteristicile .NET Framework care oferă
acces la tehnologii cheie care simplifica dezvoltarea de aplicații web ASP și XML Web Services
cu Visual Web Developer.
C# este un limbaj de programare orientat -obiect conceput de Microsoft la sfârșitul anilor
90. A fost conceput ca un concurent pentru limbajul Java. Ca și acesta, C# este un derivat al
limbajului de programare C++.
Mysql WorkBench este o versiune free a celui mai capabil soft de dezvoltare de baze de
date relationale. Mysql WorkBench es te usor de instalat si usor de folosit.
Acesta are o interfata usor de folosit ce ofera:
• Administrare baza de date
• Creare de tabele,view -uri si alte obiecte ale bazei de date
• Rularea de queri -uri si scripturi SQL
• Generarea de rapoarte
Libraria LibSVM
Pentru folosirea algoritmului Support Vector Machine am integrat libr ăria LibSVM .
Pentru integrarea acesteia am urmat pașii:
1. Am descărcat libră ria LibSVMsharp 1.2.4 de pe site- ul www.nutget.org
2. Pentru integrarea acestuia î n Visual Studio 2013, se deschide consola Package
Manager(Figura 3.10).

59

Figura 3.10: Configurare Li bSVM -Deschiderea ferestrei Package Manager Console
3. În linia de comandă a acest ei console se rulează comanda “ Install -Package
LibSVmsharp”:

Figura 3.11: Configurare LibSVM -Package Manager Console

60
4. În acest moment în structura proiectului vor apă rea modulele de LibSVM (Figura
3.12).

Figura 3.12: Structura proiectului după inst alare LibSVM
3.4.2 Structura modulelor

Figura 3.13: Diagrama Claselor

61
Conectarea la baza de date
1. Setarea datelor de configurare:
string mysqlCon = "server=127.0.0.1;uid=root;database=dblicenta;" ;
2. Apelarea metodei din clasa DatabaseCRUD de încărcarea a datelor, în care se crează ș i
conexiunea cu baza de date:
MySqlDataAdapter MyAdapter;
MySqlCommand MyCommand2;
MySqlConnection MyConn2;
public void loadData( string sql, DataGridView dg, DataTable dt)
{

MyConn2 = new MySqlConnection(mysqlCon);

MyCommand2 = new MySqlCommand(sql, MyConn2);

MyAdapter = new MySqlDataAdapter ();

MyAdapter.SelectCommand = MyCommand2;
MyAdapter.Fill(dt);
dg.DataSource = dt;
MyConn2.Close();
}
string Query = "select id_pacient as \"Nr.crt \",nume_prenume as \ "Nume si prenume\ ", cnp as \ "CNP \",
data_nasterii as \ "Data nasterii \"," +
"sex as \ "Sex \", data_internare as \"Data internarii\ ", diagnostice.denumire as
\"Diagnostic \",simplomatologie.denumire as \ "Simptomatologie \"," +
"poarta_intrare.denumire as \ "Poarta intrare \",in_anterioara as \ "IN anterioara
(DA/NU) \",data_antrenament as \ "Antrenament (DA/NU) \",infectie from " +
"date_pacienti,diagnostice,simplomatologie,poarta_intrare where
date_pacienti.id_diagnostic=diagnostice.id_diagnostic and
date_pacienti.id_simptom=simplomatologie.id_simptom and
date_pacienti.id_poarta_intrare=poarta_intr are.id_poarta_intrare " ;// and data_antrenament= \"nu\"
con.loadData(Query, dgvpacienti,dTable);

unde con este un obiect al clasei: DatabaseCRUD con= new DatabaseCRUD ();
dgvpacienti – datagridview în care se încarcă înregistră rile;
dTable – obiect de tip Datatable;

62
Pregă tirea datelor de antrenament

Atât Naive Bayes dar mai ales Support Vector Machine au nevoie de date de antrenament
în format diferit. Pentru N aive Bayes datele sunt sub formă de string într-o ordine prestabilită:
diagnostic, vârstă, simptom, poartă intrare microorganism, infecț ie nosocomia lă anterioară,
infecț ie.
string [] data = new string [dAntrenament.Rows.Count];
string [] antrenam= new string [dAntrenament.Rows.Count];
for (int rows = 0; rows < dAntrenament.Rows.Count; rows++)
{
DateTime vrst = Convert .ToDateTime(dAntrenament.Rows[rows][ "Data nasterii" ]);
varstanr1 = DateTime .Now.Year -vrst.Year;
if (varstanr1 <= 14) varsta1 = "copil" ;
else if ((varstanr1 <= 20) && (varstanr1 > 15)) varsta1 = "adolescent" ;
else if ((varstanr1 <= 45) && (varstanr1 > 21)) varsta1 = "adult" ;
else varsta1 = "batran" ;

data[rows] = dAntrenament.Rows[rows][ "Diagnostic" ].ToString() + "," + varsta1 + "," +
dAntrenament.Rows[rows][ "Simptomatologie" ].ToString() + "," + dAntrenament.Rows[rows][ "Poarta
intrare" ].ToString() + "," + dAntrenament.Rows[rows][ "IN anterioara (DA/NU)" ].ToString() + "," +
dAntrenament.Rows[rows][ "infectie" ].ToString() ;

int diagnosticIndex = meth.IndexAtribute(0, dAntrenament.Rows[rows][ "Diagnostic" ].ToString()) + 1;
int varstaIndex = meth.IndexAtribute(1, varsta1) + 1;
int simptomIndex = meth.IndexAtribute(2, dAntrenament.Rows[rows][ "Simptomatologie" ].ToString()) +
1;
int intrareIndex = meth.IndexAtribute(3, dAntrenament.Rows[rows][ "Poarta intrare" ].ToString()) + 1;
int inAnteeIndex = meth.IndexAtribute(4, dAntrenament.Rows[rows][ "IN anterioara
(DA/NU)" ].ToString()) + 1;
int clasa;
if (dAntrenament.Rows[rows][ "infectie" ].ToString() == "da") clasa = 1;
else clasa = – 1;

antrenam[rows]= clasa + " 1:" + diagnosticIndex + " 2:" + varstaIndex + " 3:" + simptomIndex + " 4:" +
intrareIndex + " 5:" + inAnteeIndex;

}

using (StreamWriter writetext = new
StreamWriter (@"D: \FACULTATE \LICENTA!!!!!!! \Implementare \\AplicatieLicenta1.4 \AplicatieLicenta
\datedeantrenament.txt" ))
{
for (int i = 0; i < dAntrenament.Rows.Count; i++)
{
writetext.WriteLine(antrenam[i]);
}
}

63

Pentru SVM datele de antrenament trebuie să fie î n format numeric, astfel după o
parcurgere a tabelului în care sunt încărcate datele din baza de date acestea sunt procesate ș i
salvate diferit pen tru cei doi algoritmi. Vectorul data[] este folosit pentru datele din cazul Naive
Bayes iar antrenam[] pentru SVM. Î n cazul algorimului S VM atributele sunt considerate î n
aceaș i ordine dar au asociat câte un index (diagnostic=1, vârstă =2, simptom=3 , poartă intrare
microorganism=4 , infecț ie nosocomia lă anterioară =5) și fiecare atribut are la rândul său indexate
valorile ce le poate lua, spre exemplu clasele algorimului sunt indexate astfel infectare=1 ș i non-
infectare=- 1.
Vârsta este pusă pe categorii, existând intervale pentru fiecare perioadă (copil, adolescent, adult,
bătrân).

Exemplu de trecere î n format numeric pentru SVM:

diabet, adult, febra, pulmonara, da,da = 1 1:1 2:3 3:1 4:2 5:1

Introducerea datelor de test
La fel ca și datele de antrenament, datele de test trebuie să aibă formatul specific
algoritmului, astfel cu ajutorul formularului din interfaț a, utilizatorul introduce informaț iile iar
acestea sunt trimise ca date de intrar e la fiecare algoritm î n parte.
Calcularea probabilitaț ii Naive Bayes
public int Clasifica( string diagnostic, string varsta, string simpto, string intrare, string inAnte, int[][][]
atributCounts, int[] dependentCounts, bool withSmoothing, int xClasses, TextBox infectaretxt, TextBox
noninfectaretxt,CheckedListBox checkedListBox2)
{
double partProbInfectie = ProbabilitatePartiala( "da", diagnostic, varsta, simpto, intrare, inAnte,
atributCounts, dependentCounts, withSmoothing, xClasses, checkedListBox2); Infectie anterioar= da
Infectie=da
Diagnostic=diabet Varsta=adult Simptom=febra
Poarta de intra re=pulmonara

64
double partProbNonInfectie = ProbabilitatePartiala( "nu", diagnostic, varsta, simpto, intrare,
inAnte, atributCounts, dependentCounts, withSmoothing, xClasses, checkedListBox2);
double evidence = partProbInfectie + partProbNonInfectie;
double probInfectie = partProbInfectie / evidence;
double probNonInfectie = partProbNonInfectie / evidence;

//richTextBox1.Text += "Probability of da = " + probInfectie.ToString("F6");
infectaretxt.Text = probInfectie.ToString( "F4");
// richTextBox1.Text += "\n";
// richTextBox1.Text += "Probability of nu = " + probNonInfectie.ToString("F6");
noninfectaretxt.Text = probNonInfectie.ToString( "F4" );

if (probInfectie > probNonInfectie) // threshold
return 0;
else
return 1;
}

public double ProbabilitatePartiala( string infectie, string diagnostic, string varsta, string simpto,
string intrare, string inAnte, int[][][] atributCounts, int [] dependentCounts, bool withLapl acian, int
xClasses, CheckedListBox checkedListBox2)
{
int infectieIndex = IndexAtribute(5, infectie);

int diagnosticIndex = IndexAtribute(0, diagnostic);
int varstaIndex = IndexAtribute(1, varsta);
int simptoIndex = IndexAtribute(2, simpto);
int intrareIndex = IndexAtribute(3, intrare);
int inAnteIndex = IndexAtribute(4, inAnte);

int totalInfectie = dependentCounts[0];
int totalNonInfectie = dependentCounts[1];
int totalCases = totalInfectie + totalNonInfectie;

int totalToUse = 0;
if (infectie == "da") totalToUse = totalInfectie;
else if (infectie == "nu" ) totalToUse = totalN onInfectie;

double p0 = (totalToUse * 1.0) / (totalCases);
double p1 = 0.0;
double p2 = 0.0;
double p3 = 0.0;
double p4 = 0.0;
double p5 = 0.0;

if (withLaplacian== false )
{
p1 = (atributCounts[0][diagnosticIndex][infectieIndex] * 1.0) / totalToUse;
p2 = (atributCounts[1][varstaIndex][infectieIndex] * 1.0) / totalToUse;

65
p3 = (atributCounts[2][simptoIndex][inf ectieIndex] * 1.0) / totalToUse;
p4 = (atributCounts[3][intrareIndex][infectieIndex] * 1.0) / totalToUse;
p5 = (atributCounts[4][inAnteIndex][infectieIndex] * 1.0) / totalToUse;

}
else if (withLaplacian == true)
{
p1 = (atributCounts[0][diagnosticIndex][infectieIndex] + 1) / ((totalToUse + xClasses) * 1.0);
p2 = (atributCounts[1][varstaIndex][infectieIndex] + 1) / ((totalToUse + xClasses) * 1.0);
p3 = (atributCounts[2][simptoIndex][infectieIndex] + 1) / ((totalToUse + xClasses) * 1.0);
p4 = (atributCounts[3][ intrareIndex][infectieIndex] + 1) / ((totalToUse + xClasses) * 1.0);
p5 = (atributCounts[4][inAnteIndex][infectieIndex] + 1) / ((totalToUse + xClasses) * 1.0);

}
double a = Math .Log(p0);

if (checkedListBox2.GetItemChecked(0))
{
a += Math .Log(p1);

} if (checkedListBox2.GetItemChecked(1))
{
a += Math .Log(p2);

} if (checkedListBox2.Get ItemChecked(2))
{
a += Math .Log(p3);

} if (checkedListBox2.GetItemChecked(3))
{
a += Math .Log(p4);

}
if (checkedListBox2.GetItemChecked(4))
{
a += Math .Log(p5);
}
return Math .Exp(a);
}
}
Pentru a rezulta probabilitatea cazului se apeleaza metoda Calculeaza() ce fol osește
metoda Probabilita tePartiala() pentru a calcula probabilitatea pentru fiecare clasă î n parte. Se
determină dependențele fiecărui atribut în parte cu cele 2 clase, aflându -se frecvența de apariț ie a
fiecarui caz . Astfel după calcularea probabilităț ii fiecarui caz în parte se află valoar ea evidence.
Probabilitatea parțială se calculează în funcț ie de atributele setate pentru calcul.

66

Stabilirea clasei pacientului cu Support Vector Machine
Dupa cum am prezentat libră ria LibSVM are implemen tate metodele de predicție și
calculează planul ce desparte optim datele mele de antrenament. Astfel eu am dat la intrare datele
de antrenament și cazul de testat ș i rezultă clasa de apartenenț a: infectare sau non -infectare.
SVMProblem problem =
SVMProblemHelper .Load( @"D: \FACULTATE \LICENTA!!! !!!!\Implementare \\AplicatieLicenta1.4 \A
plicatieLicenta\ datedeantrenament.txt" );
SVMProblem testProblem =
SVMProblemHelper .Load( @"D: \FACULTATE \LICENTA!!!!!!! \Implementare \AplicatieLicenta1.4 \A
plicatieLicenta\ datedetest.txt" );

SVMParameter parameter = new SVMParameter ();
parameter.Type = SVMType .C_SVC;
parameter.Kernel = SVMKernelType .LINEAR;
parameter.C = 1;
parameter.Gamma = 1;
SVMModel model = SVM .Train(problem, parameter);

double [] target = new double [testProblem.Length];
for (int i = 0; i < testProblem.Length; i++)
{
target[i] = SVM .Predict(model, testProblem.X[i]);
if (target[i]==1)
textBox3.Text= target[i] + "->infectat" ;
else textBox3.Text = target[i] + "->non- infectat" ;
}

double accuracy = SVMHelper .EvaluateClassificationProblem(testProblem, t arget);
textBox2.Text = accuracy.ToString( "F4");
În prima parte se încarcă fișierele ce conțin datele de antrenament ș i datele de test deja
trecute î n for mat numeric în etapa anterioară a acestui algoritm. Am folosit ke rnel linear dar se
poate testa ș i cu cel polinomial, R BF, sigmoid. Diferența dintre acestea fiind dată de formula de
calcul a planului optim dintre cele 2 clase. Setarea kernelului se face prin folosirea metodei
SVMKernelType. Acest exemplu este făcut pentru testarea mai multor date de test deodată,
rezultând pentru fiecare î n parte 1 (infectat) sau -1 (non- infectat). Acuratețea este evaluată tot
printr -o metodă a libră riei.

67
3.4.3 Interfaț a cu utilizatorul

Pagina de start a aplicației prezintă tabelul cu datele pacienț ilor:

Figura 3.14 Afișarea pacienților

Al doilea tab al aplicației prez intă interfața de dialog cu utilizatorul(1), î n care introduce
datele noului pacient suspect de infecție nosocomială . Urmând secțiunea î n care se aleg atributele
de care să țină cont(2). Iar în final calculul probabilității cazului , secțiunea(3) pentru Naive
bayes sau (4) pentru SVM.

Figura 3.15 Predictia infecției nsocomiale
1 2
3
4

68

Figura 3.16 Eroare ce apare dacă nu au trecut 48 de ore

Pe parcursul completării datelor pacientului, în câ mpul „Data internare” se ține cont de o
parte a definiției infecților nosocomiale ce presupune c ă aceste infecț ii apar la 48 de ore de la
internare. Astf el dacă data de internare a pacientului este mai recentă de 48 de ore va apărea
mesajul de atenție în care se așteaptă confirmarea continuă rii pre dicției.

Figura 3.17 Aplicare Naive Bayes

În cadrul acestui câmp se calculează probabilitatea de infectare a pacientului introdus.
Fiind selectate atributele și de asemenea dacă este sau nu utilizată normalizarea Laplace apăsând
pe butonul „ Calculează probabilitate” , în cel de –al doilea panal vor fi afiș ate v alorile rezultate,
afișându- se mesajul „Pacientul cel mai probabil nu este infectat”(cum este î n cazul prezent at)

69
pentru ca prag ul este setat pe 0.5. De asemenea dacă probabilitatea de infectare este mai mare de
80% va apă rea butonul „Salvează pacient”.

Figura 3.18 Salvare pacient

O altă parte a aplicaț iei presupune stabilirea clasei de infectare a pacientului. Următorul
panal cal culeaza cu ajutorul librăriei LibSVM planul de despărțire al celor 2 clase dând la intrare
datele de ant renament convertite î n format numeric. Cum algoritmul es te unul supervizat se dă la
intrare și ceea ce dorim să rezulte (clasa din care face parte). Se completează câmpul, apoi se
apasă butonul „ Stabilește clasă pacient” ce va rezulta clasa pacientului. ( 1 -infectat, -1 – non-
infectat).

Figura 3.19 Aplicare SVM

70
CAPITOLUL IV . CONCLUZII
4.1 Experimente ș i rezultate

Figura 4.1: Grafic cu rezultatele algoritmului Naive Bayes folosind sau nu normalizarea
Laplace

Pentru o testare a 7 cazuri folosit înregistră ri dublate, probabilitatea de infectare a
pacientului a rezultat diferit în funcție de utilizarea normalizării (Figura 4.1). Astfel în cazul
folosir ii unei normalizări, rezultatul este mai exact, oferind o probabilitate apropiată de realitate a
cazului, care sunt șansele reale ca pacientul să contacteze o infecție.

În Figura 4.2 am testat 8 cazuri noi pe acelaș i set de antrenament pent ru 3 situații: Naive
Bayes cu normalizare Laplace, Naive Bayes fără normalizare Lapl ace ș i algoritmu l SVM. Se
observă că există cazuri î n care cei doi algoritmi au dat diferit, în situația în care Naive Bayes a
dat o probabilitate de infectare apropiată de pragul 0.5, algoritmul SVM a rezultat că pacientul se
afla î n clasa infectare. Experimentul format din 8 cazuri în 2 dintre acestea algoritmii s -au
contrazis iar în restul rezultatele au fost la fel. Cu toate acestea algoritmul SVM nu oferă o
probabilitate ca Naive Bayes, de aceea nu există o comparație egală. 00.20.40.60.811.2
1 2 3 4 5 6 7
Cazuri pacien țiI
NFECȚI
E
Cu normalizare Laplace fărănormalizare Laplace

71

Figura 4.2: Grafic cu rezultatele testarii algorimului Naive Bayes si SVM

4.2 Limitări

Sistemul automatizat a folosit datele din sistemul informatic al spitalului depistâ nd cazurile
de infecție nosocomiale. Cu toate acestea nu toate cazurile de infecție nosocomiale au putut fi
depistate cu o acuratețe semnificativă. Datele necesare din laborator și analizele pacienților oferă
un punct de plecare important, dar, pentru o creștere considerabila a acurateței ar trebui făcute
corelații între localizarea în saloane a infecțiilor raportate, personalul medical, timpul si perioada
de spitalizare, etc.
4.3 Dezvoltă ri ulterioare

Ne propunem îmbunătățirea sistemului prin introducerea tehnicilor de data mining și
crearea unui spațiu multidimensional cu mai multe clase în cazul algoritmilor Suport Vector -1.2-1.1-1-0.9-0.8-0.7-0.6-0.5-0.4-0.3-0.2-0.100.10.20.30.40.50.60.70.80.911.11.2
1 2 3 4 5 6 7 8
CAZURI TESTATEI
NFECTAR
E
Naive Bayes cu normalizare Laplace
Naive Bayes fara normalizare Laplace
Support vector Machine

72
Machines pentru a putea depista tipul infecției contactată de pacient, creând câte o clasă pentru
fiecare nou tip.
De asemenea generalizarea algoritmului Naive Bayes pentru a putea introduce mai multe
atribute și valori ale acestora. Studiul altor algorit mi pe această temă și realizarea unei statistici
între algoritmii folosiți pentru a selecta pe cel mai avantajos.

4.4 Participare la concursuri

Sub î ndrumarea domnului profesor coordonator am participat la Sesiunea de Comunicări
a cercurilor științifice studențești în domeniul ingineriei electrice, electronice, control și
calculatoare- sccss -ieecc, Ploiești , 26- 27 mai 2016. În cadrul acestei conferințe am realizat un
articol despre această temă ce va fi publicat.

73

CAPITOLUL V. BIBLIOGRAFIE
Referinte web:
[1] https://ro.wikipedia.org/wiki/Infec%C8%9Bie_nosocomial%C4%83
[2] http://cursuriamg.blogspot.ro/2012/09/infectii -nosocomiale.html
[4]- http://ceaccp.oxfordjournals.org/content/5/1/14.full
[5] http://www.cnscbt.ro/index.php/metodologii/infectii -nosocomiale/224 -metodologie -2015-
sentinela -noso- amr/file
[6] http://www.creeaza.com/familie/medicina/DETERMINAREA -SPECTRULUI -DE-
SEN568.php
[7] http://jurnalul.ro/viata -sanatoasa/medicul -de-familie/antibiograma -ucide -bacteriile-
287918.html
[8] http://www.buzzle.com/articles/use -of-computers -in-the-medical -field.html
[10] http://ittrends.ro/2015/01/stiinta -calculatoarelor -si-lumea -medicala -prieteni -de-cursa-
lunga/
[11] http://www.sciencemuseum.org.uk/broughttolife/themes/technologies
[12] http://www.buzzle.com/articles/uses -of-computers -in-hospitals.html
[13] https://ro.wikipedia.org/wiki/Antibiogram%C4%83
[14] www.opensourceforu.com
[15] www.stackoverflow.com
[16] Statistica în domeniu – http://ecdc.europa.eu/en/healthtopics/Healthcare –
associated_in fections/Pages/index.aspx

74

[17] www.techopedia.com
[18] www.w3schools.com
[20] http://profs.info.uaic.ro/~ipistol/ia0910/res/IA.pdf
Cărți:
[3] Robert E. Hoyt MD FACP – Medical Informatics – Practical Guide for the
Healthcare Professional
[9] The Computer Meets Medicine and Biology: Emergence of a Discipline
EDWARD H. SHORTLIFFE AND MARSDEN S. BLOIS
[21]Machine Learning, Tom Mitchell, McGraw Hill, 1997

Articole:
[22] D. Benhaddouche A. Benyettou – Control of Nosocomial Infections By Data Mining

[23] Gilles Cohen, Me´lanie Hilario, Hugo Sax, Ste´phane Hugonnet, Antoine Geissbuhler –
Learning from imbalanced data in surveillance of nosocomial infection
[24] Eva Silva,Luciana Cardoso, Filipe Portela, Antonio Abelho, Manuel Filipe Santos si Jose –
Predicting Nosocomial Infection by Using Data Mining technologies
[25] Evelina Lamma, Paola Mello, Anna Nanetti, Fabrizio Riguzzi, S ergio Storari și Gianfranco
Valastro – Artificial Intelligence Techniques for Monitoring Dangerous Infections
[26] S. Bouzbid , Q. Gicquel, S. Gerbier, M. Chomarat, E. Pradat, J. Fabry, A. Lepape,
M.-H. Metzger – Automated detection of nosocomial infect ions: evaluation of different
strategies in an intensive care unit 2000- 2006
[27] L. Pokorny, PT; A. Rovira, MD; M. Martı´n- Baranera, MD, PhD; C. Gimeno, MD;C.
Alonso- Tarre´s, MD, PhD; J. Vilarasau, MD, PhD – Automatic Detection of Patients with

75
Nosocomia l Infection by a Computer -Based Surveillance System: A Validation Study in a
General Hospital
[28] Cristina Bellini, MD; Christiane Petignat, MD; Patrick Francioli, MD; Aline Wenger,
Biologist, FAMH; Jacques Bille, MD; Adriana Klopotov, MS; Yannick Vallet, MS; Rene´
Patthey, MS; Giorgio Zanetti, MD, MS – Comparison of Automated Strategies for Surveillance
of Nosocomial Bacteremia

Similar Posts