. Teoria Grafurilor 2
PARTEA GENERALA
INTRODUCERE
Studiul proprietatilor combinatiilor chimice a condus spre rezultate teoretice importante atunci cand a apelat la instrumente generate de matematica si fizica si a gasit pentru acestea aplicatii practice directe atunci cand sistematizarea proprietatilor biologice a devenit un scop esential. Sintezele compusilor chimici în scopul testarii activitatii lor biologice au fost rezolvate eficient apeland la tehnici constituite astazi într-un domeniu independent denumit chimie combinatoriala [1-4] iar alegerea structurilor moleculare cu sanse ridicate de a avea proprietatile dorite a putut fi abordata cu ajutorul chimiei computationale [5-7]. Au fost elaborate astfel arhitecturi moleculare cu proprietati prestabilite ce ulterior au putut fi verificate cu eforturi experimentale minime.
Capitolul 1
TEORIA GRAFURILOR. CONSIDERATII GENERALE
Introducere
Primele notiuni in teoria grafurilor ca parte integranta a matematicii au fost definite in anul 1736 de catre Euler in manuscrisul sau “The Seven Bridges of Königsberg”. O atentie deosebita a fost acordata teoriei grafurilor de catre A. Cayley [8] in anul 1895, iar Kirchhoff a dezvoltat în aceeasi perioada primele aplicatii la studiul circuitelor electronice. Studiul teoriei grafurilor a fost stimulat de aparitia in 1936 a tratatului lui D. König [9]. Daca la inceput teoria grafurilor era utilizata la obtinerea unor solutii pentru jocuri si amuzamente matematice, astazi este aplicata in economie, in chimie, sociologie, psihologie si inginerie. La utilizarea teoriei grafurilor in diverse domenii si-au adus contributia si autorii romani, una din primele carti din acest domeniu apartinand matematicianului I. Tomescu [10].
1.2. Grafuri si subgrafuri
Graful este o pereche G = (V, E) ce satisface relatia E[V]2 [10-12]. Elementele multimii V sunt varfuri (noduri sau puncte) ale grafului G iar elementele lui E sunt muchiile (liniile). Fiecare varf este indicat printr-un punct si fiecare muchie printr-o linie. Setul de varfuri al grafului G se refera la V(G) iar setul de muchii la E(G). Numarul de varfuri al grafului G, notat |G|, reprezinta ordinul acestuia iar numarul de muchii este notat prin ||G||. In Figura 1a si 1 b sunt prezentate doua tipuri de astfel de grafuri.
1a 1b
V = {1,..,5} V = {1,…,8}
1a: E = {{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}}
1b: E = {{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{3,4},{5,8},{6,7}}
Figura 1. Grafuri si elementele constructive (varfuri-V, muchiile-E)
Grafurile pot fi finite sau infinite. Grafurile se numesc finite daca numarul varfurilor si muchiilor acestor grafuri este finit iar daca ordinul grafului este 0 sau 1 se numesc grafuri triviale. Un varf v este incident cu o muchie e daca ve. Doua grafuri A si B se numesc identice daca V(A) = V(B) si E(A) = E(B). Daca varfuri x si y ale unui graf G sunt adiacente atunci cele doua varfuri formeaza o muchie xy a lui G in timp ce doua muchii e≠ f sunt adiacente daca au un capat comun [10-12].
Daca pentru doua grafuri G = (V, E) si G’ = (V’, E’) exista o functie bijecta :VV’ cu xy E (x)(y) E’ pentru toate varfurile x, y V atunci grafurile se numesc izomorfe iar daca G = G’ atunci se numesc grafuri automorfe. In Figura 2 sunt prezentate grafurile G si G’ izomorfe.
G G’
Figura 2. Grafurile G si G’ cu proprietatea de izomorfism
Daca intr-un graf fiecare pereche de varfuri distincte este unita printr-o muchie se numeste graf complet in timp ce un graf partial al grafului G = (V, E) este graful G1 = (V, E1) unde E1 E, deci graful partial se obtine prin suprimarea anumitor legaturi dintre varfurile lui G [10-12]. Figura 3 prezinta graful complet 3a si graful partial 3b corespunzator grafului complet 3a.
3a 3b
Figura 3. Graful complet 3a si graful partial 3b corespunzator grafului complet 3a
Daca multimea varfurilor unui graf G poate fi partitionata in doua multimi disjuncte de varfuri, V(G) = V1U V2, astfel incat fiecare muchie uneste un varf din V1 cu un varf din V2, graful G se numeste bipartit.
Un subgraf al unui graf G = (V, E) se defineste in mod asemanator cu notiunea de submultime: el este un graf G1 = (V1, E1) unde V1 V iar E1 reprezinta toate legaturile dintre varfurile V1 care existau in graful G.
Un graf G (4a) si unul din subgrafurile posibile 4b pentru graful G sunt prezentate in Figura 4.
4a 4b
Figura 4. Graful G (4a) si unul din subgrafurile posibile 4b
Grafuri conexe
Un graf G se numeste conex daca are proprietatea ca oricare doua varfuri ale sale sunt legate printr-un drum (succesiune de varfuri conectate dintre oricare doua varfuri luate in considerare) din G. Notiunea de conexitate isi are aplicabilitate practica in diferite domenii cum ar fi telecomunicatiile, transporturi etc.
Se numeste graf neorientat, o pereche ordonata de multimi notata G = (X, U), unde X = {x1, x2, …, xn} este o multime finita si nevida de elemente numite varfuri, iar U = {u1, u2, …, un} este o multime de perechi neordonate de elemente din X numite muchii.
Un graf G se numeste conex daca pentru orice pereche de varfuri distincte x, y ale lui G, exista un lant de extremitati x si y in G.
Un graf G se numeste graf fara circuite daca nodul initial cu care se incepe in parcurgerea grafului nu coincide cu cel final.
O proprietate speciala a grafurilor este acea ca grafurile in anumite conditii pot fi arbori.
Un arbore este un graf neorientat, conex si fara circuite. Pentru orice arbore este valabila relatia :
E = V – 1 (1)
unde E este numarul de muchii iar V este numarul de varfuri.
In Figura 5 este prezentat un astfel de tip de arbore.
Figura 5. Arbore neorientat si conex
Aplicatii ale teoriei grafurilor in chimie
Grafurile constitutionale reprezinta unul din tipurile de grafuri care prezinta interes pentru chimie. Formulele constitutionale au fost utilizate pentru prezicerea numarului izomerilor constitutionali din vremea cand teoria structurii chimice a fost creeata de Kekulé, Couper, Crum-Brown si Butlerov in 1850-1870. Fundalul matematic al teoriei grafurilor a fost formulat in acelasi timp de catre Cayley care propune un algoritm pentru calcularea numarului de izomeri constitutionali pentru alcani, CnH2n+2 si alchil derivati (ex. CnH2n+1Cl) [8, 13]. Astfel (chimia si in particular chimia organica) poate fi considerata prima sursa independenta din cele trei existente pentru inceputul teoriei grafurilor, celelalte doua surse fiind teoria retelelor electrice a lui Kirchhoff si topologia dupa Euler [14].
1.4.1. Izomerie constitutionala si sterica
Formulele stereochimice introduse in chimia organica de catre Van’t Hoff [15] si Le Bel [16] si in chimia anorganica de catre Werner [17] sunt de fapt grafuri topologice in timp ce o formula de schelet reprezinta un subgraf, iar formula unui heterociclu sau carbociclu – un graf ciclic. Izomerii de catena se diferentiaza unii fata de altii prin formule care reflecta de fapt, conectivitatile lor diferite [14,18-23]. Algoritmul matematic propus de Cayley pentru calcularea numarului de izomeri constitutionali pentru alcani, CnH2n+2 si alchil derivati [8, 13] a fost ulterior imbunatatit de catre Henze si Blair [24] iar Polya a gasit o cale matematica eleganta pentru rezolvarea problemelor stereoizomerismului[25] solutie cunoscuta sub numele de teorema lui Polya.
Teoria grafurilor demonstreaza ca: i) exista doi heptani chirali 6a si 6b in care atomii de carbon chirotropici / stereogenici sunt prezentati cu un atom de hidrogen; ii) alcanul 6c izomer al octanului este meso [22, 26].
6a 6b 6c
6a 6b 6c
Figura 6. Reprezentarea grafurilor constitutionale pentru heptanii izomeri 6a si 6b si a meso-alcanul 6c isomer al octanului
1.4.2 Izomerie de valenta
Izomerii de valenta reprezinta o subclasa a izomerilor constitutionali care pot fi definiti utilizand conceptele teoriei grafurilor astfel: daca doua grafuri fara hidrogen au aceeasi partitie a gradelor varfurilor atunci acestea corespund la doi izomeri de valenta [22, 27]. Cel mai interesant caz de izomerie de valenta il prezinta anulenele (CH)n care sunt grafuri de gradul 3 cand sunt reprezentate fara hidrogeni. Pentru n = 6 (CH)6 sunt posibile sase grafuri cubice care sunt prezentate in Figura 7 [22] dar si 211 grafuri care sunt izomeri cu C6H6 (benzen) dar nu si izomeri de valenta cu benzenul [28].
7a 7b 7c
7d 7e 7f
7a 7b 7c 7d 7e 7f
Figura 7. Grafurile constitutionale pentru anulenele (CH)6
Chimia anulenelor, impulsionata de predictiile teoriei grafurilor a preocupat si preocupa multi chimisti [29, 30] un loc aparte ocupandu-l Profesorul Nenitzescu care impreuna cu echipa sa [31] sintetizeaza primul isomer de valenta pentru anulena (CH)10 (Figura 8) care va fi numita mai tarziu de Doering [32] hidrocarbura Nenitzescu.
Figura 8. Hidrocarbura Nenitzescu si graful caracteristic
Conceptele teoriei grafurilor au fost utilizate si pentru dezvoltarea unor programe pentru calculator capabile sa genereze izomerii pentru o formula moleculara data. Programul dezvoltat de Lederberg si colaboratorii [33] numit DENDRAL alaturi de date RMN si de spectrometrie de masa poate genera izomeri pentru orice substanta cu masa moleculara mai mica de 1000.
1.4.3. Hidrocarburi aromatice policiclice
Hidrocarburile aromatice policiclice, cei mai cunoscuti compusi carcinogeni, sunt clasificati [21, 22] in doua mari clase : i) cata-condensate care nu au puncte comune la trei inele benzenice; ii) peri-condensate care au puncte comune la trei nuclee benzenice. In Figura 9 sunt prezentate grafurile pentru trei hidrocarburi cata-condensate (naftalina 9a, fenantrenul 9b si antracenul 9c) si pentru doua hidrocarburi peri-condensate(pirenul 9d si perilenul 9e).
9a 9b 9c 9d 9e
Figura 9. Grafurile constitutionale pentru cele mai cunoscute hidrocarburi aromatice cata- si peri-condensate
Acestor hidrocarburi aromatice din perspectiva teoriei grafurilor li se asociaza un al doilea tip de graf denumit graf dual [21, 22]. Aceste grafuri au ca varfuri centrele inelelor benzenice iar varfurile sunt conectate daca inelele benzenice sunt condensate. Sistemele cata-condensate au grafuri duale aciclice cat si ciclice dar nu pot avea trei inele ca membri iar cele peri-condensate au grafuri duale cu trei inele ca membri.
Pentru hidrocarburile aromatice benzenoide cata-anelarea se poate realiza pe diverse laturi ale inelului aromatic, pentru descrierea corecta a structurii propunandu-se o codare specifica[34]. In acest sistem de codare se utilizeaza cifra 0 pentru anelarea liniara si 1 sau 2 pentru simbolizarea directiilor alternative (Figura 9, naftalina 9a). Ulterior au fost dezvoltate o serie de programe pentru studiului fenomenului de cata-anelare in cazul hidrocarburilor aromatice benzenoide [35].
Pentru codarea sistemelor peri-condensate au fost propuseru codarea sistemelor peri-condensate au fost propuse doua alternative [22, 36]. In prima alternativa se specifica prezenta inelelor benzenice (varfuri ale grafului dual) in zone concentrice in jurul unui centru topologic al sistemului hexagonal, acest centru nefiind specificat in notatie. Prima zona concentrica are numerele 1-6 in care 1 leaga partea de la suprafata stanga de centru printr-o linie orizontala iar a doua zona concentrica are numerele 1-12. Acest sistem este orientat astfel incat sa se minimizeze numerele in prima zona concentrica dupa anumite reguli bine precizate. Aceasta situatie in care sunt specificate inelele benzenice este prezentata in Figura 10.
Figura 10. Prima alternativa de codare a sistemelor peri-condensate
In a doua situatie se suprapune sistemul hexagonal peste o grila (Figura 11, 11a) astfel incat se minimiza suprafata paralelogramului circumscris si numarul de randuri pe care este suprapus sistemul. Prezenta unui varf al grafului dual este notata cu 1 iar absenta cu 0. Aceasta a doua forma de codare este prezentata pentru fenantren si crisen in Figura 11.
11a-Suprafata ,,grid’’ 11b-[1,3]triacene 11c-[3,6]tetracene
Figura 11. A doua alternativa de codare a hidrocarburilor benzenoide
1.4.4. Concatenarea 3D-Protohelixurilor in poliedre regulate
Definitia 1. Protohelixurile sunt cele mai simple tipuri de structuri care prin procedee obisnuite conduc la structuri mai complicate.
Definitia 2: Un obiect n-dimensional care nu se suprapune prin nici rotatie in spatial n-dimensional peste imaginea sa in oglinda se numeste chiral [37].
Definitie3: Concatenarea reprezinta fenomenul de asociere a doua sau mai multe protohelixuri astfel incat doua varfuri se contopesc intr-unul [37].
Prin concatenarea unor protohelixuri se pot obtine poliedre achirale. Un astfel de exemplu in constituie cele 13 poliedre Arhimedice semiregulate din care doua sunt chirale. Un alt exemplu binecunoscut il reprezinta Buckminsterfulerena care este tot un poliedru Arhimedic semiregulat achiral [37].
Un exemplu spectaculos il reprezinta un cub format din doua semicuburi astfel incat ansamblul celor patru protohelixuri poate avea aceasi chiralitate sau exista doua perechi de antipozi (Figura 12, 12a, 12b). Prin intoarcerea unor astfel de protohelixuri se formeaza doua cuburi (Figura 12, 12c, 12d).
12a 12b 12c 12d
Figura 12. Formarea cubului din protohelixuri cu aceasi chiralitate sau chiralitate in opozitie (diagrama Schlegel)
Un alt exemplu interesant de poliedru chiral este reprezentat de izomerii cu pentagoane izolate ai fulerenelor. Fulerena C60 numita si buckminsterfulerena prezinta 1812 izomeri constitutionali dar numai unul prezinta pentagoane isolate; la fel, pentru fulerena C70 exista un singur izomer cu pentagoane izolate.
1.4.5. Grafuri de reactie
O alta clasa de grafuri cu aplicatii in chimie [21, 22] care asociaza varfurilor dintr-un graf ansambluri de atomi si muchiilor tranzitii elementare intre doua astfel de ansambluri se numesc grafurilor de reactie. Primul graf de reactie descrie [38] izomerizarea intramoleculara a unui cation etil cu doi atomi de carbon ce se pot distinge de exemplu prin marcarea izotopica (Figura 13) si pentasubstituit cu cinci grupe diferite.
Figura 13. Cationul etil pentasubstituit utilizat in primul graf reactie publicat
Acest tip de graf reactie este utilizat pentru descrierea izomerizarile intramoleculare ale complecsilor pentacoordinati cu structura de bipiramida trigonala cum sunt fosforanii [39] sau complecsi organometalici [40].
Izomerizarea intramoleculara a structurilor bipiramida trigonala include mai multe moduri de rearanjare [41] fiecare decurgand prin mecanisme diferite, cele mai plauzibile fiind insa pseudorotatiile Berry [42]. Graful de reactie prezinta o anumita simetrie globala [21] care sugereaza o anumita codificare a celor 20 de varfuri ale grafului prin utilizarea a maxim cinci simboluri care sunt apropiate de notatia propusa de Ugi [43]. Conceptele teoriei grafurilor au fost utilizate in domeniul chimiei organometalice de catre Gielen, Brocas si Willem pentru rationalizarea datelor lor experimentale.[44]
1.4.6. Grafuri Sinton
Notiunea de graf sinton a fost utilizata pentru prima data de catre Hendrickson [45]. Grafurile sinton au varfurile simbolizand sintonurile si muchiile simbolizand setul de legaturi prezente intre sintonuri [21, 22, 46]. Un astfel de exemplu este prezentat in Figura 14 unde scheletul steroidic este format din patru sintonuri . Setul de legaturi este notat prin linii intrerupte iar sintonul prin linii continue.
Figura 14. Scheletul steroidic si grafurile sinton din care e format
Grafurile sinton au fost utilizate intr-o serie de programe sofisticate de calculator [46, 47] dedicate generarii de cai de retrosinteza. Uneori utilizarea acestor programe a permis obtinerea de rezultate exceptionale cum ar fii explicarea modului in care are loc reactia Gattermann-Kock: la compusii aromatici via cation formil in timp ce in seria alchenelor are loc via ion alchilcarbeniu si monoxid de carbon.
1.4.7. Teoria grafurilor in modelarile topologice
Un alt domeniu important de aplicatii ale teoriei grafurilor este acela al obtinerii relatiilor cantitative structura-activitate QSAR (Quantitative Structure – Activity Relationshis) sau structura proprietati QSPR (Quantitative Structure – Property Relationships) prin intermediul indicilor topologici asociati structurilor chimice.
Aceste modele topologice reprezinta tentative de asociere a unor marimi cantitativa structurii moleculare, marimi care sa caracterizeze topologia legaturilor chimice si stereochimia grafurilor moleculare constitutionale sau structurale[5-7, 14, 22, 23]
Conform teoriei grafurilor in molecula organica sunt codate doua nivele globale de informatie structurala :
Structura completa, atat electronica cat si geometrica, obtinuta prin calcule cuanto-mecanice.
Informatia structurala moleculara bazata pe notiunea de legatura chimica, care se refera la conexiunile dintre atomi si modul de ramificare cunoscuta si sub numele de topologie moleculara.
Topologia ca si teoria grafurilor este o ramura a matematicii care implica concepte complexe si care in chimie se ocupa cu studiul unor proprietati metrice ale moleculelor precum lungimile de legatura, unghiurile de valenta, suprafetele si volumele dar si proprietati homeomorfe care sunt independente de marimea si forma spatiala a moleculelor.
Notiunea de ,,topologie moleculara’’ nu este in intregime adecvata deoarece structurile chimice sunt discrete si de aceea e mai indicat ca molecula sa fie considerata in termenii teoriei grafurilor [14].
Kier si Hall au propus termenul de ,, conectivitate moleculara’’[48] pentru a distinge intre diferitele modele cantitative ale topologiei moleculare. Conectivitatea moleculara este necesara pentru o caracterizare numerica formala a informatiei structurale in scopul corelarii structurii chimice cu proprietatile moleculelor (proprietati fizice, activitati biologice, toxicitate ). Scopul final al acestor metode este acela de a furniza o serie de descriptori numerici care sa codifice numeric informatie suficienta referitoare la numarul de atomi si vecinatatile acestora(topologia moleculelor). Acesti descriptori poarta numele de indici topologici [14].
Acestia trebuie sa fie unici pentru o structura data dar metoda prin care sunt fost calculati urmeaza algoritmi variati si uneori complecsi.
Asa cum s-a amintit in subcapitolul 1.4 cele mai importante grafuri utilizate in chimie sunt asa numitele grafuri moleculare sau constitutionale in care formulele de constitutie sunt reprezentate prin puncte (atomi) unite prin linii (legaturi). Se deduce usor ca aceste grafuri chimice sunt de fapt un mijloc de reprezentare a topologiei moleculare. In Figura 15 sunt prezentate cateva exemple de grafuri chimice.
(a)
(b)
(c)
Figura 15. Exemple de grafuri chimice : (a)- n-pentan ; (b)- etena ; (c)- toluen
Dupa cum este bine cunoscut graful chimic asociat unei formule de schelet cu atomii de hidrogen presupusi implicit in conformitate cu valenta atomului de carbon sau a altor heteroatomi, se numeste graf fara hidrogeni.
(a) (b)
(c)
Figura 16. Grafuri chimice pentru molecula 2,4-dimetil-hexan
b-formula structurala cu hidrogeni
c- formula structurala fara hidrogeni
Relatiile topologice fundamentale din teoria grafurilor isi gasesc aplicatii directe in chimia organica.
O teorema fundamentala a teoriei grafurilor este urmatoarea [18] : Daca un graf G contine v varfuri, v1, v2 ,……,vn fiecare avand valenta (gradul) 1, 2,….., n si e muchii e1, e2,…,en atunci intre acestea exista urmatoarea relatie :
Din ec. (2) se observa ca suma valentelor varfurilor este un numar par. Aceasta relatie este foarte cunoscuta in chimia organica pentru a stabili daca un compus exista sau nu in stare fundamentala.
Exemplu : C7H11O2 i=74+111+22=43 (numar impar)- compusul nu exista in stare fundamentala dar poate exista sub forma de radical sau ion.
Pentru grafurile care descriu sisteme spatiale este valabila relatia lui Euler : m=n+c-2
unde : m este numarul de muchii, v reprezinta numarul de varfuri iar c reprezinta numarul de cicluri ale figurii spatiale.
Capitolul 2
Matrici topologice
Dupa cum este bine cunoscut un graf chimic poate fi scris si sub forma unei matrici. Aceste matrici sunt de mai multe tipuri dintre care cele mai importante sunt : matricea de adiacenta, matricea distantelor etc. In cele ce urmeaza se prezinta explicit aceste matrici.
2.1. Matricea de adiacenta
Matricea de adiacenta reprezinta unul din cele mai importante moduri de codare a informatiilor structurale cuprinse intr-o molecula organica.
Elementele unei matrici de adiacenta (A(Gi)), aij, se definesc astfel [14, 49, 50] :
Se observa usor ca matricea de adiacenta este simetrica fata de diagonala principala. Valenta fiecarui varf este suma elementelor liniei sau a coloanei corespunzatoare varfului respectiv asa cum e descrisa in ec.(3) dar nu si in cazul legaturilor multiple.
in care n reprezinta numarul de varfuri si este egal cu ordinul matricii.
O relatie echivalenta cu cea anterioara este :
Matricea de adiacenta (A) contine toate informatiile necesare pentru a reconstrui un graf dar stocarea sa intr-un computer este impracticabila deoarece ocupa un spatiu prea mare [49]. Pentru a se evita utilizarea directa a lui A in literature de specialitate au fost raportate mai multe tipuri de coduri care usureaza stocarea intr-un computer si cu ajutorul carora se poate reconstrui matricea A. Cele mai importante coduri sunt: i)codul DAST [51] si codul de ,,granita’’[52], coduri utilizate pentru codarea structurilor hidrocarburilor aromatice policiclice, ii)codul binar [53].
Pentru o mai usoara intelegere a constructiei matricii de adiacenta in Figura 17 este prezentata formula structurala, graful molecular specific si matricea de adiacenta pentru acidul D-lactic [54].
Figura 17. Formula structurala, graful molecular specific fara hidrogeni si matricea de adiacenta pentru acidul D-lactic
2.1.1. Versiunea compacta a matricei de adiacenta
Matricea de adiacenta este o matrice N×N simetrica care poate fi condensata intr-un numar binar (BIN) de N(N-1)/2 cifre. Numarul binar (BIN) poate fi transformat intr-un numar zecimal. BIN maxim este egal cu 2N(N-1) / 2 – 1 care in sistemul zecimal contine [N(N-1)/2·log2] + 1 ≈ [0.30· N(N-1)/2] + 1 cifre [49]. Pentru a construi versiunea condensata a acesteia se considera in partea superioara dreapta a lui A un triunghi ce contine doar 0 si 1 iar coloanele lui A pot fi exprimate ca un singur numar in sistemul binar. Pentru structura prezentata in Figura 18, numarul de intrari in BIN este N-1 si numerele zecimale corespunzatoare sunt BIN = (0, 1, 2, 0, 29, 6) [49].
Figura 18. Structura utilizata ca exemplu in procesul de codare
Pentru structura prezentata in Figura 18, triunghiul superior al matricii de adiacenta A si codul binar (ultima linie separata ) sunt prezentate in Tabelul 1 [49, 53]. Valorile 0 cu exceptia diagonalei sunt omise pentru o mai buna intelegere a constructiei unei astfel de matrici.
Tabelul 1. Triunghiul superior al matricii de adiacenta A si codul binar (ultima linie separata ) pentru structura prezentata in Figura 18.
Informatiile continute in BIN sunt suficiente pentru a reface matricea A. Fiecare numar zecimal al lui A este transformat in echivalentul sau binar iar intrarile i ale lui BIN devin (i+1) coloane ale lui A. Conceptul de BIN este utilizat atat pentru grafurile aciclice cat si la cele ciclice. Matrice de adiacenta comprimata a fost utilizata cu succes si pentru codarea arborilor fizici [55, 56].
Valoarea minima in BIN este 0 iar valoarea maxima este 2i – 1 (i = 1, …., N-1). Aceste coduri BIN pot fi convertite intr-un singur numar A0. Pentru graful continand 7 varfuri (Figura 18, Tabelul 1) se obtine:
A0 = 64(32|16{8[4BIN(1) + BIN(2)] + BIN(3)} + BIN(4)| + BIN(5)) + BIN(6) (5)
cu valoarea maxima pentru BIN: 26 = 64 si urmatoarele 25 = 32 etc.
A0 = 64×(32×|16×{8×[4×0 + 1] + 2} + 0| + 29) + 6 = 3295427 (6)
Pentru arborii fizici matricile de adiacenta pot fi codate printr-un vector linie numit matrice de adiacenta comprimata (CAM) [49]. CAM(i) este egal cu numarul de linii pentru ,,intrari’’ diferite de 0 in (i+1) coloane ale lui A. Pentru usurinta calculelor a fost introdusa notatia prezentata in ecuatia 7 :
Xi = CAM (i+1) (7)
Pentru a exemplifica modul de codare BIN si CAM in Figura 19 este prezentat graful constitutional pentru 3-metihexan iar in ecuatiile 8 si 9 cele doua tipuri de codare.
Figura 19. Graful constitutional caracteristic 3-metihexanului
BIN: A0 = 16466887 (8)
0A = 6|5{4[3(X1 – 1) +(X2 – 1)] + (X3 – 1)} + (X4 – 1)| + X5 – 1 (9)
Aplicand ecuatia 9 se obtine : 0A = 6|5{4[3(2-1) + (2-1)] + (3-1)} + (1-1)| + 6-1 = 7545. Procedeul de decodare a lui 0A = 7545 este prezentat in cele ce urmeaza:
(a) 545/6 = 90 (5) (b) 5+1 = 6 = X5 (c) 90/5 = 18 (0) (d) 0+1 = 1 = X4 (e) 18/4 = 4 (2)
(f) 2+1= 3 = X3 (g) 4/3 = 1 (1) (h) 1+1 = 2 = X2 (i) ½ = 0 (1) (j) 1+1 = 2 =X1
Dupa cum este bine cunoscut matricea de adiacenta si formele sale (forma compacta) precum si codarile acesteia au fost utilizate in multe studii QSAR /QSPR precum si la calculul de orbitali moleculari de tip Hückel [57].
2.2. Matricea distantelor
Pentru orice tip de graf un invariant important este reprezentat de matricea de distante D. Prin definitie elementele matricei D sunt reprezentate de cele mai mici cai (distantele dij) dintre oricare pereche de varfuri conectate [14, 18, 50, 58-68].
Istoria matricii D este succint prezentata de Mihalic [69] si tot Mihalic observa ca matricea de distante poate fi usor obtinuta din matricea de adiacenta [70], cu relatia :
unde Bi (G) reprezinta matricile care contin cele mai simple drumuri dintre vecinii de ordinul i. Ulterior F. S. Roberts construieste un algoritm similar [71] in timp ce Müller descrie un algoritm mai complex de constructie a matricii D din matricea de adiacenta A [72].
Pentru o mai usoara intelegere a constructiei matricei de distante in Figura 21 se prezinta formula structurala, graful constitutional si matricea de distante geometrice pentru 1-etil-2-metil-ciclopropan [62] respectiv 1-metil-2-propil-ciclobutan [64].
1-etil-2-metil-ciclopropan
1-metil-2-propil-ciclobutan
Figura 21. Formula structurala, graful constitutional si matricea de distante pentru 1-etil-2-metil-ciclopropan respectiv 1-metil-2-propil-ciclobutan
O matricea de distante formala – care permite o descriere a structurii mai apropiata de chimie – se poate construi utilizand valorile propuse de Barysz si colaboratoriii acestuia [73]. In Tabelul 2 sunt prezentate valorile reale pentru cele mai uzuale legaturi intalnite in compusii organici precum si valorile legaturilor pentru izomerii de tip cis si trans (Figura 20) pentru care unghiul α dintre legaturi este de 1200 [65, 73].
Figura 20. Izomeri de tip cis si trans iar unghiul α dintre legaturi este de 1200
Tabelul 2. Valorile celor mai uzuale legaturilor intalnite in compusii organici precum si ale izomerilor de tip cis / trans (Figura 20)
Pentru sisteme chimice mai complicate au fost dezvoltate o serie de programe pentru calculator care sunt capabile sa genereze matricile distantelor reale. Printre acestea doua din cele mai utilizate programe de mecanica cuantica capabile sa genereze o astfel de matrice se numesc MOPAC [74] respectiv WinMopac 7.21 [75].
Pentru a obtine matricea de distante pentru fenoxatina, compus cu actiune antimicrobiala [76] , structura acestui compus este modelata cu ajutorul pachetului de programe Hyperchem [77]. Fisierul obtinut cu extensia .hin este transformat intr-un fisier cu extensia .mpn cu ajutorul programului BabelWin [78]. Pentru ca acest fisier sa poata fi utilizat de WinMopac sau Mopac, in scopul obtinerii matricei de distante se pot utiliza urmatoarele cuvinte cheie : THERMO ROT=1 GEO-OK mmok precise CHARGE=0 GNORM=0.1 BONDS VECTORS DENSITY a caror semnificatie se regaseste in referinta [74]. In Figura 22 sunt prezentate formula moleculara, graful constitutional si matricea de distante pentru fenoxatiina.
Figura 22. Formula moleculara, graful constitutional si matricea distantelor reale pentru
fenoxatiina.
2.2.1. Transformarea matricilor de adiacenta in matrici de distante
Dupa cum s-a aratat in capitolul 2.2 in literature de specialitate exista o serie de lucrari care au ca subiect transformarea matricilor de adiacenta in matrici de distante [60, 70-72]. In esenta metoda de creare a matricilor D din matrici de adiacenta A este de a identifica un precedent adica un varf adiacent al unei muchii numerotate cunoscute si extinderea acestuia prin conexiunea prin intermediul unei alte muchii de varful imediat successor. Un exemplu concludent de constructie a matricei D din matricea A este prezentat in Figura 23 pentru 2-metilbutan si explicat in detaliu in referinta [60].
Figura 23. Graful constitutional pentru 2-metilbutan (23a); matricea de adiacenta A (23b); matricile de distante D incomplete (23c, 23d); matricea de distante D completa (23e); graful 2-metilbutanului construit din matricea de adiacenta A (23f)
Prima valoare necunoscuta din matricea D este a13 de la care se coboara in jos pana la valoarea 0 din diagonala principala. Miscarea orizontala spre stanga pana la valoarea a32 localizeaza varful imediat precedent pentru o muchie numerotata varf adiacent cu varful pentru care valoare necunoscuta este a13. Miscarea pe verticala are loc pana la primul vector orizontal identificat ca elemental a12 a carui valoare este 1. Varful caruia ii e caracteristica distanta a13 este adiacent cu varful caruia ii e caracteristica distanta a12. Suma valorilor a32 si a12 este 2, valoare care e atribuita lui a13. Deoarece matricile A si D sunt simetrice valoarea 2 pentru pozitia a13 este atribuita si lui a31. Valorile pentru a14 si a41 se determina in aceasi mod : i) a14 coboara vertical pana la a44; ii) a44 merge orizontal pana la a43 a varui valoare este 1; iii) a43 urca vertical pana la a13 a carui valoare este 2; iv) suma valorilor a43 si a13 reprezinta valoarea elementelor a14 si a41
(Figura 23, 23d). Valorile pentru a15 si a51 se determina in acealasi mod.
2.3. Matricea de distante reciproce
Pentru un graf molecular a fost definit un nou tip de matrice in care ponderea distantei dintre doi atomi descreste cu cresterea distantei globale [50, 79-81]. Acest nou tip de invariant se numeste matricea de distante reciproce. Pentru un graf G cu N varfuri matricea de distante reciproce RD(G) = RD este o matrice simetrica patrata N×N in care elementele (RD)ij sunt egale cu distanta reciproca intre varfurile i si j pentru elemente care nu se afla pe diagonala si egale cu 0 pentru elementele de pe diagonala.
In Figura 24 este prezentat graful molecular si matricea de distante reciproce in cazul 3-metilhexanului.
Figura 24. Graful molecular si matricea distantelor reciproce pentru 3-metilhexanului
Matricea RD a fost utilizata in constructia unor invarianti locali si indici topologici pentru codarea alcanilor [82, 83].
2.4. Matricea Detour
In anul 1969, F . Harary introduce in literatura matematica matricea Detour si matricea de distante pentru a descrie conectivitatea in grafurile directe [18] urmand ca mai tarziu cele doua matrici sa fie reamintite de catre Buckley si Harary in cartea despre conceptul de distanta in teoria grafurilor [84]. In literature chimica matricea Detour a fost introdusa in anul 1994 de catre Ivanciuc si Balaban [85] si independent in anul 1995 de catre Amic si Trinajstic [86].
In cazul uni graf G conectat (graful pentru care exista un drum intre fiecare pereche de varfuri ale sale), matricea Detour Δ = Δ(G) este o matrice reala simetrica N×N in care valorile (i,j) sunt reprezentate de cea mai lunga cale dintre varfurile i si j [85-89].
Matricea Detour se poate defini utilizand ecuatia 12 :
unde lmax este cea mai lunga cale din graful G iar Bl este matricea auxiliara definita in ecuatia 13:
Pentru un graf complet matricea Detour are o forma foarte simpla in care elementele care nu se afla pe diagonala au valoarea egala cu gradul varfului iar elementele de pe diagonala sunt egale cu 0.
Asa cum s-a aratat in subcapitolul 2.2, distanta cea mai scurta dintre doua varfuri i si j se numeste distanta topologica (D)ij sau geodesica si reprezinta elemental principal pentru matricea de distante D [14, 18, 50, 58-68] iar distanta cea mai lunga dintre doua astfel de varfuri i si j se numeste distanta Detour (Δ)ij sau elongatie reprezinta elemental principal pentru matricea Detour Δ [50, 85-89]. In ecuatiile 14 si 15 sunt definite din punct de vedere mathematic cele doua tipuri de matrici (D si Δ) [88] :
unde Ne, p(i,j) este numarul de muchii pe calea p(i,j) cea mai scurta /lunga.
In Figura 25 sunt prezentate comparative cele doua tipuri de matrici (D si Δ) pentru un graf ciclic [87].
25a 25b 25c
Figura 25. Matricile de distante (D, 25b) si Detour (Δ, 25c) pentru graful biciclic G (25a)
2.4.1. Polinomul si spectrul matricii Detour
Polinomul caracteristic pentru matricea Detour a unui graf G numit si polinom Detour, π(G, x) se poate obtine cu ajutorul ecuatiei 16:
π(G, x) = det |xI – Δ| (16)
unde I este o matrice simetrica N×N.
Coeficientii polinomului Detour se pot calcula cu ajutorul ecuatiei 17:
π(G, x) = xN – c1xN-1 – …- cN-1x – cN = xN – Σn cnxN-n (17)
O cale mult mai usoara pentru calcului polinomului caracteristic este reprezentata de utilizarea metodei Le Verrier-Faddeev-Frame (LVFF) [90] modificata [91].
Pentru calculul coeficientilor cn se utilizeaza ecuatia 18 :
cn = (1 / n)Σi(Δn)ii (18)
in care matricea diagonala (Δn)ii este data de ecuatia 19 :
(Δn)ii = (Δ)ii(Bn-1)ii (19)
Bn este o matrice auxiliara si se poate calcula cu ajutorul ecuatiei 20:
(Bn)ii = (Δn)ii – (cnI)ii (20)
In metoda LVFF pentru care n = N, ecuatia 20 devine:
(BN)ii = (ΔN)ii – (cNI)ii = 0 (21)
Pentru un graf complet cu N varfuri, polinomul Detour poate fi calculate cu ajutorul ecuatiei 22 :
π(KN ,x) = (x + d)N-1(x – d2) (22)
unde d reprezinta gradul unui varf in graful KN.
Mai multe detalii privind metode de calcul ale polinomului Detour se pot gasi in referintele [86, 87].
Spectrul pentru o matrice Detour, numit si spectru Detour contine un element pozitiv si N-1 elemente negative, aceasta distributie datorandu-se polinomului Detour si in principal a primului element din polinomul Detour care are semn negativ. Suma Elementelor din acest tip de spectru are valoarea 0.
Pentru grafurile ciclice prezentate in Figura 26, spectrul Detour este prezentat in Tabelul 3.
26a 26b 26c 26d 26e 26f
26g 26k 26l
26m 26n
Figura 26. Grafuri ciclice pentru calculul spectrului Detour
Tabelul 3. Spectrul Detour pentru grafurile ciclice prezentate in Figura 26
Balaban si Ivanciuc introduc in anul 1994 in literature de specialitate conceptul de matrice Detour / matricea distantelor [85] sau distanta maxima / distanta minima. Daca se combina triunghiul superior din matricea Detour cu cel inferior din matricea de distante se obtine o matrice Detour / Distanta (Δ / D) care este o matrice patrata N×N nesimetrica care poate fi definita astfel :
Pentru graful prezentat in Figura 25 (25a) matricea Detour / Distante [87] este prezentata in Figura 27.
Figura 27. Matricea Detour / Distante pentru graful 25a prezentat in Figura 25
2.5. Matricea muchiilor adiacente
Matricea muchiilor adiacente a fost definita pentru prima data in literatura grafurilor chimice de catre D. H. Rouvray [92] si ulterior de catre N. Trinajstic [93]. E. Estrada descopera ca o serie de invarianti teoretici pentru un graf G, sursa importanta de noi descriptori moleculari, se pot obtine din matricea muchiilor adiacente [94]. Pentru un graf molecular G = (V, E) cu setul de varfuri V = {v1,……., vn} si setul de muchii E = {e1,….,em}, matricea muchiilor adiacente are forma E = [gij]mxm [50, 92-97], in care m reprezinta numarul de muchii din graful G iar elementele gij sunt definite in ecuatia 24:
Cu alte cuvinte matricea muchiilor adiacente (E) este o matrice patratica simetrica in care elementele eij sunt egale cu 1 daca si numai daca muchiile i si j sunt adiacente si 0 in cazuri de neadiacenta [50, 92-97]. Gradul muchiilor δ(ek) se definesti cu ajutorul ecuatiei 25 [94]:
δ(ek) = Σigik = Σjgjk (25)
Daca muchia ek este incidenta cu varfurile vi si vj atunci gradul muchiei ek poate fi exprimat cu ajutorul ecuatiei 26 [94]:
δ(ek) = δ(vi) + δ(vj) – 2 (26)
Momentele spectrale pentru matricea E se pot defini cu ajutorul ecuatiei 27 [96-98]:
μk = μk(G, E) = tr(Ek) (27)
in care μk(G, E) reprezinta momentul spectral k pentru matricea E iar k este un exponent intreg.
2.6. Matricea Laplace
Pentru un graf G simplu matricea Laplace L =L(G) este o matrice reala simetrica si se defineste ca o matrice diferenta [50, 99-105] :
L = V – A (28)
unde A este matricea de adiacenta iar V este matricea de valenta (grad).
Matricea V este o matrice diagonala avant elementele definite cu ajutorul ecuatiei 29:
(V)ii = D(i) (29)
unde D(i) este gradul varfului i din graful G si se calculeaza dupa formula Σj(A)ij.
Matricea Laplace L =L(G) mai este numita intr-o serie de lucrari de specialitate matricea Kirchhoff [99], datorita rolului acestei matrici in Teorema Matricii Arbore (TMA), sau matricea de admitanta [100] denumire care isi are originea in teoria retelelor electrice. Majoritatea autorilor lucrarilor de specialitate au adoptat numele de matricea Laplace (L) deoarece este o matrice a unui operator discret Laplace [101].
Asa cum s-a amintit cea mai importanta utilizare a matricei L este in TMA [101] care este mentionata in cele ce urmeaza:
Teorema (TMA) : Daca i si j sunt doua varfuri ale unui graf G si Lij o submatrice a matricii Laplace obtinuta prin indepartarea liniei i si coloanei j atunci valoarea absoluta pentru determinantul matricei Lij este egal cu numarul de arbori cheie t(G) din graful G:
t(G) = |det(Lij)| (30)
In Figura 28 este prezentat formula si graful molecular pentru 3-etil-2,2,4-trimetilpentan si matricea Lapalce corespunzatoare [104].
28a 28b 28c
Figura 28. Formula moleculara (28a), graful constitutional (28b) si matricea Laplace (28c) pentru 3-etil-2,2,4-trimetilpentan
2.6.1. Spectrul si polinomul matricii Laplace
Pentru un graf G cu N varfuri diagonalizarea matricei Laplace conduce la N valori proprii reale {xi}I = 1,…N. In cazul spectrului matricei L primului termen x1 prin conventie i se atribuie valoarea 0 iar termenii scad in ordinea urmatoare [103]:
0 = x1 ≤ x2 ≤…..≤ xN-1 ≤ xN (31)
In cazul unor grafuri complete KN, spectrul Laplace este prezentat in ecuatia 32 [103] in timp ce pentru un graf regulat spectrul L este prezentat cu ajutorul ecuatiei 33 [103]:
{0, N, N,……….} (32)
xi (L) = D – xi(A) (33)
unde D este gradul varfului din graful regulat.
Mohar arata [105] ca spectrul Laplace are o serie de proprietati interesante. Cu ajutorul acestuia se pot calcula numarul de arbori cheie pe baza teoremei TMA:
In Figura 29 este prezentat spectrul Laplace (29b) pentru un graf complet (graful Kuratowski, 29a) [103] iar in Figura 30 graful (30a) si matricea Laplace (30b) pentru naftalina impreuna cu spectrul Laplace (30c) corespunzator si numarul de arbori cheie (30d) din respectivul graf [103].
{0, 5, 5, 5, 5}
29a 29b
Figura 29. Graful Kuratowski (29a) si spectrul Laplace caracteristic acestuia (29b)
Figura 30. Graful (30a), matricea (30b) si spectrul Laplace (30c) pentru naftalina impreuna cu numarul de arbori cheie (30d) din respectivul graf
O alta proprietate importanta a spectrului Lapalce este aceea ca numarul de arbori cheie care deriva din respectivul spectru, in cazul unor grafuri ciclice, nu depinde de modul de imbinare a inelelor (liniara sau angulara).
In Tabelul 4 este prezentat spectrul Laplace si numarul de arbori cheie calculat cu ajutorul ecutiei 34 pentru cateva grafuri policiclice [103].
Tabelul 4. Spectrul Laplace si numarul de arbori cheie calculat cu ajutorul ecutiei 34 pentru grafuri policiclice [103]
Polinomul Λ(G, x) pentru matricea Laplace pentru un graf G este definit [101] cu ajutorul ecuatiei 35 :
Λ(G, x) = det |xI – L| (35)
Forma coeficientilor polinomului Laplace se poate obtine fie cu ajutorul ecuatiei 36:
Λ(G, x) = xN – c1xN-1 – …- cN-1x – cN = xN – Σn cnxN-n (36)
sau utilizand metoda Le Verrier-Faddeev-Frame (LVFF) [90] modificata [91].
Coeficientul cn din polinomul Laplace se poate calcula prin metoda LVFF cu ajutorul ecuatiei 37 [103]:
cn = (1/n) trLn (37)
unde matricea Ln este data de ecuatia 38:
Ln = LBn-1 (38)
Matricea auxiliara Bn-1 se poate defini cu ajutorul ecuatiei 39:
Bn-1 = Ln-1 – cn-1I (39)
In cazul metodei LVFF fiind o metoda iterativa, n = N-1 si matricii auxiliare prin conventie ii e atribuita valoarea 0.
BN-1 = LN-1 – cN-1I = 0 (40)
2.7. Matricea χ
Matricea χ a fost definita in literatura de specialitate pentru prima data de catre Hall [106]. Ulterior M. Randic redefineste matricea χ [107] in scopul obinerii unor noi invarianti care reprezinta sursa de constructie descriptorilor de conectivitate.
Acest tip de matrice se bazeaza pe matricea de adiacenta dar in locul valorilor 0 si 1 pentru elementele diferite de 0, valorile acestora sunt asimilate cu 1/√(m,n) in care m si n reprezinta valentele varfurilor implicate [50, 107].
Printr-o multiplicare matriciala uzuala se pot obtine puterile superioare ale matricii χ (χm).
In Figura 31 este prezentat graful molecular (31a) si matricea χ (31b) in cazul 2, 2, 3-trimetilbutanului [107].
31a 31b
Figura 31. Graful molecular (31a) si matricea χ (31b) in cazul 2, 2, 3-trimetilbutanului
2.8. Matricea Cluj
Cu rezultatele introduse de indicii Szeged si utilizand o generalizare analoga a numerelor Ni,p ,se poate defini matricea Cluj, CJu [50, 108-111] prin ecuatia 42:
[CJu]ij = Ni,pk(i,j) = max | Vi,pk(i,j)| (42)
in care | Vi,pk(i,j)| este numarul de elemente al setului Vi,pk(i,j), maximum se face pe toate muchiile pk(i,j) iar :
Vi,pk(i,j) = {v/v+V(G); Div<Djv; ph(i,j) pk(i,j) = {i};| pk(i,j)| = min} (43)
k = 1, 2,…..; h = 1, 2,……
Setul Vi,pk(i,j) consta din cele i varfuri in concordanta cu calea pk(i,j) (conditia ph(i,j) pk(i,j) = {i}). Pentru structurile ciclice , prin definitie , elementele (ij) in matricea Cluj reprezinta max | Vi,pk(i,j)| [50, 108-111]. De fapt matricea Cluj, CJu reprezinta patratul unei serii de dimensiuni NN si este in general nesimetrica in raport cu diagonala. Matricile Cluj simetrice CJe si CJp [111] se definesc in aceeasi maniera cu matricile Szeged simetrice, SZe si SZp [50, 108-111] :
[CJe]ij =e[CJu]ij[CJu]ji (44)
[CJp]ij =p[CJu]ij[CJu]ji (45)
Prin analogie se poate deduce ca CJe reprezinta produsul Hadamard CJp si matricea de adiacenta A.
In Figura 32 este prezentat graful molecular (32a) si cele trei tipuri de matrici Cluj (32b, c, d) in cazul 2-metilciclohexanului.
32a 32b 32c
32d
Figura 32. Graful molecular (32a) si cele trei tipuri de matrici Cluj (CJu-32b,CJp-c,CJe
-d) in cazul 2-metilciclohexanului
2.9. Matricea de rezistenta
O noua metrica in cazul grafurilor moleculare numita si distanta de rezistenta a fost definita de Klein si Randic [112]. Definirea are la baza teoria retelelor electrice si se considera ca o legatura simpla dintre doi atomi de carbon corespunde la 1. Distanta dintre o pereche de varfuri vi si vj este definita (ecuatia 46) ca rezistenta electrica dintre varfuri [112-114].
d(w)ij = (46)
In cazul grafurilor aciclice acest tip de distanta este tocmai distanta topologica dar pentru grafurile ciclice distanta de rezistenta este mai mica sau cel mult egala cu distanta topologica asa cum este definita in ecuatia 47:
d(w)ij ≤ (47)
In Figura 33 este prezentata matricea de rezistenta [113] pentru graful molecular 1-etil-2-metilciclobutan.
Figura 33. Matricea de rezistenta pentru graful molecular 1-etil-2-metilciclobutan
2.10. Alte tipuri de matrici
2.10.1. Matricea Szeged
Acest tip de matrice a fost definit pentru prima data in literatura de specialitate de catre Diudea [109,115] prin utilizeaza elementele indicelui Szeged (Sz). Pentru un graf G cu N varfuri matricea Szeged Szp(w) = Szp(w, G) este o matrice patrata N×N si se poate defini cu ajutorul ecuatiei 48:
iar elementele nij se pot defini cu ajutorul ecuatiei 49:
nij = |{vk : vi, vj, vkV(G), d(w)ki<d(w)kj}| (49)
in care w este schema ponderata utilizata la calculul distantelor din graful G.
Elementele matricii Szp sunt numere intregi. Un exemplu de matrice Szp este prezentat in Figura 34 pentru toluen [59]:
34a 34b
Figura 34.Graful molecular in cazul toluenului (34a) si matricea Szeged (34b) corespunzatoare
2.10.2. Matricea Szeged reciproca
Pentru un graf G cu N varfuri, matricea Szeged reciproca RSzp(w) = RSzp(w, G) este o matrice patrata N×N simetrica pentru care elementele sunt numere reale. Acest tip de matrice se poate defini cu ajutorul ecuatiei 50 [59]:
In Figura 35 este prezentata matricea Szeged reciproca in cazul grafului molecular caracteristic toluenului prezentat in Figura 34.
Figura 35. Matricea Szeged reciproca in cazul grafului molecular caracteristic toluenului prezentat in Figura 34
2.10.3. Matricea distantelor complement
Dupa cum este bine cunoscut in cazul unei matrici de distante D, valoarea unui element ij este egala cu suma muchiilor pentru cea mai scurta cale dintre doua varfuri vi si vj ale unui graf G. Avand la baza aceasta definitie Randic defineste [116] pentru prima data matricea distantelor complement DC in cazul alcanilor. Matricea de distante complement DC(w) = DC(w, G) pentru un graf G cu N varfuri este o matrice simetrica patrata N×N care se poate defini [59, 117] cu ajutorul ecuatiei 51:
2.10.4. Matricea distantelor complement reciproca
Pentru un graf G cu N varfuri, matricea distantelor complement reciproca RDC(w) = RDC(w, G) este o matrice simetrica patrata N×N cu elemente reale care se poate defini [59, 117] cu ajutorul ecuatiei 52:
in care [DC(w)]ij reprezinta distanta complement dintre varfurile vi si vj, [DC(w)]ii reprezinta elementele diagonalei matricei iar w reprezinta schema de calcul pentru parametrii Vw caracteristici varfurilor si parametrii Ew caracteristici muchiilor.
In Figura 36 este prezentata matricea distantelor complement (36a) si a distantelor complement reciproca (36b) in cazul toluenului prezentat in Figura 34.
Figura 36. Matricea distantelor complement (36a) si a distantelor complement reciproca (36b) in cazul toluenului prezentat in Figura 34
2.10.5. Matricea distantelor complementare
O alta matrice in care valoarea elementelor corespunzatoare unei perechi de varfuri scade cu cresterea distantei dintre varfuri se numeste matricea distantelor complementare CD [59]. Acest tip de matrice este o matrice simetrica patrata N×N care poate fi definita cu ajutorul ecuatiei 53:
in care [D(w)]ij reprezinta distanta dintre varfurile vi si vj, d(w)max reprezinta distanta maxima dintre doua varfuri distincte din graf (diametrul grafului) iar d(w)min reprezinta distanta minima dintre doua varfuri distincte din graf (egala cu 1 pentru alcani si cicloalcani).
2.10.6. Matricea distantelor complementare reciproca
Matricea distantelor complementare reciproca (RCD(w) = RCD(w, G)) este o matrice simetrica patrata N×N definita [59] prin ecuatia 54:
Pentru graful caracteristic toluenului (Figura 34) in Figura 37 este prezentata matricea distantelor complementare (37a) si matricea distantelor complementare reciproca (37b).
37a 37b
Figura 37. Matricea distantelor complementare (37a) si matricea distantelor complementare reciproca (37b) in cazul toluenului (Figura 34, 34a)
2.10.7. Matricea Wiener inversa
Acest tip de matrice RW(w) = RW(w, G) pentru un graf G cu N varfuri este o matrice simetrica patrata N×N cu elemente reale definita [59] prin ecuatia 55:
unde Vw(w)i este ponderea varfului vi, [D(w)]ij este distanta dintre varfurile vi si vj iar w este schema utilizata pentru calculul Vw si Ew.
2.10.8. Matricea Wiener inversa reciproca
Matricea Wiener inversa reciproca RRW(w) = RRW(w, G) pentru un graf G cu N varfuri este o matrice simetrica patrata N×N cu elemente reale definita [59, 118] cu ajutorul ecuatiei 56:
In Figura 38 este prezentata matricea Wiener inversa (38a) si matricea Wiener inversa reciproca (38b) in cazul grafului caracteristic toluenului (Figura 34, 34a).
38a 38b
Figura 38. Matricea Wiener inversa (38a) si matricea Wiener inversa reciproca (38b) in cazul grafului caracteristic toluenului (Figura 34, 34a)
2.10.9. Matricile combinatoriale
Matricea clasica de distante D reprezinta o sursa importanta de constructie a altor matrici cum ar fi: matricea de distante-delta D si matricea de distante-cai Dp care au fost pentru prima data definite in literature de catre Diudea [119] conform ecuatiilor 57 si 58:
Elementele [D]ij sunt reprezentate de numarul de ,,cai interne’’(mai mari decat unitatea) incluse in cea mai mica distanta dintre varfurile vi si vj [113, 119] iar [Dp]ij reprezinta numarul total de ,,cai interne’’ incluse in cea mai mica distanta dintre varfurile vi si vj [113, 119]. Se observa cu usurinta ca:
D = Dp – D (59)
In Figura 38 sunt prezentate matricile combinatoriale D (38a) si Dp (38b) in cazul grafului molecular caracteristic 1-etil-2-metilciclobutanului.
Figura 38. Matricile combinatoriale D (38a) si Dp (38b) in cazul grafului molecular caracteristic 1-etil-2-metilciclobutanului
Matricea Dp este utilizata pentru calculul indicelui Hiper-Wiener iar matricea D este utilizata la calcularea elementelor ,,non-Wiener’’ in cazul indicelui Hiper-Wiener.
Pentru calculul polinomului caracteristic acestor tipuri de matrici se utilizeaza ecuatia 60:
Del(G, x) = det |xI – D| (60)
Mai multe detalii privind privind polinomul si spectrul caracteristic matricilor combinatoriale sunt prezentate in referinta [120].
2.10.10. Matricea Hosoya
Randic defineste [121] in anul 1994 o noua matrice pentru un graf aciclic indirect conectat (arbore) numita matricea Hosoya Z = Z(T). Pentru un graf cu N varfuri acest tip de matrice este o matrice simetrica patrata N×N ale carei elemente zij se pot defini cu ajutorul ecuatiei 61 [121-123]:
in care : Z(T – pij) este indecele Hosoya pentru subgraful T – pij obtinut din arborele T prin indepartarea tuturor muchiilor de-a lungul caii pij ce conecteaza varfurile vi si vj.
Pentru o mai usoara intelegere a modului de constructie a acestui tip de matrice in Figura 39 este prezentata matricea Hosoya Z in cazul grafului molecular caracteristic 2-metilheptanului.
Figura 39. Matricea Hosoya Z in cazul grafului 2-metilheptanului
Capitolul 3
INDICI TOPOLOGICI SI TOPOGRAFICI
3.1. Generalitati
Matricile prezentate in Capitolul 2 reprezinta invarianti topologici care reprezinta sursa de obtinere a unor numere sau seturi de numere care codeaza informatia structurala ce caracterizeaza un graf chimic.
Aceste numere reprezinta tocmai indicii topologici care exprima numeric informatia topologica continuta in graful molecular sau constitutional. De-a lungul timpului o preocupare majora in literatura de specialitate a fost studierea reducerii grafurilor sau a matricilor prezentate in Capitolul 2 la indici topologici/topografici [14, 23, 48, 124].
O prima metoda consta in estimarea valorilor proprii ale determinantilor asociati matricilor respective, T, conform relatiei de mai jos in care E reprezinta matricea unitate, X este variabila iar n este numarul de varfuri din graful initial.
Ecuatia 62 conduce la polinomul caracteristic P(X) [125]. Cercetarile ulterioare au aratat ca spectrul de valori proprii nu este insa unic si ca fiecare graf arborescent isi are perechea sa izospectrala [126] si din aceasta cauza s-au dezvoltat alte metode care se bazeaza pe descompunerea grafului [127], la indici topologici centrici (Balaban) [128] precum si la aplicarea teoriei informationale pentru caracterizarea cantitativa a structurii.
Indicii topologici (TI) reprezinta asadar o unealta importanta pentru studiile QSAR /QSPR. In functie de dezvoltarea lor istorica acestia pot fi clasificati in trei generatii iar in functie de natura descriptorului local sau global in numere intregi sau reale [129].
3.2. Prima generatie de indici topologici
Acest tip de indici topologici (TI) sunt numere intregi precum si invariantii locali ai varfurilor grafurilor (LOVI) din care se pot construi astfel de indici topologici.
3.2.1. Indicele Wiener
Primul descriptor a fost introdus in topologia moleculara in anul 1947 de catre H. Wiener [130]. Pentru a corela punctele de fierbere sau alte proprietati ale alcanilor cu structura lor Wiener propune urmatoarea ecuatie liniara:
tB = a·w + b·p + c (63)
unde a, b si c sunt constante pentru un set de izomeri iar p si w sunt variabile structurale care vor fi definite in cele ce urmeaza.
p reprezinta polaritatea si este definita ca numarul perechilor atomilor de carbon care sunt separate prin trei legaturi C-C. In Figura 40 sunt prezentate formula moleculara (a) si graful corespunzator (b) pentru 2, 3-dimetil-pentan.
40a 40b
Figura 40. Formula moleculara (40a) si graful corespunzator (40b) pentru 2,3-dimetil-pentan.
Din Figura 1a, 1b se observa 6 perechi de atomi de carbon separate prin trei legaturi C-C : C1C4 ; C1C7 ; C2C5 ; C4C6 ; C5C7 ; C6C7 asadar polaritatea p = 6.
Pentru a defini parametrul w [50, 111, 128-131] care mai tarziu in literature de specialitate va fi numit indicele Wiener se considera un graf G indirect conectat care are varfurile 1, 2,…n. Pentru graful G varfurile i0, i1, ….,ik sunt k+1 varfuri distincte si pentru j = 1, 2, ….,k, ij-1 si ij sunt adiacente. Varfurile i0, i1, ….,ik formeaza o cale in graful G de lungime k. Lungimea celei mai scurte cai dintre varfurile conectate x si y se noteaza Dxy. Distanta este astfel aleasa incat sunt valabile imediat relatiile : Dxy=0 daca si numai daca x=y ; Dxy= Dyx si Dxy+ Dyx Dxz. Suma distantelor dintre toate perechile de varfuri reprezinta indicele Wiener We.
In Figura 41 sunt prezentate formula moleculara (41a) si graful corespunzator (41b) pentru 1, 3-dimetil-ciclooctan.
a b
Figura 41. Formula moleculara (41a) si graful corespunzator (41b) pentru 1, 3-dimetil-ciclooctan.
Pentru graful G10 prezentat in Figura 41 (41b) distantele Dxy sunt :
D12 = 1 D13 = 2 D14 = 3 D15 = 4 D16 = 3 D17 = 2 D18 = 1 D19 = 1 D110 = 4
D23 = 1 D24 = 2 D25 = 3 D26 = 4 D27 = 3 D28 = 2 D29 = 2 D210 = 3
D34 = 1 D35 = 2 D36 = 3 D37 = 4 D38 = 3 D39 = 3 D310 = 1
D45 = 1 D46 = 2 D47 = 3 D48 = 4 D49 = 4 D410 = 2
D56 = 1 D57 = 2 D58 = 3 D59 = 5 D510 = 3
D67 = 1 D68 = 2 D69 = 4 D610 = 4
D78 = 1 D79 = 3 D710 = 5
D89 = 2 D810 = 4
D910 = 4
Numerele Dxy, x=1,2,……,N, y=1,2,……,N definesc patratul unei matrici simetrice de ordinul N uzual notata cu De. Indicele Wiener este egal cu suma distantelor intre toate perechile de varfuri ale grafului respectiv : We=We(G)=x<yDxy.
We(G10) =(1+2+3+4+3+2+1+1+4)+(1+2+3+4+3+2+2+3)+(1+2+3+4+3+3+1)+(1+2+3+4
+4+2)+(1+2+3+5+3)+(1+2+4+4)+(1+3+5)+(2+4)+(4) = 118.
Un numar de indici topologici noi a fost construit ca extensie la indicele Wiener [132-134]. Preocupari majore privind extensii la indicele Wiener apartin lui Gutman [135] sau Klein si Randic care introduc conceptul de distanta-rezistenta [112] concept care a fost detaliat in Subcapitolul 2.9.
3.2.1.1. Indicele Wiener general, model de caracterizare moleculara topologica a hidrocarburilor saturate sau nesaturate
Indicele Wiener general reprezinta o unealta importanta pentru caracterizarea avansata a structurilor compusilor chimici. Pentru definirea sa se considera K(G) subgrafuri apartinand unui graf G ce formeaza serii de clase de ordinul e cu e = 1, 2, ….,E. e reprezinta numarul de muchii pentru orice subgraf din fiecare clasa fiind un numar constant iar E reprezinta numarul de muchii(numar constant) din intregul graf G.
Definitia 1: Numarul Wiener general OW(G) pentru orice graf G este definit [134] ca suma a numerelor Wiener (indicilor) Wi(Gi) pentru toate subgrafurile K ale grafului G.
Definitia 2: Numarul Wiener general de ordinul ,,e’’ eOW(G) pentru orice graf G este definit [134] ca suma a numerelor Wiener Wj( eGj ) pentru toate subgrafurile eK, eG G, care au e muchii:
Definitia 3: Numarul Wiener general de ordinul ,,e’’ eOW(G) poate fi definit [134] ca suma a termenilor eOWk(G) reprezentand suma numerelor Wiener in tipurile de subgrafuri specificate. Distantele in cazul grafurilor aciclice sunt k=p, pentru clustere k=c iar pentru ,,clustere carare’’ k=pc, fiind definite de Kier si Hall [48]:
Definitia 4: Vectorul numar Wiener general OW’(G) pentru orice graf G este reprezentat de secventa tuturor eOW(G) in ordine crescatoare a numarului de muchii e [134]:
OW’(G) = OW { 0OW, 1OW,….., EOW} (68)
iar pentru grafurile aciclice:
OW’(G) = OW { 0OW, 1OW, 2OW, 3OWp,3OWc,.., EOWp, EOWc, EOWpc} (69)
Din Definitia 2 rezulta urmatoarele corolare:
Corolarul 1: Numarul Wiener general de ordinul E (EOW(G)) este chiar indicele Wiener insusi :
EOW(G) = W (70)
Corolarul 2: Numarul Wiener general de ordinul 0 (0OW(G)) este egal cu 0:
0OW(G) = 0 (71)
Corolarul 3: Numarul Wiener general de ordinul 1 (1OW(G)) este egal cu numarul de muchii E din graf:
1OW(G) = E (72)
3.2.1.2. Formulele numarului Wiener general pentru mai multe clase de grafuri
Pentru un graf G se noteaza cu n numarul de varfuri, cu E numarul de muchii iar pentru un subgraf se noteaza cu e numarul de muchii in timp ce numarul de sugrafuri avand e muchii se noteaza cu eK.
Notatiile prezentate mai sus au fost utilizate in urmatoarele formulele de calcul ale numarului Wiener general pentru mai multe clase de grafuri:
Grafuri liniare, Pn:
eOW(Pn) = e(e+1)(e+2)(n-e) / 6
OW = (n+3)(n+2)(n+1)n(n-1) / 120 (73)
Grafuri monociclice, Cn:
eOW(Cn) = e(e+1)(e+2)n / 6 (pentru e = 1,2,…..,n-1)
EOW(Cn) = W(Cn)
OW(Cn) = (n5 + 2n4 + 2n3 – 2n2 –an) / 24 (74)
a = 0 pentru n = par si a = 3 pentru n = impar
Grafurile Star, Sn:
Indicele Wiener general este o masura a doua dintre trasaturile esentiale ale topologiei moleculare: i) ramificarea scheletului molecular; ii) prezenta ciclurilor in aceste schelete moleculare. Valoarea acestui descriptor molecular scade cu cresterea numarului de ramificari, lungimea ramificarii, centralitatea (mai multe pozitii centrale) sau clusterizarea. In cazul grafurilor ciclice, acest descriptor scade cu cresterea numarului de inele din scheletul molecular. Acest tip de indice a fost utilizat in studii QSPR pentru modelarea unor proprietati fizico-chimice ale alcanilor C3-C8 cum ar fi: punctul de fierbere TB [136], temperatura critica TC [136], presiunea critica pc [136], volumul critic Vc [48], volumul molar Vm [48], refractia molara Rm [48], suprafata de tensiune ST [136], caldura de formare in stare gazoasa Hf(g) [137], caldura de vaporizare Hv [137], caldura de atomizare Ha [48].
3.2.1.3. Indicele Wiener general in cazul hidrocarburilor nesaturate
Distanta dintre doua varfuri adiacente in cazul hidrocarburilor nesaturate este diferita de distanta dintre doua varfuri adiacente in cazul hidrocarburilor saturate. In acest caz indicele Wiener general nu mai poate fi aplicat. Pentru ca acest descriptor sa fie aplicat si in cazul hidrocarburilor nesaturate, in anul 2002 Li si Lin definesc un nou concept numit distanta relativa [138] iar noul indice pentru care raman valabile definitiile si corolariile prezentate in Subcapitolul 3.2.1.1. se numeste indicele de valenta Wiener general. Distanta relativa pentru o legatura simpla C-C (de tip sp3-sp3) este egala cu 1 [138] iar pentru alte tipuri de legaturi chimice este definita ca raport al lungimilor legaturilor acestora. Daca lungime legaturii simple C-C(de tip sp3-sp3) este 1.544 atunci distanta relativa pentru o legatura C-C (de tip sp3-sp2) este 1.501/1.544 = 0.972.
In Tabelul 5 sunt prezentate lungimile legaturilor si distantele relative pentru mai multe tipuri de legaturi chimice [138].
Tabelul 5. Lungimile legaturilor si distantele relative pentru mai multe tipuri de legaturi chimice [138]
Noul descriptor molecular a fost utilizat in modelari QSPR ale unor proprietati fizice ca punctul de topire in 0C, volumul molecular Vcal in cm3 / mol, coeficientul de partitie logP, refractia molara MR in cm3 / mol, temperatura critica TC in 0C si presiunea critica in atm in cazul unor alchene [136, 138, 139].
3.2.1.4. Indicele Wiener modificat si aplicatiile sale
Asa cum s-a aratat in Subcapitolul 2.2 elementele unei matrici de distante sunt reprezentate de distantele cele mai scurte dintre un atom si alt atom dintr-un graf molecular. In Figura 42 este prezentata forma generala a unei matrici de distante.
Figura 42. Forma generala a unei matrici de distante
Acest tip de matrice reprezinta sursa de constructie a mai multor descriptori topologici printre care si indicele Wiener. In constructia acestui indice [130] se iau in considerare lungimile muchiilor dintre varfurile unui graf (ecuatia 64) dar nu interactiile si proprietatile acestor varfuri.
Dupa cum este bine cunoscut electronegativitatea reprezinta capacitatea atomilor de a ceda sau accepta electroni sau cu alte cuvinte energia de ionizare sau afinitatea electonica a atomilor. Avand in vedere acest fapt, electronegativitatea si distanta dintre atomi a fost utilizata pentru a defini proprietatile si interactiile varfurilor unui graf molecular [140]. In Figura 43 este prezentata noua matrice de distante.
Figura 43. Noua matrice de distante in care intervine electronegativitatea si distanta dintre atomi
in care Ii si Ij sunt valorile electronegativitatii Pauling, Rij reprezinta distanta legaturii dintre varfurile vi si vj .
Daca varfurile vi si vj sunt adiacente atunci Rij se poate obtine in trei moduri: i) valoarea relativa a lungimii legaturii; ii)valoarea relativa a sumei legaturilor covalente; iii)Rij = ni + nj in care ni si nj reprezinta numerele cuantice principale maxime pentru atomii i si j.
Daca varfurile vi si vj nu sunt adiacente atunci Rij reprezinta suma tuturor lungimilor legaturilor atomilor adiacenti de la varful vi la varful vj. = (Zi / Zj)0.5 unde Zi este numarul atomic pentru atomul pozitiv i iar Zj este numarul atomic pentru atomul negativ j. Pe de alta parte reprezinta media aritmetica a tuturor valorilor pentru toate legaturile de la varful vi la varful vj. Acest parametru masoara diferentele de interactie ale electronilor de la varful vi la varful vj.
In Tabelul 6 sunt prezentati parametrii , Rij si Dij* pentru mai multe tipuri de legaturi chimice [140].
Tabelul 6. Parametrii , Rij si Dij* pentru mai multe tipuri de legaturi chimice [140]
Indicele Wiener modificat a fost utilizat in studii QSPR pentru modelari ale entalpiei de formare fHm(kJmol-1) [141] a metil halogenurilor sau a compusilor anorganici continand metale tranzitionale [140].
3.2.1.5. Alte versiuni ale indicelui Wiener
In decursul ultimilor ani, in literatura de specialitate au fost propusi mai multi invarianti pentru un graf G care reprezinta veriuni ale indicelui Wiener W(G). Un astfel de invariant a fost propus de Lukovits [142] si este prezentat cu ajutorul ecuatiei 76:
in care ij reprezinta calea dintre varfurile i si j iar |ij| reprezinta lungimea acestei cai.
In cazul grafurilor ciclice a fost propusa matricea [142] (diferita de matricea distantelor-rezistente) pentru care elementele ij reprezinta suma lungimilor tuturor cailor dintre varfurile i si j. Luand in considerare elementele acestei matrici, indicele propus de Lukovits se poate prezenta cu ajutorul ecuatiei 77:
In Figura 44 este prezentat graful molecular (44a), triunghiul superior din matricea (44b) si valoarea indicelui propus de Lukovits (44c) in cazul naftalinei.
44a 44b
P(naftalina) = 751
44c
Figura 44. Graful molecular (44a), triunghiul superior din matricea (44b) si valoarea indicelui propus de Lukovits (44c) in cazul naftalinei
Noul indice propus de Lukovits a fost utilizat in studii QSPR pentru modelarea punctelor de fierbere in cazul unor izomeri ciclici si aciclici ai octanului [142].
3.2.1.6. Indicele Wiener in cazul grafurilor benzenoide cata-condensate
Grafurile benzenoide sunt compuse din inele hexagonale. Fiecare din astfel de inele hexagonale sunt adiacente cu alte doua sau trei inele hexagonale cu exceptia inelului hexagonal terminal care este adiacent cu un singur inel hexagonal. Pentru astfel de grafuri a fost propus un indice Wiener mediu [143-145] prezentat in ecuatia 78:
in care h reprezinta catene hexagonale cu h hexagoane iar |h| reprezinta numarul de elemente h. Indicelui Wiener are valoarea maxima pentru poliacena liniara care reprezinta un sistem de inele hexagonale anelate liniar iar valoarea minima pentru helicena – sistem de inele hexagonale anelate angular [143].
Indicele Wiener mediu pentru o catena hexagonala Rh cu h hexagoane construita cu ajutorul algoritmului propus de Gutman et all. (GKQ) [146] depinde numai de probabilitatile p1, p2 (probabilitatea de adaugare pas cu pas a hexagoanelor terminale) si numarul de hexagoane h din catena hexagonala. Pentru catena hexagonala Rh valoarea asteptata pentru indicele Wiener Wh se poate calcula cu ajutorul ecuatiei 79:
Wh = 4h3 + 16h2 + 6h + 1 + 4/3q(h3 – 3h2 + 2h) – 4/3(p1 – p2)2F(h, q) (79)
q = 1 – p1 – p2
iar pentru h 4 :
unde k reprezinta numarul de pasi urmati pentru a descompune un astfel de graf benzenoid in grafuri mai simple [145].
A. A. Dobrynin demonstreaza [144] ca valoarea pentru Wh este diferita de valoarea medie a indicelui Wiener pentru o catena hexagonala cu h hexagoane Wavg (h).
Probabilitatea de asamblare a inelelor hexagonale in catena Rh determina mai multe situatii care vor fi analizate in cele ce urmeaza [144]:
Cazul 1: p1 = 1/3, p2 = 1/3 si q = 1/3
In aceasta situatie valoarea |h| afost calculata de Balaban si Harary [34] cu ajutorul ecuatiei 81:
Cazul 2: Pentru graful prezentat in Figura 45 care nu contine subgrafuri Zk (5≤k≤h) caruia ii sunt caracteristici parametrii: p1 = 1/2, p2 = 0 si q = 1/2, valoarea |h| se poate calcula cu ajutorul ecuatiei 82 [144].
G Subgrafuri Zk interzise
Figura 45. Graful G caruia ii sunt caracteristici parametrii p1 = 1/2, p2 = 0 si q = 1/2 si subgrafurile Zk interzise
Cazul 3 este caracteristic grafului G care nu contine poliacena liniara L3 caruia ii sunt caracteristici parametrii: p1 = 1/2, p2 = 1/2 si q = 0. In Figura 46 este prezentat graful G la care se face referire impreuna cu subgraful L3 interzis (poliacena liniara).
G L3
Figura 46. Graful G caruia ii sunt caracteristici parametrii p1 = 1/2, p2 = 1/2 si q = 0 si subgraful interzis L3
Valoarea |h| se poate calcula cu ajutorul ecuatiei 83 [144]:
Exista grafuri cum ar fi cele prezentate in Figura 47 pentru care valoarea Wh coincide cu valoarea indicelui Wiener W(G) pentru orice valoare impara a lui h mai mica sau egala cu 15 (3≤h≤15).
G1 G2 G3
Figura 47. Tipuri de grafuri pentru care Wh = W(G)
Valoarea indicelui Wiener W(G) in aceasta situatie se poate calcula cu ajutorul ecuatiei 84:
W(G) = 4h3 + 16h2 + 6h + 1 (84)
3.2.1.7. Indicele Hyper-Wiener
Indicele Hyper-Wiener R a fost introdus in literature de specialitate pentru prima data in cazul structurilor aciclice de catre Randic [147]. Pentru un arbore T, indicele R, R =R(T) se poate defini cu ajutorul ecuatiei 85 [147, 148]:
in care prs reprezinta calea ce conecteaza varfurile r si s ale lui T iar rXprs si sXprs reprezinta numarul de varfuri de o parte si de alta a caii prs incluzand varfurile r si s.
In cazul unui graf conectat G cu N varfuri indicele R se poate defini cu ajutorul ecuatiei 86 [133, 148]:
Randic et all. pe de o parte [149] si Lukovits si Linert pe de alta parte [150] extind definitia originala a indicelui R (ecuatia 85) la structurile ciclice. Noua forma a indicelui R este prezentata cu ajutorul ecuatiei 87:
In aceasta ecuatie dij reprezinta distanta dintre varfurile i si j. Al doilea termen din ecuatia 87 reprezinta chiar indicele Wiener W(G) in timp ce primul termen este notat [133] cu D2 astfel incat aceasta ecuatie se poate scrie ca:
R = (D2 + W)/2 (88)
O alta forma a ecuatiei 88 este prezentata de Balaban in referinta [63]:
Dupa cum este cunoscut pentru structurile ciclice :W = N3/8 daca N este par si W = (N3 – N)/8 daca N este impar.
Cu aceste formule si luand in considerare si ecuatiile 87 si 88 se pot defini indicii Wiener in cazul structurilor ciclice cu ajutorul ecuatiilor 90 si 91:
Rciclu = (N4 + 3N3 – N2 – 3N) / 48 pentru N impar (90)
Rciclu = (N4 + 3N3+2N2) / 48 pentru N par (91)
3.2.1.8. Indici Wiener de ordin superior
Indicele Wiener clasic prezinta o degenerare intamplatoare (in cazul alcanilor superiori C7) iar indicii Wiener de ordin superior propusi de Randic [149] nu prezinta o abilitate buna de discriminare in cazul izomerilor. Avand in vedere aceste considerente Diudea et all. propun un nou algoritm de calcul [111, 119] al indicilor Wiener de ordin superior eWM.
eWM = (1/2)Σi eWM,I = (1/2)ΣiΣj[Me]ij (92)
Aceste tipuri de indici conduc la o buna corelare cu cifrele octanice ale mai multor alcani izomeri [119].
3.2.1.9. Aplicatii chimice ale indicelui Wiener clasic
Indicele Wiener clasic W(G) a fost utilizat in studiul coeficientului de partitie n-octanol/apa (indicator al caracteristicilor de transport si interactiune intre receptor si molecula bioactiva) [151]. In acest sens Alina Pyka utilizeaza un set de indici topologici pentru modelarea activitatii biologice si a valorilor RM in cazul unor fenoli [152] si clorofenoli izomeri [153], derivati de acid benzoic [154] sau alcooli [155] obtinand coeficienti de corelare mari atunci cand se utilizeaza indicele Wiener.
Se cunosc studii in care indicele Wiener este utilizat cu succes pentru prezicerea volumelor molare in cazul unor serii omologe de acizi cand se obtin coeficienti de corelare mai mari de 0.980 [156], pentru prezicerea presiunii de vapori in cazul a 476 substante chimice cand se obtin coeficienti de corelare mai mari de 0.900 [157] sau a cifrei octanice conducand la coeficienti de corelare ce variaza intre 0.740-0.998 [158].
Un alt domeniu in care acest indice isi are o larga aplicabilitate este in modelari QSPR ale punctelor de fierbere [159], volumelor molare [156, 159], indicelui de refractie [159], caldurilor de izomerizare si vaporizare pentru diferite clase de compusi [62].
S.Basak si colaboratorii [160] utilizeaza indicele Wiener alaturi de alti indici topologici si geometrici in corelatii cu punctele de fierbere si coeficientul de partitie n-octanol/apa pentru 219 compusi chimici obtinand un coeficient de corelare r = 0.963 pentru modelul QSPR de determinare a punctului de fierbere si r = 0.912 in cazul modelarii coeficientul de partitie n-octanol/apa.
In literatura de specialitate mai recenta W(G) este utilizat la realizarea unui model QSAR eficient pentru prezicerea mutagenicitatii unor amine aromatice si heteroaromatice [161], a activitatii inhibitorii a unor benzamidine [162] sau in modelarea activitatii antituberculoase a unor derivati chinolonici[163].
Un alt domeniu unde W(G) se utilizeaza cu succes este gaz-cromatografia [164]. In acest sens timpii de retentie cromatografici (CRT) pentru monoalchil si O-dialchil benzeni sunt modelati cu W(G) [165] asa cum reiese din ecuatia 93 :
CRT=We+ (93)
unde , , sunt parametri determinati empiric.
Studii similare s-au efectuat pentru cumarine [166].
Un caz special de utilizare a indicelui Wiener clasic este in modelarea QSPR a energiei vibrationale [167].
Aplicabilitatea indicelui Wiener clasic pentru descrierea proprietatilor farmacologice ale compusilor este trecuta in revista in mai multe lucrari din literatura de specialitate (activitate fungicida pentru derivatii acidului salicilhidroxamic [168], activitate antivirala pentru analogi nucleosidici de 5-vinil-pirimidina [169], complecsi ai aminoacizilor cu Cu(II) [171, 172]).
Indici Wiener contrarii
Diametrul d al unui graf este distanta topologica cea mai mare intre doua varfuri, valoarea dij fiind cea mai mare intre toate distantele din matricea topologica. Prin scaderea din d a fiecarei valori dij se obtine o noua matrice simetrica care are valoarea 0 pe diagonala si perechea din afara diagonalei matricei cu valoarea 0 corespunde diametrului din matricea de distante.
unde [D]ij este elementul ij din matricea de distante D care este egal cu distanta din graf intre varfurile vi si vj. Sumele peste toate randurile i, sau coloanele i ale acestei matrici au fost notate cu σi. Insumarea tuturor σi reprezinta chiar indicele Wiener invers Λ [172] care se poate prezenta cu ajutorul ecuatiei 95:
In Figurile 48-53 sunt prezentate matricile Wiener si matricile Wiener inverse iar in Tabelul 7 sunt prezentati indicii Wiener si Wiener inversi pentru : n-pentan (1), 2-metil-butan (2) si 2,2-dimetil-propan (3).
Tabelul 7. Indicii Wiener si Wiener inversi pentru n-pentan (1), 2-metil-butan (2) si 2,2-dimetil-propan (3) [172]
O formula generala care leaga indicele Wiener si Wiener invers este prezentata in ecuatiile 96, 97:
Indicele Wiener invers a fost utilizat cu succes in prezicerea punctului de fierbere, energia Gibbs standard de formare, entalpia de vaporizare, indicele de refractie si densitatea pentru 134 de alcani intre C6 si C10 cand se obtin coeficienti de corelare mai mari de 0.950 [172].
3.2.1.11. Indicii Quasi-Wiener si Kirchhoff
Matricea Laplace (Subcapitolul 2.6) reprezinta metrica de pornire in constructia indicelui Quasi-Wiener care este definit [104, 173] cu ajutorul ecuatiei 98:
unde λi (i = 1, 2, …., N) reprezinta valorile proprii din matricea Laplace. Pentru structurile aciclice W* = W in timp ce pentru grafurile ciclice cele doua valori sunt diferite [111].
Matricea distantelor-rezistenta (Subcapitolul 2.9) definita pentru prima data in literatura de specialitate de catre Klein si Randic [112] este utilizata pentru definirea unui descriptor topologic numit indicele Kirchhoff [174, 175]:
Kf = NTr(L*) (99)
unde Tr(L*) reprezinta inversa Moore-Penrose a matricei Laplace[176].
Cele doua tipuri de indici au fost utilizate cu bune rezultate in corelatii cu punctele de fierbere ale unor alcani [104].
3.2.2. Indicele Hosoya
Pentru un graf G, H. Hosoya propune [177] un alt descriptor molecular numit indicele Z a carui definitie este data prin ecuatia 100:
unde p(G,k) reprezinta numarul de moduri in care k muchii din graf pot sa fie alese astfel incat doua dintre acestea sa nu fie adiacente.
Pentru arbori exista o relatie simpla intre Z si valoarea absoluta a coeficientilor in polinomul caracteristic al grafului obtinut prin introducerea variabilei x pe diagonala principala a matricei de adiacenta A si egalarea determinantului obtinut cu 0. Suma acestor valori absolute ale coeficientilor polinomului caracteristic grafului G reprezinta tocmai valoarea indicelui Z [129, 177].
unde s este cel mai mare numar de muchii neconectate una cu alta iar E reprezinta matricea unitate.
Acest tip de indice a fost utilizat in corelatii cu punctele de topire, entropia sau ordinele de legatura calculate pentru mai multe clase de compusi chimici [177, 178].
3.2.3. Indicii Platt si Gordon-Scantlebury
Simultan cu indicele Wiener in literatura de specialitate apare un descriptor molecular definit de Platt [179] ca indicele F. Acesta reprezinta suma numarului de legaturi adiacente cu fiecare legatura din molecula. In teoria grafurilor aceasta definitie este echivalenta cu suma gradelor tuturor muchiilor [128, 129, 179].
Gordon si Scantlebury propun in anul 1964 un indice N2 [180] care reprezinta numarul de moduri distincte in care un fragment C-C-C se poate suprapune peste un schelet de atomi de carbon (graf fara hidrogen). S-a demonstrat faptul ca F = 2N2 [180] unde F este indicele Platt. In referinta [180] sunt discutate si alte formule caracteristice indicelui N2 care sunt prezentate in ecuatiile 102, 103:
3.2.4. Indicii Zagreb
Indicii Zagreb si variantele acestora au fost introdusi literatura de specialitate pentru studiul complexitatii moleculare [181, 182] si a chiralitatii [183]. Versiunea originala a acestor indici este definita cu ajutorul ecuatiilor 104 si 105 avand ca punct de plecare matricea de adiacenta A(G) [50, 184]:
unde d(i) reprezinta gradul varfului i iar d(i)d(j) este ponderea muchiei i-j.
In Figura 54 este prezentat graful molecular 2-metilbutan (54a), matricea de adiacenta caracteristica (54b) si valorile indicilor Zagreb corespunzatoare (54c) [182].
54a 54b 54c
Figura 54. Graful molecular 2-metilbutan, matricea de adiacenta caracteristica si valorile indicilor Zagreb
3.2.4.1. Alte versiuni ale indicilor Zagreb
In ultimii ani in literatura de specialitate au aparut mai multe lucrari care trateaza alte versiuni ale indicilor Zagreb originali. S. Nikolic et all. utilizeaza in ecuatiile 104 si 105 valorile inverse pentru gradurile varfurilor obtinand o prima versiune a indicilor M1 si M2 numiti indicii Zagreb modificati m M1 respectiv m M2 a caror valoare analitica este prezentata cu ajutorul ecuatiilor 106 respectiv 107 [50, 186] :
mM1 = Σvarfuri1/[d(i)d(i)] = Σvarfuri[d(i)d(i)]-1 (106)
mM2 = Σmuchii1/[d(i)d(j)] = Σmuchii[d(i)d(j)]-1 (107)
In Figura 55 se prezinta contributia ponderilor la valorile indicilor m M1 si m M2 calculati pentru 2,4-dimetilpentan.
55a 55b 55c
Figura 55. Formula structurala (55a) si ponderea varfurilor (55b) respectiv a muchiilor (55c) la calculul valorile indicilor m M1 si m M2 in cazul 2,4-dimetilpentanului
Ecuatiile 104-107 pot fi scrise la modul general cu ajutorul ecuatiilor 108 respectiv 109:
Pentru λ=1, ecuatia 108 se reduce la ecuatia 104 iar ecuatia 109 la ecuatia 105 in timp ce pentru λ= -1 ecuatia 108 se reduce la ecuatia 106 iar ecuatia 109 la ecuatia 107.
Valorile acestor versiuni ale indicilor Zagreb au fost utilizate in corelari cu punctele de fierbere ale alcanilor C3-C8 cand se obtin coeficienti de corelare mai mari ca 0.950 [185, 186].
3.2.4.2. Calculul indicilor Zagreb pentru hidrocarburi benzenoide
Conceptul din chimia hidrocarburilor benzenoide conform caruia atomii de carbon adiacenti cu alti doi atomi de carbon au caracteristici diferite de acei atomi care sunt adiacenti cu alti trei atomi de carbon [187] poate fi explicat cu ajutorul teoriei grafurilor prin utilizarea notiunii de grad al varfului. Se poate scrie asadar pentru un atom de carbon adiacent cu alti doi atomi ecuatia 110:
d = 2 + x (110)
iar pentru un atom de carbon adiacent cu alti trei atomi de carbon, ecuatia 111:
d = 3 + y (111)
Tinand cont de ecuatia 106, 110 si respectiv 111 se poate scrie forma generala pentru indicele Zagreb vM2i in cazul unei hidrocarburi benzenoide i [188]:
vM2i = c1i(2+x)2 + c2i(2+x)(3+y) + c3i(3+y)2 (112)
Indicele Zagreb vM2i a fost utilizat cu succes in corelari cu punctele de fierbere la presiune normala ale hidrocarburilor benzenoide prezentate in Figura 56 [188].
Figura 56. Grafurile moleculare pentru hidrocarburile benzenoide luate in studiu
In Tabelul 8 sunt prezentate punctele de fierbere si parametrii c1i, c2i si c3i utilizati in calculul valorilor indicele Zagreb vM2i pentru hidrocarburile benzenoide prezentate in Figura 56.
Tabelul 8. Punctele de fierbere si parametrii c1i, c2i si c3i utilizati in calculul valorilor indicele Zagreb vM2i pentru hidrocarburile benzenoide prezentate in Figura 56.
I. Gutman si N. Trinajstic descopera [184] o relatie intre primul indice Zagreb M1, indicii Platt si Gordon-Scantlebury, relatie prezentata in formula 113:
F = 2N2=M1-e (113)
Un alt domeniu important in care indicii Zagreb clasici sau versiunile acestora isi gasesc aplicabilitate este acela de modelare QSAR a activitatii anti-inflamatorii pentru 112 acizi N-arilantranilici [189].
3.2.5. Indici centrici
Alte tipuri de indici care nu depinde de invariantii locali ai grafurilor calculati din matricile de adiacenta A sau de distante D dar care exprima modul in care varfurile grafului sunt grupate in jurul centrului grafului sau centroidului grafului au fost propusi de Balaban in anul 1979 [190].
Pentru a gasi centrul sau bicentrul unui arbore, varfurile si muchiile incidente sunt sterse unul cate unul, operatia repetandu-se pana la obtinerea centrului(bicentrului). Operatia se numeste scurtarea grafului [128, 129, 190] iar numarul de puncte sterse in primul, al doilea,…., ultimul stadiu de scurtare se noteaza cu δ1, δ2,….., δr. Numarul r se numeste raza arborelui [191] sau excentricitatea minima.
In Figura 57 este prezentat modul de obtinere a centrului (57a) respectiv a bicentrului (57b) in cazul a doi izomeri ai C7H16 ambii izomeri avand 7 varfuri si r =3 [128, 190]. Cu "o" sau notat varfurile conectate prin muchii (linii punctate) care in pasul urmator vor fi sterse iar cu "●" sa notat centrul respectiv bicentrul celor doi izomeri ai heptanului.
57a 57b
Figura 57. Modul de obtinere a centrului (57a) respectiv a bicentrului (57b) in cazul a doi izomeri ai C7H16 ambii izomeri avand 7 varfuri si r =3.
Secventa numerelor δ1, δ2,….., δr se noteaza cu S si reprezinta punctul de pornire in definirea [128, 190] indicelui centric B :
Pentru graful prezentat in Figura 57a valoarea indicelui B = 21 iar pentru cel prezentat in Figura 57b B = 17.
3.2.5.1. Indicii centrici normalizati si binormalizati (C, C’) si indicii quadratici
(Q, Q’)
S-a demonstrat faptul ca numarul de moduri in care un fragment C-C*-C se poate suprapune peste un arbore ce contine atomi de carbon astfel incat gradul varfului reprezentat de atomul central C* sa coincida cu gradul varfului vi este (vi 2) – lipseste operatorul (exemplu 6 pentru vi = 4 si 3 pentru vi = 3). Avand in vedere aceste considerente primul indice Zagreb M1 si indicele Gordon-Scantlebury N2 se pot defini cu ajutorul ecuatiilor 115 respectiv 116:
M1 = 16V4 + 9V3 + 4V2 + V1 (115)
N2 = 6V4 + 3V3 + V2 (116)
unde Vv reprezinta numarul de varfuri de gradul v.
Cele doua tipuri de indici M1 respectiv N2 apartin aceleasi clase de indici topologici a caror expresie generala este Vv f(v) in care f(v) este polinomul quadaratic in v. Aceasta clasa de indici topologici formeaza clasa indicilor quadratici. Pentru M1, f(v) = v2 iar pentru N2 f(v) = (v2-v)/2.
Pentru a reflecta forma topologica a grafurilor aciclice exprimate ca doua extreme se defineste [190] un indice quadratic normalizat Q cu ajutorul ecuatiei 117:
Q = [Σi(i2-2i)Vi +2] / 2 (117)
unde Vi este numarul de varfuri cu gradul i din graf.
Pentru arbori continand atomi de carbon prin comparatie cu ecuatiile 115 si 116, indicele quadratic normalizat se poate reprezenta cu ajutorul ecuatiei 118:
Q = (8V4 + 3V3 – V1 + 2) / 2 (118)
Pentru un arbore cu n varfuri ce contine atomi de carbon sunt valabile urmatoarele relatii:
V1 = 2 + V3 + 2V4 si V2 = n – 2 – 2V3 – 3V4 (119)
Cu ajutorul ecuatiilor 119, indicele Q se poate defini astfel:
Q = 4V4 + 3/2V3 + 1 – 1/2V1 = 3V4 + V3 (120)
Intre indicii Q, M1 si N2 exista de asemenea relatiile:
Q = N2 – n + 2 = 3 – 2n + M1/2 (121)
M1 = 2(N2 + n – 1) (122)
In aceasi mod ca indicele Q se poate defini si un indice centric normalizat C cu ajutorul ecuatiei 123 [190]:
C = [Σj(j2 – 2j)zj + U] / 2 = (B – 2n + U) / 2 (123)
unde U = [1-(-1)n]/2 iar B este indicele centric definit in ecuatia 114.
Pentru un graf-stea (graf bipartit complet format dintr-un varf central adiacent cu alte n varfuri neadiacente intre ele) se pot defini alte doua grupe de indici: indicele quadratic binormalizat (ecuatia 124) si indicele centric binormalizat (ecuatia 125):
Indicele centric binormalizat C’ este limitat doar la arbori in timp ce indicele quadratic binormalizat poate fi calculat pentru orice graf.
Pentru un graf ciclic(inel cu n varfuri) este valabila relatia :Q’ = 8n/ (n-2)(n-3) in timp ce pentru un graf cubic in care toate varfurile au gradul 3 ( exemplu izomerii de valenta ai anulenelor [192]) Q’ se poate calcula cu relatia : Q’ = 18n/ (n-2)(n-3).
O partitie grafica P a gradelor varfurilor poate fi prezentata sub forma: P = v1, v2,…,vn.
In Tabelul 9 sunt prezentati comparativ indicii B, M1, C si Q pentru grafurile-stea si arborii cel mai putin ramificati (grafuri-lant) cu n varfuri. U se calculeaza cu relatia U = [1-(-1)n]/2.
Tabelul 9. Prezentarea comparativa a indicilor B, M1, C si Q pentru grafurile-stea si arborii cel mai putin ramificati (grafuri-lant) cu n varfuri
Indicii prezentati in Subcapitorul 3.2.5. au fost utilizati in corelatii liniare cu cifrele octanice pentru heptanii izomeri [193].
3.2.6. Indicele Harary
Pentru determinarea indicelui Harary se porneste de la reciproca unei matrici M care se defineste [RM]ij=1/[M]ij daca [M]ij este diferita de zero si [RM]ij=0 daca [M]ij=0. Indicele Harary este definit conform ecuatiei 126 [79, 80, 108,194-198].
HM=(1/2)ij [RM]ij (126)
Indicele Harary original, HDe, se construieste din matricea reciproca de distante, RDe [79, 80]. Pentru indicele Wiener nu se observa nici o degenerare in timp ce pentru indicele Harary degenerarea depinde de gradul de ramificare al moleculei. Acest indice a fost testat [108, 195] in corelatii cu punctele de firbere si razele van der Waals ale octanilor. Prin analogie cu HDe, Diudea [108] propune indicele HWe care deriva din matricea Wiener reciproca. Acest indice se coreleaza cu cifra octanica atat in regresie liniara (r = 0.971) cat si parabolica (r = 0.991).
In Tabelul 10 se prezinta indicele Wiener, We si indicii de tip Harary, HDe, HWe pentru octani.
Tabelul 10. Indicele Wiener, We si indicii de tip Harary, HDe, HWe pentru octani
3.2.7. Indici de tip Schultz
Trinajstic si colaboratorii [199] si de asemenea Gutman [200] descriu indicele MTI’care deriva din matricea D si vectorul valentelor (v) pentru un graf cu N varfuri. Schultz si colaboratorii inlocuiesc MTI’prin S care poate fi definit cu ajutorul ecuatiei 127 [201] :
Geometria perechii de varfuri responsabile pentru izomeria geometrica generata de dubla legatura atat in cazul sistemelor ciclice cat si aciclice poate fi indicata prin factorul geometric GF care este +1 si +1 pentru izomerul Z (cis) respectiv -1 si -1 pentru izomerul E (trans). Toate celelalte varfuri au valoarea 0 pentru GF. Acest factor geometric GF a fost inclus in indicele descris de ec. (127) pentru a cuantifica si izomerii geometrici ai diversilor compusi [50, 129, 201].
In lucrarile ulterioare Schultz propune si alti indici care deriva din cel calculat prin ec. (127) cum ar fi : permanentii si produsul sumelor pe randuri [202] precum si a hafnianului [203]. Din factorul geometric GF se obtine conform strategiei de mai jos factorul de izomerism modificat GM.
Figura 58. Matricile Vv, transpusa (Vv) si graful molecular pentru 1,2-difluoroetan
Suma matricilor D si DT este intotdeauna o matrice simetrica [204].
Figura 59. Matricile diagonale corespunzatoare celor doi stereocentri pentru Z (cis) si E (trans)
Valoarea GM rezultata din sumarea tuturor randurilor matricii de mai sus este pentru (Z)-1,2-difluoroetan este +176 iar pentru (E)-1,2-difluoroetan este -176. Luand in considerare aceste valori pentru GM se obtine pentru indicele S valoarea 1308 in cazul (Z)-1,2-difluoroetanului si 956 in cazul (E)-1,2-difluoroetanului.
Acesti indici au fost utilizati in corelari cu refractia molara RM pentru diastereoizomerii Z si E obtinandu-se rezultate foarte bune.
aRM = refractia molara = (n2-1/n2+2)(M/d) [205]; Calculat din nD20 si d420
Tabelul 11. Descriptorii derivati din matricea de distante pentru izomerii geometrici ai unor alchene
Tehnica generala de obtinere a indicilor topologici pentru izomerii geometrici a fost extinsa si la izomerii optici. Configuratiei R a stereocentrului grafului i s-a atribuit factorul chiral (CF) +1 iar configuratiei S valoarea -1.
3.2.7.1. Teoria grafurilor si indicii topologici moleculari Schultz pentru cicloalcani
Scultz si colaboratorii [206] au extins modelel lor si la cicloalcani. In Tabelul 12 este prezentata influenta valentei, adiacentei si distantei pentru seturi de varfuri in cazul alcanilor si cicloalcanilor aratandu-se diferentele de complexitate pentru toate varfurile secundare in cazul perechilor : propan-ciclopropan, butan-ciclobutan.
Tabelul 12 [206]. Complexitatea varfurilor pentru alcani si cicloalcani C3-C10
Au fost calculati indicii conform teoriei lui Schultz [206] pentru alcani si cicloalcani C3-C10 iar valorile acestora au fost corelate cu punctele de fierbere. In cazul alcanilor se obtin coeficienti de corelare cuprinsi intre 0.956-0.998 iar in cazul cicloalcanilor coeficientii r sunt mai mari de 0.990.
In Tabelul 13 sunt prezentate valorile indicilor calculati pentru cicloalcani C3-C10.
Tabelul 13. Valorile indicilor Schultz pentru cicloalcani C3-C10 [206]
I. Gutman arata in referinta [207] ca indicele Schultz se poate rescrie cu ajutorul ecuatiei 128 :
unde A este matricea de adiacenta iar D este matricea de distante.
Klein et all. obtin pentru grafurile aciclice o relatie remarcabila intre MTI si W(indicele Wiener) [208]:
MTI = 4W + 2P2 – (N-1)(N-2) (129)
unde P2 este numarul de cai de lungime 2:
si deoarece graful aciclic are N varfuri si N-1 muchii prin combinarea ecuatiilor 127, 128 si 129 se obtine [207]:
S = 4W –N(N-1) (131)
3.2.8. Indicele Pogliani
Pornind de la indicele Randic, Pogliani construieste un nou indice geometric [209].
Figura 60. Cei sase comformeri ai hexatrienei
Daca se suprapun izomerii conformationali ai hexatrenei (Figura 60) peste o suprafata de grafit ideala dupa care se scade valenta δ cu o unitate pentru doua puncte cis urmata de conectarea acestor puncte print-o muchie, grafurile chimice 2-6 pot forma inele de patru membrii, un inel cu cinci membrii (grafurile 2 si 3), doua inele cu cinci membrii (grafurile 4 si 5) si trei inele cu cinci membrii (graful 6). Pogliani defineste in acest fel un indice de conectivitate cis (ecuatia 132) :
nXc = (1r2……..nr)-6/n (132)
unde c este abrevierea de la cis iar 6 si n de la exponent reprezinta numarul muchiilor inelelor virtuale formate.
Deoarece indicele prezentat cu ajutorul ecuatiei 132 nu se aplica si structurilor trans a fost definit un indice global de conectivitate moleculara (ecuatia 133):
Xct = 1X- nXc (133)
1X este MCI de ordinul unu iar nXc are valori diferite de 0 doar pentru inele virtuale in conformatie cis.
In cazul structurilor trans nXc = 0 astfel incat indicele global de conectivitate moleculara devine:
Xct = 1X = (ij)-1/2 (134)
unde i si j reprezinta atomii adiacenti iar limitele sumarii sunt toate perechile de atomi adiacenti.
Pogliani propune totodata pentru hidrocarburile nesaturate si un indice care sa tina cont si pozitia dublei legaturi.
Xct(p) = Xct-(1/p)n (135)
Tabelul 14. 1X, Xct si constantele fizice pentru olefine cis/trans [210]
Indicele Pogliani se utilizeaza cu succes in corelari cu punctul de fierbere , bp [209], indicele de refractie, nD20 [209], densitatea, d420 si refractia molara, MRD [209].
3.2.9. Indicele Estrada
In contextul teoriei grafurilor chimice, molecula este considerata un graf simplu
G = {V, E}, unde V ={vi/i = 1,2,….,n}este setul de varfuri reprezentand atomii si E = {ei/i = 1,2,……,n}este setul de muchii reprezentand legaturile moleculei. Avand in vedere aceste considerente, Estrada propune un indice nou pentru corelari cu densitatea electronica de sarcina [211]. Densitatea electronica de sarcina a atomului i (qi) se poate calcula prin metode cuantice utilizand expresia :
qi =Zi -(PS) (136)
in care Zi este sarcina nucleara, P este matricea densitatii, S este matricea de intrepatrundere iar (PS) este populatia Mulliken [212].
Densitatea de sarcina de conectivitate (qi)se poate calcula cu ajutorul formulei de mai jos in care qi se calculeaza utilizand ec. (136).
i(q) = qi – hi (137)
Pe baza ec.(136), (137) Estrada propune indicele [211]:
(q) = k[i(q) j(q)]k-1/2 (138)
Pentru a se tine cont si de densitatea electronica a hidrogenului se poate calcula densitatea electronica corectata a fiecarui atom conform ec. (139) :
C(qi) = qi-j qhj (139)
qhj este densitatea electronica de sarcina a celor hj atomi de hidrogen pentru atomul i.
Calcularea indicilor se face utilizand densitatea electronica de sarcina calculata prin metoda semiempirica AM1 [213].
a)
b) Calculul densitatii de sarcina de conectivitate pentru fiecare atom din propena
1(q) = 4.1699-2 = 2.1699 1C(q) = 4.1699-1.8398 = 2.3301
2(q) = 4.1360-1 = 3.1360 2C(q) = 4.1360-0.9063 = 3.2297
3(q) = 4.0781-3 = 1.0781 3C(q) = 4.0781-2.8697 = 1.2084
c) Calculul indicilor :
(q) = 0.9272
C(q) = 0.8708
Figura 61. Calculul indicilor pentru propena : (a) valoarea densitatii electronice pentru fiecare atom al moleculei (I) si graful molecular pentru propena(II) ; (b) calcularea densitatii de sarcina de conectivitate pentru fiecare atom din molecula de propena ; (c) calculul indicilor .
Indicele molar de conectvitate si descriptorii tridimensionali (q) si C(q) sunt utilizati in QSPR pentru prezicerea punctelor de fierbere a 53 de alchene C4-C8.
Tabelul 15. Valorile punctelor de fierbere experimentale si calculate(in 0C) utilizand indicii topologici (q), C(q) pentru o serie de alchene.
3.2.10. Indicii Alina Pyka
Pentru investigarea indicilor topologici si relatiilor dintre acestia si valoarea RM a izomerilor separati prin TLC (Thyn Layer Chromatography), Alina Pyka propune un indice topologic [66] care s-a utilizat cu bune rezultate in corelarile cu RF si RM.
Figura 62. Formula generala si graful molecular fara hidrogeni pentru mentol
Figura 63. Matricea de distante pentru mentol, neomentol, izomentol si neoizomentol
Daca gruparea hidroxil este in pozitie ecuatoriala atunci valoarea varfului reprezentat de atomul de oxigen este negativa (de exemplu -5) iar daca este in pozitie axiala atunci valoarea varfului reprezentat de atomul de oxigen este pozitiva (de exemplu +5). Daca gruparea metil si gruparea hidroxil au configuratie cis atunci valoarea varfului reprezentat de atomul de carbon este pozitiva (de exemplu +1) iar daca au configuratie trans valoarea este negativa (de exemplu -1).
Din matricea de distante (D) se construiesc vectorii coloana v(vmentol, vneomentol, vizomentol, vneoizomentol).
Figura 64. Vectorii coloana v pentru : (a)-mentol ; (b)-neomentol ; (c)-izomentol;
(d)-neoizomentol
Urmatorul pas in construirea indicelui ISTI este realizarea produsului dintre matricea de distante [D] si vectorul coloana v obtinandu-se vectorul coloana SSTI(i).
[D] vmentol Smentol
Indicele topologic stereoizomeric (ISTI) se calculeaza conform ec.(34)
ISTI = 3×32.25 + 3×24.25 + 46.25 + 30.25 + 2×44.25 + 50.25 = 385.0
In mod analog se calculeaza indicii ISTI si pentru izomentol, neomentol si izoneomentol.
Alina Pyka propune o tehnica analoga si pentru construirea unui indice in cazul izomerilor optici [54].
ISTI a fost aplicat in corelatii cu RM pentru prezicerea activitatii biologice in cazul unor fenoli si clorofenoli izomeri [153] sau in cazul unor alcooli izomeri [214] obtinandu-se coeficienti de corelare buni.
Rezultate bune cu ISTI se obtin si in cazul unor separari cromatografice ale unor izomerilor ai alcooli [155, 214] sau in cazul unor acizi [215].
3.2.11. Indicele Detour
Indicele Detour ω se defineste in aceasi mod ca si indicele Wiener W(G) fiind egal cu semisuma elementelor matricei Detour [87] :
In cazul structurilor aciclice indicele ω (in alte lucrari se utilizeaza notatia w(G)) este echivalent cu indicele Wiener W(G) in timp ce pentru structurile ciclice w(G) este diferit de W(G) [216].
Pentru un graf complet KN cu N varfuri si M muchii este valabila relatia 142 [87] :
ω = M(N-1) = Md (142)
unde d = N-1.
P. E. John arata [217] ca intre indicele Detour si indicele Wiener W(G) exista o relatie de forma :
ω = (N-1)W (143)
In cazul structurilor ciclice, acest tip de indice se poate calcula cu ajutorul ecuatiei 144 :
sau utilizand indicele Wiener ecuatia 144 se poate scrie sub forma [87, 217, 218]:
Studiile privind matricea si indicele Detour au aratat [86, 219] ca exista grafuri care au aceeasi valoare a indicelui Detour dar matrici Detour diferite (Figura 65) dar si grafuri care au aceasi valoare a indicelui Detour deoarece matricile Detour sunt identice (Figura 66).
In Figura 65 sunt prezentate doua exemple de grafuri (65a-1metilciclobutan, 65c-spiropentan) care au aceasi valoare a indicelui Detour dar matricile Detour (65b si 65d) sunt diferite [89].
65a 65b 65c 65d
Figura 65. Grafuri (65a-1-metilciclobutan, 65c-spiropentan) care au aceasi valoare a indicelui Detour dar matricile Detour (65b si 65d) diferite [89]
1-metilciclobutan : ω(G) = 13 + 12 + 3 = 28
spiropentan : ω(G) = 12 + 16 = 28
In Figura 66 sunt prezentate doua exemple de grafuri care au acelasi indice si matrice Detour [89].
Figura 66. Tipuri de grafuri care au acelasi indice si matrice Detour [89]
Lukovits utilizeaza cu succes indicele Detour [219] pentru explicarea variatiei punctelor de fierbere in cazul a 77 de alcani si cicloalcani (r = 0.977). Continuand cercetarile lui Lukovits, Trinajstic si colaboratorii [87] utilizeaza matricea Detour si implicit indicele corespunzator pentru modelarea punctelor de fierbere a 76 de alcani si cicloalcani obtinand un coeficient de corelare superior (r = 0.995). Un coeficient de corelare superior se obtine si atunci cand indicele ω(G) este utilizat in modelarea punctelor de fierbere in cazul a 32 de octani izomeri [88].
3.2.12. Indicii Szeged
Un analog al indicelui Wiener este indicele Szeged, SZ, care a fost propus recent de Gutman si colaboratorii [220, 221]. SZ se defineste prin analogie cu cu ec. (64) dar seturile Ni si Nj sunt definite atat pentru grafuri ciclice cat si aciclice.
We=We(G)=eNi,eNj,e (146)
Ni=|{v|vV(G);[De]iv<[De]jv}| (147)
Nj=|{v|vV(G);[De]jv<[De]iv}| (148)
Ni si Nj reprezinta cardinalii (numarul total de varfuri conectate prin muchii de varfurile i respectiv j) setului de varfuri care se termina in i respectiv j. Varfurile echidistante (la aceeasi distanta) i respectiv j fata de un varf luat drept reper nu sunt calculate. Luandu-se in considerare produsul NiNj se pot defini doua matrici simetrice Szeged SZe si SZp. In SZe intrarile (ij) sunt egale cu NiNj daca i si j sunt adiacente si 0 in celalalte cazuri. In SZp toate elementele matricii sunt egale cu NiNj. Se poate concluziona ca SZe reprezinta produsul dintre SZp si matricea de adiacenta A. In acelasi mod cu matrici simetrice Szeged SZe si SZp se poate defini si o matrice Szeged nesimetrica [115, 223] SZu. In SZu intrarile (ij) sunt egale cu Ni.
In Figura 67 sunt prezentate Matricile De, SZu si indicii corespunzatori pentru 2-metil-ciclohexan.
2-metil-ciclohexan
We = (1/2)ij[De]ij = 42 SZe = e[SZu]ij[SZu]ji = 78
SZp = p[SZu]ij[SZu]ji =182
Figura 67. Matricile De, SZu si indicii corespunzatori pentru 2-metil-ciclohexan
Indicii Szeged au fost testati cu bune rezultate [221], datorita abilitatii lor de discriminare a izomerilor. In acest sens indicii Szeged au fost utilizati impreuna cu alte categorii de indici in modelari ale punctelor de fierbere pentru o serie de cicloalcani [222] cand se obtin coeficienti de corelare mai mari de 0.950. Entalpia de formare a cicloalcanilor nesubstituiti de asemenea a fost descrisa cu ajutorul indicilor Szeged in corelari cu o singura variabila (SZe, r = 0.9813 ; SZp, r = 0.9623) sau cu doua variabile (SZe& We, r = 0.9912 ; SZp& We , r = 0.9910) [221].
3.2.13. Indicii Cluj
Matricile Cluj definite in Subcapitolul 2 [50,108-111] reprezinta sursa principala in calcularea indicilor Cluj CJe si CJp. Intre indicii Cluj, Szeged si indicele Wiener exista urmatoarele relatii: CJe(T) = SZe(T) = We(T) = De(T), CJe(T) = SZe(T) = We(T) ≠ De(T), CJp(T) = Wp(T) = De(T) ≠SZp(T), CJe(T) ≠ SZe(T) ≠ De(T) [109].
Indicii Cluj sunt utilizati cu succes in corelatii cu punctele de fierbere a 45 de cicloalcani(r = 0.920) [109]. Indicele de corelare creste daca pentru acest descriptor topologic se utilizeaza scara logaritmica (r = 0.991).
In Tabelul 16 sunt prezentate comparativ valorile pentru indicii Wiener, We, Szeged, SZe, SZp si Cluj, CJe, CJp pentru cicloalcani simpli.
Tabelul 16. Indicii Wiener, We, Szeged, SZe, SZp si Cluj, CJe, CJp pentru cicloalcani simpli.
Prin analogie cu indicele hiper-Wiener se poate defini un indice hiper-Cluj CJp cu ajutorul ecuatiei 149 [109]:
CJp = CJe + CJΔ (149)
in care CJΔ = Σ(i,j)[CJu]ij[CJu]ji; |(i,j)|>1.
Pentru grafurile ciclice cu N varfuri CJe = SZe si sunt valabile urmatoarele relatii:
CJe = N(N-1)2 / 4 daca N = impar (150)
CJe = N 3 / 4 daca N = par (151)
Daca N = 2k + z si (N-z)/2mod2 = r atunci ecuatia 152 se poate scrie sub forma:
CJΔ = 7/6k4 +(7/3z + 1/2r – 11/4)k3 + (z2 – 2z + 1/4zr -2/3)k2 + (1/2zr – 5/6z + 1/2r – 3/4)k + 1/4zr – 1/2z (153)
In Figura 68 este prezentat graful ciclic (68a) impreuna cu matricea Cluj caracteristica (68b) si valorile indicelui hiper-Cluj (68c) [109].
68a 68b 68c
Figura 68. Graful ciclic (68a) impreuna cu matricea Cluj caracteristica (68b) si valorile indicelui hiper-Cluj (68c) [109]
3.3. A doua generatie de indici topologici
Indicii topologici (TI) din a doua generatie sunt numere reale in timp ce invariantii locali ai varfurilor (LOVI) grafurilor, din care se pot construi astfel de indici topologici, sunt numere intregi.
3.3.1. Indicele topologic de tip Randic
In anul 1975 in literatura topologica, Randic introduce [224] un indice de conectivitate χR, prin similaritate cu M2, pentru a caracteriza gradul de ramificare moleculara
χR = (vivj)-1/2 (154)
iar daca se considera gradul de substitutie al tuturor nodurilor de-a lungul unui drum de lungime h, din graful molecular G si se extinde relatia din ec.(154) peste toate drumurile posibile de lungime h se obtine indicele de conectivitate generalizat [225, 226, 227].
hχR = (vivj……..vh+1)-1/2 (155)
Deoarece indicele Randic in forma sa initiala nu face diferentierea intre atomii de carbon si heteroatomi, pentru a exista aceasta diferentiere dar si pentru includerea legaturilor multiple s-a propus o scara generalizata de indici hχRv in care valentele vi din ec.(155) sunt inlocuite prin conectivitatea atomica iv definita ca diferenta dintre numarul de electroni de valenta Ziv si numarul de atomi de hidrogen Hi legati de atomul i.
hχv = toate muchiile(ΔivΔjv……..Δh+1v)-1/2 (156)
iv = (Ziv-Hi) / (Zi- Ziv-1) (157)
in care Ziv reprezinta numarul electronilor de valenta din atomul i care are numarul atomic Zi iar Hi reprezinta numarul atomilor de hidrogen legati de atomul i.
Modelarile punctelor de fierbere pentru o serie de alcani sau eteri utilizandu-se hχR conduc la coeficienti de corelare ceva mai mari fata de situatia cand heteroatomii sunt asimilati cu atomi de carbon [226]. Pentru diferentierea heteroatomilor si pentru a obtine valori diferite ale indicelui topologic pentru molecule descrise prin acelasi graf G, dar care se deosebesc prin natura chimica a atomilor componenti sau prin multiplicitatea legaturilor, se pot utiliza conectivitati van der Waals VAiw = Aivi (Ai = ri = Si = Vi, unde ri, Si, Vi reprezinta raza van der Waals, suprafata sau volumul vdW al atomului i in cadrul ec. (155).
In Tabelul 17 sunt prezentati comparativ indicele Randic, indicii de conectivitate van der Waals.
Tabelul 17. Indicii de conectivitate van der Waals, comparativ cu indicele Randic
Razele utilizate in aceste calcule au fost determinate de Bondi [228], valoarea pentru carbon fiind 1.7 Å.
Indicii Xrw, Xsw, Xvw au fost utilizati cu rezultate bune pentru corelarea caracteristicilor gaz-cromatografice (timpi de retentie exprimati ca indici Kovats) ale alcanilor, alcoolilor, aldehidelor si esterilor [229, 230].
3.3.1.1. Indicele de conectivitate variabil
Indicele de conectivitate variabil 1χf a fost introdus [231] si utilizat [232-235] ca o alternativa la indicii de conectivitate de valenta introdusi de Kier si Hall [225, 226, 227] pentru caracterizarea heteroatomilor in studii QSPR.
Acest tip de indice se poate construi din matricea de adiacenta modificata [231] iar elementele cu valoarea 0 de pe diagonala se inlocuiesc cu variabilele x, y, z,…. Fiecare dintre aceste variabile caracterizand diferite grupuri de atomi din molecula si modifica contributia legaturilor individuale. Modul de calcul pentru 1χf este asemenator cu cel pentru indicele 1χ [233, 235].
1χf = Σtoate muchiile [(vi + x)(vj + x)]-1/2 (158)
In Tabelul 18 este prezentata matricea de adiacenta, matricea de adiacenta modificata, suma coloanelor, indicele de conectivitate 1χ si indicele de conectivitate variabil 1χf pentru graful molecular caracteristic 3-metil-2-butanolului (Figura 69) [233].
Figura 69. Graful molecular caracteristic 3-metil-2-butanolului
Tabelul 18. Matricea de adiacenta, matricea de adiacenta modificata, suma coloanelor, indicele de conectivitate 1χ si indicele de conectivitate variabil 1χf pentru graful molecular caracteristic 3-metil-2-butanolului (Figura 69) [233]
Kier si colaboratorii, in urma studiilor intreprinse privind indicele de conectivitate [48, 225], arata ca trebuie facuta o diferentiere intre legaturile din structurile aciclice si cele din structurile ciclice. Pentru aceasta se propune o asa numita ,,corectie de inel’’ adica din valoarea calculata a indicelui de conectivitate in cazul moleculelor ciclice se scade valoarea 1/2 pentru fiecare inel prezent in respectiva molecula.
Randic arata [234] ca trebuie facuta o diferentiere si in rolul jucat de atomii de carbon din structurile ce cuprind o parte aciclica si una ciclica. In acest fel se propune [234] un parametru a pentru atomii din partea aciclica si un parametru c pentru atomii din partea ciclica. Se pot scrie astfel trei tipuri de legaturi utilizand cei doi parametrii: Cc-Cc, Cc-Ca si Ca-Ca care corespund urmatoarelor ponderi: [(vi + c)( vj + c)]-1/2, [(vi +c)(vj +a)]-1/2
[(vi + a)( vj + a)]-1/2.
Pentru o mai usoara intelegere a modului de constructie a 1χf in cazul structurilor ce contin atat o parte ciclica cat si una aciclica, in Figura 70 este prezentat modul de constructie al 1χf si matricea de adiacenta modificata in cazul 1-metil-2-propil-ciclopentanului [234].
Figura 70. Modul de constructie al 1χf si matricea de adiacenta modificata in cazul 1-metil-2-propil-ciclopentanului [234]
Valori optime pentru parametrii a si c sunt prezentate succint in referinta [233].
Indicele de conectivitate variabil 1χf a fost utilizat cu succes in modelari QSPR ale toxicitatii unor eteri alifatici [213] cand se obtine un coeficient de corelare r = 0.9548 sau in modelari QSPR ale punctelor de fierbere a 100 de alcooli [233] cand se obtine un coeficient de corelare r = 0.991.
3.3.2. Indicii de forma Kappa
Forma moleculara nu este usor de definit iar in situatia cand molecula este modelata printr-un graf notiunea de forma devine si mai difuza astfel incat era necesara introducerea unor descriptori care sa codifice forma moleculei. Acesti descriptori au fost construiti de catre Kier [236-239] prin examinarea formelor extreme ale grafului in doua situatii: i)graf-lant; ii)graf-stea Acesti indici de forma numiti si indicii kappa (k) reprezinta o masura a pozitiei relative a grafului fata de cele doua forme extreme. Aceste tipuri de indici se pot defini cu ajutorul ecuatiilor 159-161.
1k = 21Pmax1Pmin / (1Pi)2 (159)
2k = 22Pmax2Pmin / (2Pi)2 (160)
3k = 43Pmax3Pmin / (3Pi)2 (161)
unde 1Pi, 2Pi, 3P3 reprezinta numarul de legaturi simple, duble respectiv triple; 1Pmin si 1Pmax reprezinta numarul de legaturi simple dintr-un graf liniar si complet; 2Pmin si 2Pmax reprezinta numarul de legaturi duble dintr-un graf liniar si graf stea; 3Pmin si 3Pmax reprezinta numarul de legaturi triple dintr-un graf liniar si graf stea-pereche.
Acesti descriptori de forma au fost testati in corelatii cu factorul acentric Pitzer cand se obtine un coeficient de corelare r = 0.995. Acest factor acentric definit [240] in termenii presiunii de vapori reduse masoara deviatia moleculei de la o forma sferica ideala.
Deoarece indicii kappa nu prezinta un grad de degenerare ridicat ulteriror au fost construiti noi tipuri de descriptori moleculari ai formei care prezinta astfel de degenerare [241].
3.3.3. Indicele Balaban J
In lucrarile sale [5, 23, 63, 242, 243] Balaban aplica formula de tip Randic (ec.154) sumelor de distante in locul valentelor varfurilor propunand noul indice topologic J denumit indicele de conectivitate al sumei distantelor medii:
J = (q/+1)(sisj)-1/2 (162)
In ec.(162) = q–N+1 reprezinta numarul ciclomatic al grafului cu q muchii si N noduri. Capacitatea de discriminarea acestui indice este mai mare ca a altor indici topologici [244]. Pentru alcanii cu catena foarte lunga valoarea indicelui J tinde catre π = 3.14159 [245].
Sumarea din ecuatia 162 se face pe toate muchiile i-j intr-un graf fara hidrogen. In cazul legaturilor duble si triple sumarea se face luand in considerare ordinele de lagatura sau considerand legatura dubla ca doua legaturi simple iar legatura tripla ca trei legaturi simple.
Prezenta in molecula a heteroatomilor determina utilizarea unor parametrii speciali. In cazul matricea de distante D elementele diagonalei de definesc cu ajutorul ecuatiei 163 propuse de Trinajstic si colaboratorii [73]:
dii = 1 -6 / Zi (163)
unde Zi este numarul tuturor electronilor din atomul i. In Tabelul 19 sunt prezentate valorile dii pentru cele mai uzuale elemente.
Tabelul 19. Valorile dii pentru cele mai uzuale elemente
In cazul elementelor nediagonale se utilizeaza ecuatia 164 :
dij = Σqkq = Σq36 / bqZiZj (164)
in care sumarea se face peste toate varfurile adiacente.
Ordinul de legatura definit initial de Balaban [63, 243] este 1 pentru legaturile simple, 2 pentru cele duble si 3 pentru cele triple.
In Tabelul 20 sunt prezentate valorile parametrului kq pentru cele mai uzuale legaturi intalnite in compusii chimici.
Tabelul 20. Valorile parametrului kq pentru cele mai uzuale legaturi intalnite in compusii chimici
O a doua metoda este propusa de Basak si colaboratorii [246] care utilizeaza teoria informationala si gruparea varfurilor in clase in functie de natura lor chimica dar fara sa se ia in considerare periodicitatea chimica.
Avand in vedere considerentele prezentate precum si valorile unei electronegativitati relative Xj, Balaban defineste [247] un nou indice topologic J pentru heteroatomi (JhetX) prin multiplicarea sumei distantei dj cu Xj si aplicarea formulei 162 pentru J.
Cum heteroatomii de diferentiaza si prin razele covalente se defineste si un al doilea indice topologic J pentru heteroatomi (JhetY) in aceeasi maniera ca JhetX utilizandu-se valorile razelor covalente relative [247].
Balaban arata [247] ca JhetY depinde de interactiile sterice astfel incat in cazul unor amine are valoarea cea mai scazuta in cazul aminelor primare, valoare medie in cazul celor secundare si valoare maxima in cazul aminelor tertiare deoarece atomul de N are raza covalenta mai mica ca cea a atomului de C. In cazul JhetX situatia este inversa adica valoarea cea mai mica este in cazul aminelor tertioare si cea mai mare in cazul aminelor primare. Pe de alta parte valorile JhetX si JhetY cresc cu cresterea ramificarii moleculelor.
Pentru calculul lui Jhet a fost scris un program software care tine cont de toti parametrii structurali ai molecului [248].
Domeniile de utilizare ale indicelui J sunt dintre cele mai variate. In studii recente indicele Balaban a fost utilizat cu succes in studii QSAR privind benzensulfonamidele ca inhibitori ai anhidrazei carbonice [249], sau pentru prezicerea cifrei octanice pentru o serie de alcani [158].
Pentru prezicere punctelor de fierbere si a coeficientului de partitie octanol-apa a fost realizat un model QSPR in care indicele J aduce o contributie sporita pentru marirea coeficientului de corelare r [160]. Indicele Balaban face parte din setul de descriptori utilizati pentru dezvoltarea unor relatii cantitative structura-activitate (QSAR) pentru prezicerea activitatii anticonvulsive in cazul unor analogi ai hidantoinei [250] sau in modelarea actiunii anticancer a unor derivati retinoidici [251].
El a fost aplicat cu bune rezultate in QSAR [252], pentru modelarea cantitativa a efectelor sterice in studiul potentialului carcinogenic al unor hidrocarburi aromatice polinucleare sau a mutagenicitatii pentru o serie de amine aromatice si heteroaromatice [161]. In studii de biodegradabilitate sau de toxicitate indicele J este utiliat cu succes pentru prezicerea toxicitatii policlorodibenzofurani [253]. In studii foarte recente indicele J isi gaseste aplicabilitatea si in prezicerea capacitatii de legare de diferiti receptori a unor policlorobifenili, policlorodibenzo-p-dioxine si policlorodibenzofurani utilizand date de 13C RMN [254].
Indicele J este utilizat mai recent si in modele QSAR pentru prezicerea activitatii biologice a diversilor compusi biologic activi sau potentialului de inhibare a unor compusi chimici precum ar fi modelul propus de S. C. Basak si colaboratorii [162] pentru prezicerea potentialului de inhibare a 107 benzamidine.
Indicele Balaban a fost utilizat si in studii QSPR pentru prezicerea unor proprietati ale compusilor chimici cum ar fi : presiunea de vapori [157] , punctele de fierbere in cazul eterilor aciclici, peroxizilor, acetalilor si analogi cu sulf [255], sau a unui set de 139 de hidrocarburi format din 73 de alcani C3-C9, 29 de alchilbenzeni si 37 de hidrocarburi aromatice policiclice [256] precum si entalpia de formare din elemente a unui set de 60 de hidrocarburi aromatice si nearomatice [62].
3.4. A treia generatie de indici topologici
Cea mai recenta generatie de indici topologici (a treia generatie) sunt numere reale si se bazeaza pe invarianti locali ai varfurilor care de asemenea sunt numere reale. Cele mai importante categori de astfel de indici sunt prezentate in cele ce urmeaza.
3.4.1. Indici teoretici informationali
Teoria informationala reprezinta un mod eficient de caracterizare a diferitelor structuri [257, 258]. Pentru un sistem I avand N elemente, continutul informational poate fi redat cu ajutorul ecuatiei 165 :
unde n este numarul de seturi diferite de elemente, Ni este numarul de elemente din setul i iar sumarea se face pe toate seturile de elemente.
O alta teorie utilizeaza continutul informational mediu pentru un element al unui sistem, Ī, care poate fi definit ca medie a continutului informational total sau cu ajutorul formulei Shannon:
in care pi = Ni /N.
Teoria informatiei a fost aplicata la grafuri pentru prima data in 1955 de catre Rashevsky [259] pentru definirea continutului informational topologic. Aceasta definitie se refera de fapt la impartirea varfurilor unui graf dat in clase de varfuri echivalente avand aceasi valenta.
Continutului informational topologic nu poate explica faptul ca ramificarea in cazul grafurilor lant creste in acelasi mod ca in cazul grafurilor stea sau arbore.
Pentru a inlatura aceste inconveniente Bonchev si Trinajstic aplica formula Shannon (ec. 166) pentru definirea [58] unor noi indici informationali derivati din matricea de distante D care sa cuprinda si cea ce nu poate explica teoria Rashevsky:
In care N(N-1) / 2 reprezinta numarul de elemente nediagonale din partea superioara a matricei de distante iar ki reprezinta numarul de elemente avand aceeasi valoare i.
Aplicand ecuatia 166 se poate defini [58] si un indice informational mediu:
In referinta [58] sunt prezentate expresiile analitice ale indicilor informationali pentru toate categoriile de grafuri.
Acesti indici informationali reprezinta asadar o modalitate eficienta de a exprima ramificarea structurilor chimice (grafurilor moleculare caracteristice).
3.4.2. Indicii informationali dezvoltati de Basak si colaboratorii
Deoarece atomii de hidrogen dintr-o molecula isi au rolul lor, Basak si colaboratorii definesc [260-262] continutul informational al moleculei cu ajutorul unui indice IC :
Indicele de ordin 0 se refera la atomi izolati grupati in clase echivalente iar cel de ordin 1 se refera la perechi de atomi legati covalent grupati in seturi cu aceeasi echivalenta. Setul de n varfuri este partitionat pana la vecini de ordinul k.
A doua categorie de indici informationali se numesc indici informationali structurali si se pot defini [260-262] cu ajutorul ecuatiei 170:
SICk = ICk / log2n (170)
A treia categorie de indici informationali definiti de Basak si colaboratorii [260-262] poarta numele de indici informationali complementari si se pot prezenta cu ajutorul ecuatiei 171:
CICk = log2n – ICk (171)
3.4.3. Indicele informational orbital
In baza teoriei informationale si utilizand un invariant m(oricare ar fi acesta) al grafului, Bertz defineste [263] un indice C(m) utilizand formula Shannon modificata de Rashevsky si Mowshowitz. Acest indice este aplicat si la grafuri ce contin heteroatomi si legaturi multiple:
C(m) = 2mlog2m – Σimilog2mi (172)
3.4.4. Indici topologici bazati pe informatia data de distante
In cazul alcanilor, odata cu cresterea numarului atomilor de carbon creste si numarul izomerilor iar o metoda bruta de insumare a distantelor din graful respectiv conduce la pierderea informatiei continuta in secventa de distante de la un varf dat la altul din graful dat.
Pentru a inlatura aceste inconveniente, Balaban utilizand formula Shannon propune [264] noi invarianti ai varfurilor care se bazeaza pe secventa de distante topologice. Aceasta secventa de numere (distante topologice) a fost utilizata de Bonchev si Trinajstic pentru constructia altor indici topologici [265, 266].
Balaban aplica formula Shannon la continutul informational in vectori distante, pentru fiecare varf i obtinand informatia locala medie exprimata ca lungimea distantelor, ui:
ui = -Σi(jgj) / (si)log2j/si (173)
unde :
si = Σjdij = Σjjgj (174)
iar j reprezinta toate distantele avand exponentul gj.
De asemenea se poate obtine si informatia locala exprimata ca lungimea distantelor, vi:
vi = silog2si – ui (175)
Pentru a se obtine o secventa de numere mai convenabila au fost de asemenea propusi alti invarianti locali ai varfurilor care prin analogie cu cei definiti in ecuatiile 173 si 175 au fost denumiti ca informatie locala extinsa exprimata ca lungimea distantelor, xi, respectiv informatia locala extinsa medie exprimata ca lungimea distantelor, yi:
xi = silog2si – yi (176)
yi = Σjgjjlog2j (177)
Cu ajutorul invariantilor locali ai varfurilor definiti cu ajutorul ecuatiilor 173, 175, 176 si respectiv 177 se pot defini [264] indicii topologici corespunzatori:
U = (q / μ + 1) Σ(uiuj)-1/2 (178)
V = (q / μ + 1) Σ(vivj)-1/2 (179)
X = (q / μ + 1) Σ(xixj)-1/2 (180)
Y = (q / μ + 1) Σ(yiyj)-1/2 (181)
Sumarea se face peste toate muchiile ij, q respectiv μ reprezentand numarul de muchii respectiv cicluri din graf. μ se mai numeste si numar ciclomatic : μ = q + 1 – n.
Aceste tipuri de indici au fost propuse pentru a se reduce degenerarea indicilor topologici la nivel global si foarte putin la nivel local. Degenerarea acestor indici e mult mai mica ca a indicelui J fiind utilizati pentru caracterizarea familiilor de izomeri ai alcanilor.
3.4.5. Indicii TRIPLET
Indicii triplet convertesc o matrice intr-un sistem de ecuatii liniare a caror solutii sunt invariantii locali ai varfurilor prin includerea unui vector coloana pe diagonala principala si a altui vector coloana ca termen liber.
Acest vector coloana poate exprima informatia chimica (de exemplu numarul atomic Z al unui atom simbolizat prin varful corespunzator), informatia teoretica codata de un graf (de exemplu gradul unui varf V sau suma distantei S pentru un varf corespunzator) sau simple constante numerice (de exemplu numarul 1, numarul de varfuri N sau N2) [ 129, 262].
Invariantii locali ai varfurilor xi sunt convertiti in descriptori moleculari prin unul din urmatorii cinci operatori:
Insumarea: ∑i xi
Insumarea patratelor : ∑i xi2
Insumarea radacinilor patrate: ∑i xi–½
Insumarea radacinilor patrate: ∑ij (xixj)–½
Produsul mediu: N(Πi xi)1/N
Cu ajutorul operatiilor 1-5 se pot obtine indicii topologici triplet [267].
Capitolul 4
ALTE CATEGORII DE INDICI TOPOLOGICI
4.1. Indicele Electropic
Yee si colaboratorii [268] introduc in literatura de specialitate un nou indice informational numit electropie. Acest indice se poate defini cu ajutorul ecuatiei 182:
unde N este numarul total de atomi din molecula iar Ni reprezinta numarul mediu de atomi dintr-o categorie de atomi.
4.2. Indicii electrotopologici de stare E
Kier si Hall definesc [269, 270] o noua categorie de indici topologici numiti indici electrotopologici de stare (stare-E) bazati pe invariantii grafurilor pentru fiecare atom din molecula.
Variabila de stare-E codifica starea electronica intrinseca a unui atom care este influentata de mediul electroni al tuturor atomilor.
Si = Ii + ΣjΔIij (183)
in care Ii reprezinta intrinseca de stare pentru atomul i iar Δij reprezinta perturbarea lui Ij la Ii si se calculeaza cu relatia : Δij = (Ii – Ij) / Dij2.
Acesti indici electrotopologici de stare au fost utilizati in modelari ale punctelor de fierbere si temperaturii critice pentru mai multe categorii de compusi [270, 271].
4.3. Indicele de flexibilitate a legaturii
Kier dezvolta [236] un indice de flexibilitate general Φ pentru cuantificarea flexibilitatii moleculei. Acesta se bazeaza pe marimea moleculei, ramificare sau continutul in heteroatomi. Acest indice este stocat ca proprietate moleculara globala in registrul de substante CAS (Chemical Abstracts Service) si poate fi utilizat in cautarea diferitilor compusi in respectivul registru [272].
Indicele Φ se calculeaza cu ajutorul indicilor de forma moleculara 1k si 2k [236-239] :
Φ = 1k2k / NA (184)
1k =(NA + a – 1)( NA + a – 2)2 / (p1 + a)2 (185)
2k =(NA + a – 1)( NA + a – 2)2 / (p2 + a)2 (186)
a = Σj[(rj / r(sp3)) – 1] (187)
unde NA reprezinta numarul de atomi (fara H), rj este raza covalenta a atomului j, r(sp3) este raza covalenta a unui atom de C(sp3), p1 este numarul de cai de lungime 1 din graful fara hidrogen, p2 este numarul de legaturi duble.
Indicele 1k codifica numarul de atomi din molecula si ciclicitatea relativa iar indicele 2k descrie ramificarea si densitatea spatiala a moleculei.
Pentru a se usura cautarea in registrul de substante CAS (Chemical Abstracts Service) a unor molecule cu proprietati dorite au fost definit si doi indici de flexibilitate locala [273].
Indicele de flexibilitate simpla locala (LS) se poate defini cu ajutorul ecuatiei 188:
LSij = SPN – (NRB + 0.75BX + 0.50BY) / 2 (188)
in care SPN este numarul de centri in cea mai scurta cale dintre atomii i si j, NRB este numarul de legaturi nonrotabile, BX este numarul de atomi ramificati de care sunt legati alti patru atomi diferiti de H iar BY este numarul de atomi ramificati de care sunt legati alti trei atomi.
Indicele de flexibilitate globala locala (LS) se poate defini cu ajutorul ecuatiei 189:
Avand la baza indicele de flexibilitate Φ definit de Kier, Lieth defineste [274] un alt indice de rigiditate a legaturii cu ajutorul relatiei 190:
ρKB = Σ Φi – Φ + 1 (190)
in care ρKB reprezinta rigiditatea Kier a legaturii, Φi reprezinta parametrul de flexibilitate Kier pentru un fragment molecular i iar Φ este flexibilitatea Kier.
Acest indice a fost utilizat cu succes in caracterizarea flexibilitatii respectiv rigiditatii diferitelor tipuri de legaturi din compusii organici.
4.4. Indicele de chiralitate F
Chiralitatea 3-D se refera de fapt la chiralitatea obiectelor tridimensionale in spetiul tridimensional si se refera la asimetria moleculara care este reflectata in diferentele dintre un obiect si imaginea sa in oglinda(enantiomer).
Situatia este mult mai putin complicata in cazul spatiului bidimensional.
Pentru a cuantifica contributia asimetriei atomice asupra chiralitatii bidimensionale, M. Randic propune [275] un invariant teoretic al grafului numit indicele de chiralitate F care se poate calcula cu ajutorul ecuatiei 191:
F = Σai3 / n3 (191)
in care n este numarul de atomi din molecula (cu exceptia H) iar ai reprezinta asimetria atomului i.
In Figura 71 este prezentata diagrama moleculara pentru benzantracen (71a), imaginea sa in oglinda (71b) si sumele atomice obtinute din sumele partiale bazate pe codurile binare (71c).
71a 71b
71c 71d
Figura 71. Diagrama moleculara pentru benzantracen (71a), imaginea sa in oglinda (71b) si sumele atomice obtinute din sumele partiale bazate pe codurile binare (71c).
Contributiile asimetriei atomice pentru benzantracenul prezentat in Figura 71 sunt: 143 + 23 + 23 + 23 + 83 + 143 + 23 + 203 + 263 – 103 – 43 – 43 – 103 – 223 – 163 – 103 – 43 = 12672. Prin normalizarea sumei se obtine F = 12672 / 183 = 2.17284. Valoarea -2.17284 corespunde imaginii in oglinda a benzantracenului.
M. Randic propune [276] si o generalizare a indicelui de chiralitate F considerandu-se puterile superioare ale asimetriei atomice.
4.5. Indicele excentric de conectivitate
Excentricitatea E(i) unui varf i dintr-un graf G reprezinta distanta de la varful i la cel mai indepartat varf din respectivul graf G.
E(i) = max d(i,j), jєG (192)
O definitie mai generalizata a excentricitatii a fost data de Petitjean [277].
Pe baza definitiei excentricitatii, Madan si colaboratorii definesc [278] un nou indice numit indicele excentric de conectivitate ξc care reprezinta suma produsului dintre excentricitatea E(i) si gradul fiecarui varf dintr-un graf molecular fara hidrogen avand N varfuri:
unde E(i) reprezinta excentricitatea iar V(i) reprezinta gradul varfului i.
Indicele ξc prezinta o putere de discriminare inalta si a fost utilizat in modelarea activitatii analgezice a unor piperidinil metil esteri si metilen metil esteri [279], a refractiei molare pentru un set de 48 de compusi chimici heterogeni continand eteri, amine si alcooli [280] sau a punctelor de fierbere in cazul unor amine primare si secundare cand se obtin coeficienti de corelare mai mari de 0.900 [278, 280].
4.6. Indicele superpendentic
Recent in literatura de specialitate a fost definit de catre Gupta si colaboratorii [281] un nou indice numit indicele superpendentic ∫p. Acest indice este calculat din matricea pendentica Dp care reprezinta o submatrice a matricei de distante obtinuta prin retinerea coloanelor corespunzatoare varfurilor pendentice (varfuri conectate prin cel mai mic numar de muchii). Pentru un graf cu N varfuri, indicele ∫pse poate defini cu ajutorul ecuatiei 194:
unde P(i,j) reprezinta lungimea drumului ce contine cel mai mic numar de muchii dintre varfurile i si j din graful G.
Utilitatea acestui indice a fost investigata in corelari cu activitatea antiulcer a unor derivati de 2-guanidino-tiazoli-4-substituiti [281] cand se obtin rezultate bune.
4.7. Indicele PI
Pentru a imbunatati coeficientii de corelare in care au fost implicati indicii Wiener W(G) si Szeged Sz(G), Khadikar si colaboratorii definesc [282] un nou indice topologic numit indicele Padmakar-Ivan (PI). Fata de indicele Sz(G), indicele PI are avantajul ca nu coincide cu indicele Wiener W(G) pentru moleculele aciclice. Puterea de discriminare a acestui indice este similara cu a indicilor W(G) si Sz(G).
Pentru un graf G, daca o muchie ,,e’’ leaga varfurile u si v se poate scrie: e = uv. Se pot defini asadar doua cantitati: neu(e|G) respectiv nev(e|G). neu(e|G) reprezinta numarul de muchii ce se leaga pe drum inchis de varful u iar nev(e|G) reprezinta numarul de muchii ce se leaga pe drum inchis de varful v.
PI = PI(G) = Σ[neu(e|G) + nev(e|G)], eєE(G) (195)
Un domeniu in care indicele PI este utilizat cu succes este cel al sistemelor benzenoide. Dintre aceste sisteme benzenoide cele mai investigate sunt poliacenele liniare, motiv pentru care Khadikar si colaboratorii definesc [283] o noua forma a indicelui PI pentru aceste sisteme. Pentru definirea indicelui PI se considera Figura 72:
Figura 72. Sistem poliacenic utilizat in definirea indicelui PI
Asa cum se observa din Figura 72, muchiile e0, e1,…..,er se numesc muchii verticale si se noteaza cu VE. Muchiile ei’ si ei’’ (i = 1, 2,….,n) se numesc muchii neverticale si se noteaza cu NVE. Suma muchiilor verticale si neverticale se noteaza cu m = VE + NVE .
Cu ajutorul notatiilor prezentate se poate defini indicele PI cu ajutorul relatiei 196:
PI = (VE)(NVE) + (m-2)NVE (196)
In Tabelul 21 sunt prezentati parametrii pentru primele 20 de poliacene si valorile indicelui PI calculate cu ajutorul ecuatiei 196.
Tabelul 21. Parametrii pentru primele 20 de poliacene si valorile indicelui PI calculate cu ajutorul ecuatiei 196
Daca se considera numarul de hexagoane din structura moleculei, h, estimarea indicelui PI este si mai usoara.
VE = h + 1, NVE = 4h, m = 5h + 1 si luand in considerare ecuatia 196 se obtine PI = 24h2.
Indicele PI a fost utilizat cu succes in modelarea punctelor de fierbere, a refractie molare (MR), volumelor molare (MV), parachorului (PR) si polarizabilitatii (α) pentru o serie de alcani si cicloalcani [282]. De asemenea indicele PI a fost utilizat in corelatii cu presiunea de vapori a unor policloro-bifenili sau cu activitatea inhibitorie (log 1/C) asupra A. niger a unor alcooli benzoilici substituiti cand se obtin coeficiente de corelare ridicate [282].
Indicele PI calculat cu ajutorul ecuatiei 196 a fost utilizat in modelarea logaritmului coeficientului de partitie octanol-apa (logP) in cazul poliacenelor L1-L20 cand se obtine un coeficient de corelare r = 0.971 [283].
4.8. Indicii Axi
Pentru descrierea structurilor moleculare care contin si heteroatomi, legaturi multimple sau inele au fost propusi de Xu si colaboratorii [284] trei indici topologici al caror mod de calcul este prezentat in cele ce urmeaza in cazul 2-metilbutanului.
Cei trei indici au ca sursa urmatoarele trei matrici:
In Figura 73 este prezentat graful 2-metilbutanului (73a) si cele 3 matrici caracteristice (73b-d).
73a 73b 73c 73d
Figura 73. Graful 2-metilbutanului si cele 3 matrici caracteristice [284]
Din matricile prezentate in Figura 73 (73b-d) se obtin alte trei matrici G1-G3 prin adaugarea a doua coloane. Elementele din prima coloana reprezinta a matricilor G1-G3 reprezinta radacina patrata agradelor varfurilor iar elementele din coloana a doua a matricilor G1-G3 reprezinta radacina patrata a razelor van der Waals (VDW) a atomilor.
Din matricile G1-G3 se obtin alte trei matrici Z1-Z3 cu ajutorul formulelor urmatoare: Z1 = G1’•G1 ; Z2 = G2’•G2 ; Z3 = G3’•G3 in care G1’-G3’ sunt transpusele matricilor G1-G3 [284].
In Figura 74 sunt prezentate matricile G1-G3 respectiv Z1-Z3 in cazul grafului 2-metilbutanului (Figura 73a).
Figura 74. Matricile G1-G3 respectiv Z1-Z3 in cazul grafului 2-metilbutanului (Figura 73a) [284]
Se pot defini asadar cei trei indici astfel:
Ax1 = λmax1 / 2; Ax2 = λmax2 / 2; Ax3 = λmax3 / 2 (197)
unde λmax1-λmax2 sunt cele mai mari valori proprii din matricile Z1-Z3.
Pentru 2-metilbutan valorile celor trei indici calculate cu ajutorul ecuatiei 197 sunt:
Ax1 = 10.0455, Ax2 = 14.8963, Ax3 = 14.8237
Valorile indicilor Ax1 – Ax3 au fost testate in corelari cu punctele de fierbere a 39 alcani C2-C8 sau a unor alcooli cand se obtin coeficienti de corelare mai mare de 0.950 [284]. De asemenea indicii Ax1 – Ax3 sunt utilizati in modelari ale logaritmului coeficientului de partitie octanol-apa (logP) in cazul unor barbiturati sau modelarea toxicitatii unor derivati aromatici ce contin azot cand de asemenea coeficientul de corelare r este mai mare de 0.970 [284].
4.9. Indicele Xu
Matricea de adiacenta A respectiv matricea de distante D reprezinta sursa de constructie a unui nou indice topologic Xu [285]. Pentru un graf G cu N varfuri, acesta se poate defini cu ajutorul ecuatiei 198:
Xu = N1/2logL = N1/2log(Σvisi2 / Σvisi) (198)
in care L reprezinta distanta topologica medie de valenta, sumarea se face peste toate varfurile i iar N reprezinta numarul de varfuri din graful G.
In Figura 75 este prezentat modul de constructie al indicelui Xu pentru graful 2-metilbutanului prezentat in Figura 73a.
75a 75b 75c 75d
Xu = 51/2log[(1•82 + 3•52 + 2•62 + 1•92 + 1•82) / (1•8 + 3•4 + 2•6 + 1•9 + 1•8)] = 1.8681
Figura 75. Matricea de adiacenta (75a), matricea gradului varfurilor (75b), matricea de distante (75c), matricea sumei distantelor (75d) si valoarea indicelui Xu pentru 2-metilbutan
Noul indice a fost utilizat cu bune rezultate in modelarea unor proprietati fizice ale alcanilor cum ar fi: punctele de fierbere, temperatura critica, volumele van der Waals, constantele van der Waals si caldura de vaporizare [285].
Capitolul 5
PROGRAME UTILIZATE IN CALCULUL INDICILOR TOPOLOGICI: ASEMANARI SI DEOSEBIRI
Numarul mare de descriptori moleculari din literatura de specialitate precum si structurile chimice cat mai complicate au impus scrierea si utilizarea unor programe software care sa calculeze acesti descriptori moleculari si in felul acesta sa reduca timpul si munca cercetatorilor. Printre cele mai utilizate pachete de programe sunt amintite: CODESSA (COmprehensive DEscriptors for Structural and Statistical Analysis), PRECLAV (PRoperty Evaluation by CLAss Variables) sau DRAGON. In cele ce urmeaza vor fi prezentate pe scurt cele trei programe precum si asemanarile sau deosebirile dintre acestea.
CODESSA este un program de predictie si analiza statistica fiind rezultatul efortului comun al companiei Semichem [286] si Profesorilor Alan Katritzky (Universitatea din Florida) si Mati Karelson (Universitatea Tartu, Estonia) [287-291].
Acest program calculeaza peste 450 de descriptori moleculari pe baza structurii geometrice sau electronice a moleculei. Acesti descriptori moleculari pot fi clasificati in sase grupe: constitutionali, topologici, geometrici, electrostatici, cuanto-chimici si
termodinamici. Diferite atribute structurale ale moleculei pot fi utilizate ca descriptori moleculari si anume: indici topologici de conectivitate (proprietati depinzand de distributia de sarcina in molecula), functii termodinamice la diferite temperaturi sau caracteristici de solvatare. Pe langa descriptorii deja definiti in literatura de specialitate in program mai pot fi introdusi si alti descriptori cu ajutorul operatiilor si functiilor matematice uzuale.
CODESSA utilizeaza mai multe tehnici de analiza statistica in corelarea datelor experimentale cu descriptorii moleculari calculati. O prima categorie o reprezinta analiza mono sau bidimensionala de distributie normala a datelor initiale sau studiul de intercorelare a diferitelor proprietati sau descriptori. O a doua categorie de analize statistice este reprezentata de metodele de regresie liniara sau multiliniara. Sunt de asemenea utilizate mai multe strategii heuristice pentru gasirea celor mai bune corelatii multiparametru in spatiul natural sau extins al descriptorilor.
Proprietatile moleculare, descriptorii sau combinatii ale acestora pot fi analizate utilizand factorul de analiza bazat pe metode de recunoastere structurala incluzand analiza componentului principal (PCA), cele mai mici patrate partiale neliniare (NIPALS) si transformarea tinta (TT).
CODESSA suporta urmatoarele tipuri de formate ca fisiere input: formatul MDL-molfile [292], formatul Hyperchem-hin [77], formatul Sybyl-mol [293] si doua formate AMPAC (rezultatul calculelor SCF si a calculelor termodinamice)-out. Primele trei formate codifica informatii privind constitutia atomica, conectivitatea si geometria 3D a structurilor chimice in timp ce formatele AMPAC codifica proprietatile cuanto-chimcie sau termodinamice ale structurilor chimice [286]. Fisierele output cuprind date numerice, grafice despre structuri, descriptori si proprietati precum si rezultatul analizei statistice.
AMPAC este primul pachet de programe semiempirice suportat de CODESSA care codifica informatii necesare calculului descriptorilor cuanto-chimici si termodinamici. Aceleasi rezultate se obtin si prin utilizarea ultimei versiuni a unui alt pachet de programe semiempirice – MOPAC [74].
In continuare sunt prezentate etapele de obtinere a fisierului output in cazul etanului care urmeaza a fi utilizat de CODESSA pentru calculul descriptorilor moleculari implemetati in acest program.
1. Modelarea si optimizarea geometriei etanului cu ajutorul programului Hiperchem [77] utilizandu-se campul de forte mecanice moleculare MM+ (Figura 76).
Figura 76. Graful molecular caracteristic etanului modelat si optimizat cu ajutorul programului Hiperchem [77] utilizandu-se campul de forte mecanice moleculare MM+
Fisierul etan.hin are urmatoarea compozitie:
forcefield mm+
sys 0 0 1
view 40 0.38071 55 15 -0.2023222 -0.9449037 0.2573377 -0.9792282 0.1916154 -0.06629988 0.01333715 -0.2654062 -0.9640444 6.435e-005 -0.44528 -54.877
seed -1109
mol 1
atom 1 – C C4 – 0 -0.4522884 -0.6723938 1.663498e-006 4 2 s 3 s 4 s 5 s
atom 2 – C C4 – 0 -0.4522918 0.8594166 1.660006e-006 4 1 s 6 s 7 s 8 s
atom 3 – H H – 0 0.5883118 -1.072138 -2.855648e-006 1 1 s
atom 4 – H H – 0 -0.9725845 -1.07214 0.9011894 1 1 s
atom 5 – H H – 0 -0.9725913 -1.072142 -0.9011812 1 1 s
atom 6 – H H – 0 -1.492892 1.259161 -2.834491e-006 1 2 s
atom 7 – H H – 0 0.06800444 1.259163 0.9011894 1 2 s
atom 8 – H H – 0 0.06801117 1.259165 -0.9011812 1 2 s
endmol 1
2. Conversia extensiei hin din fisierul etan.hin in mpn cu ajutorul programului BabelWin [78] (etan.mpn).
In aceasta situatie fisierul etan.mpn are urmatoarea compozitie:
THERMO ROT=1 GEO-OK mmok precise CHARGE=0 GNORM=0.1 BONDS VECTORS DENSITY
C:\Proba\etan.mpn
C:\Proba\etan.mpn
C 0.0000000 0 0.000000 0 0.000000 0 0 0 0 0.0000
C 1.5318104 1 0.000000 0 0.000000 0 1 0 0 0.0000
H 1.1147395 1 111.014293 1 0.000000 0 1 2 0 0.0000
H 1.1147396 1 111.014210 1 120.000058 1 1 2 3 0.0000
H 1.1147396 1 111.014321 1 -120.000019 1 1 2 3 0.0000
H 1.1147396 1 111.014302 1 179.974377 1 2 1 3 0.0000
H 1.1147397 1 111.014218 1 -60.000433 1 2 1 3 0.0000
H 1.1147397 1 111.014330 1 59.999480 1 2 1 3 0.0000
Pentru etapele urmatoare fisierul etan.mpn va contine urmatoarele cuvinte cheie: THERMO ROT=1 GEO-OK mmok precise CHARGE=0 GNORM=0.1 BONDS VECTORS DENSITY a caror semnificatie este detaliata in referinta [74].
3. Obtinerea unei matrici .dat utilizand programul WinMopac [75].
Fisierul etan.dat are urmatoarea compozitie:
CODESSA AM1 PRECISE GRAD GEO-OK LICENSE SYBYL SIZES TRUSTE RHF
C 0.0000000 0 0.000000 0 0.000000 0 0 0 0 0.0166
C 1.5209583 1 0.000000 0 0.000000 0 1 0 0 0.0166
H 1.1091640 1 111.190673 1 0.000000 0 1 2 0 -0.0055
H 1.1091427 1 111.197731 1 120.013740 1 1 2 3 -0.0055
H 1.1091841 1 111.181407 1 -119.986539 1 1 2 3 -0.0056
H 1.1091680 1 111.188812 1 179.998897 1 2 1 3 -0.0055
H 1.1092042 1 111.170851 1 -60.025821 1 2 1 3 -0.0056
H 1.1091349 1 111.200783 1 59.976585 1 2 1 3 -0.0055
Pentru etapele urmatoare fisierul etan.dat va contine urmatoarele cuvinte cheie: CODESSA AM1 PRECISE GRAD GEO-OK LICENSE SYBYL SIZES TRUSTE RHF a caror semnificatie este detaliata tot in referinta [75].
4. Obtinerea fisierului cu calcule cuanto-chimice si termochimice utilizand pachetul de programe semiempirice AMPAC [286].
Compozitia fisierului etan.out este este prezentata in Anexa 1 a prezentei teze de doctorat.
Fisierul etan.out este utilizat apoi de CODESSA pentru calculul descriptorilor moleculari generandu-se fisierul etan.cod care va contine date numerice, grafice despre etan, descriptori si proprietati precum si rezultatul analizei statistice.
In Figura 77 este prezentata sinteaza etapelor 1-4.
Figura 77. Sinteaza etapelor de obtinere a fisierului utilizat de CODESSA pentru calculul descriptorilor moleculari
PRECLAV (PRoperty Evaluation by CLAss Variables) este un alt pachet software utilizat in calcule QSAR/QSPR fiind dezvoltat de Laszlo Tarko de la Centrul de Chimie Organica ,,C. D. Nenitescu’’ al Academiei Romane, Bucuresti [294-295].
Pentru obtinerea fisierului utilizat de PRECLAV, moleculele sunt modelate utilizand programul de mecanica moleculara PCMODEL [296] urmand ca geometria si conformerii de minima energie sa se obtina utilizand campul de forte MMX si algoritmul GMMX [297]. Geometria este mai riguros optimizata cu ajutorul programului de mecanica cuantica MOPAC [74] utilizand cuvintele cheie: AM1 PULAY GNORM=0.01 SHIFT=50 GEO-OK MMOK CAMP-KING BONDS VECTORS.
Fisierul output creat de MOPAC este utilizat ca fisier input de PRECLAV care calculeaza peste 1100 de descriptori (globali, locali sau grid / field) urmand a se realiza si analiza statistica. PRECLAV este capabil sa calculeze si aromaticitatea legaturilor chimice pe baza algoritmlui TPA sau valoarea optima a distantei unor atomi proba.
Studiile QSAR se pot realiza cu sau fara set de testare. In cazul in care studiile QSAR se realizeaza cu un set de testare, acest program utilizeaza functia CLASS pentru identificarea celor mai semnificativi descriptori.
Ecuatiile QSAR ,,bune’’ sunt selectate de program conform functiei de cross-validare.
DRAGON este un pachet software dezvoltat de Milano chemometrics [298] si Grupul de cercetare QSAR condus de Roberto Todeschini [299]. Acest program nu realizeaza optimizarea geometriei si nu transforma structurile topologice in structuri geometrice 3D corespunzatoare.
DRAGON calculeaza peste 1664 de descriptori clasificati in 20 de categorii. Pe langa descriptorii moleculari clasici sunt calculate si o serie de proprietati moleculare cum ar fi: logP, refractia molara, numarul de legaturi rotabile, legaturi H-acceptoare, H-donoare, regula Lipinski sau o serie de indici de toxicitate. Acest program accepta urmatoarele date de input: 1. Sybyl-TriposΘMol2 file(.mol, .ml2, .mol2); 2. Sybyl-CambridgeSoft Corp.ΘMolfiles (.sm2); 3. Sybyl-TriposΘ Multiple Molfiles(.mol, .ml2); 4. Molfiles-Molecular Design Ltd. (MDL)ΘMolfiles (.mol); 5. Multiple SD files- Molecular Design Ltd. (MDL)ΘMultiple SD files (.sdf); 6. Hyperchem-HypercubeΘFiles (.hin); 7. Smiles notations (.smi); 8. Macromodel-SchrodingerΘFiles(.dat, .out).
Fisierul output creat de Dragon contine valorile tuturor descriptorilor si este utilizat pentru realizarea unei statistici univariate sau a unor histograme.
Principalele diferente intre CODESSA si PRECLAV sunt urmatoarele:
50% din descriptorii moleculari calculate de PRECLAV difera de cei calculate de CODESSA.
Programul PRECLAV calculeaza si utilizeaza descriptori grid-field in timp ce CODESSA nu utilizeaza asemenea descriptori.
Pentru selectia descriptorilor programul PRECLAV utilizeaza functia CLASS in loc de criteriile utilizate de CODESSA (numai cand se lucreaza cu seturi de testare).
In cazul programului PRECLAV selectia ecuatiilor QSAR se face in functie de valoarea functiei de cross-validare in timp ce CODESSA nu utilizeaza acest criteriu.
Programul PRECLAV utilizeaza ca metoda statistica numai BMLR (Best MultiLinear Regression) in timp ce CODESSA utilizeaza si alte metode statistice (metoda heuristica, PLS, PCA).
Diferenta majora dintre CODESSA, PRECLAV si DRAGON este ca DRAGON calculeaza un numar mult mai mare de descriptori precum si serie de proprietati moleculare cum ar fi: logP, refractia molara, numarul de legaturi rotabile, legaturi H-acceptoare, H-donoare, regula Lipinski sau indici de toxicitate dar analiza statistica nu este la nivelul primelor doua programe.
PARTEA ORIGINALA
Capitolul 6.
IMPLICAREA DESCRIPTORILOR MOLECULARI IN STUDII QSAR/QSPR CARACTERISTICE UNOR COMPUSI DE INTERES CHIMIC SI BIOCHIMIC
6.1. Obiectivele cercetarii
In partea generala a lucrarii a fost subliniata importanta teoriei grafurilor in contextul chimiei organice prezentadu-se diferite tipuri de matrici asociate ale grafurilor, matrici care reprezinta sursa in definirea a trei generatii de descriptori moleculari.
Chimia computerizata este la ora actuala o modaliate eleganta si eficienta pentru a sistematiza proprietatile compusilor, dar si pentru dezvoltarea unor strategii de elaborare a unor noi structuri in baza unui design molecular. In acest sens studiile QSPR/QSAR s-au dovedit de un real folos. Cercetarile noastre au avut asadar ca obiectiv implicarea descriptorilor moleculari in realizarea unor studii QSAR/QSPR care sa permita aprofundarea designului molecular si implicit prezicerea si descrierea proprietatilor compusilor chimici.
Dupa cum este binecunoscut si asa cum s-a aratat detaliat si in Capitolele 3-5, descriptorii moleculari pot codifica informatia structurala dintr-o formula chimica si cu ajutorul acestora se pot realiza studii QSPR/QSAR prin care se pot descrie si prezice proprietati ale respectivei clase de structuri chimice.
Intreaga activitate de cercetare intreprinsa in contextul mai sus mentionat, s-a desfasurat urmarind urmatoarele obiective :
i) sinteza, caracterizarea fizico-chimica si realizarea unui studiu de corelare structura-date Rf (QSPR) cuprinzand derivatii de O-Metiloxima ai testosteronei si noii derivati O-Metiloxima ai 17α-metiltestosteronei.
ii) modelarea toxicitatii unor derivati aromatici policlorurati, a activitatii de inhibare a anhidrazei carbonice II in cazul unor sulfanilamide si baze Schiff si a hidrofobicitatii unor derivati de 4-Ariloxi-7-nitrobenzofurazan si 2-Ariloxi-(-acetil)-fenoxatiina prin studii QSAR/QSPR in care sunt implicati descriptorii moleculari evaluati in programele CODESSA, DRAGON, POLLY, TRIPLET si MOLCONN-Z.
iii) dezvoltarea unei noi metode de calcul a constantelor electronice Hammett din pozitia orto a derivatilor aromatici si realizarea unui studiu QSPR (structura-pKa) in cazul unor derivati N-metoxilati ai polinitroanilinelor.
iv) modelarea toxicitatii unor derivati aromatici fata de Tetrahymena pyriformis prin utilizarea unor descriptori construiti cu ajutorul metodei de calcul a constantelor electronice Hammett din pozitia orto si a descriptorilor moleculari implementati in programul PRECLAV.
v) noi metode de caracterizare prin studii QSAR a afinitatii de legare a diarilguanidinelor de receptorul NMDA (N-metil-D-aspartat) si receptorul σ.
vi) definire si constructia unei noi matrici numita matricea legaturii de valenta (VBM) ca sursa de invarianti locali ai legaturilor din care pot fi definiti noi indici topologici.
vii) definirea unui nou indice topologic Q numit indicele quadratic suma si utilizarea acestuia in studii QSPR pentru modelarea punctelor fizice ale alcanilor ciclici si aciclici.
In cele ce urmeaza, vor fi prezentate si discutate rezultatele studiilor intreprinse.
6.2. SINTEZA, CARACTERIZAREA FIZICO-CHIMICA SI REALIZAREA UNUI STUDIU STRUCTURA-DATE Rf (QSPR) CUPRINZAND DERIVATII DE O-METILOXIMA AI TESTOSTERONEI SI NOII DERIVATI O-METILOXIMA AI 17α-METILTESTOSTERONEI
Steroizii androgeni au multiple aplicatii biomedicale dar sunt si substante controlate datorita activitatii lor anabolice [300, 301]. Proprietatile biologice și utilitatea în analize biomedicale au facut ca alchiloximele cetosteroizilor sa fie intens studiate [300-303].
Testosterona 1a (17β-hidroxi-4-androsten-3-ona) si derivatul metilat al acesteia 2a(17β-hidroxi-17α-metilandrost-4-en-3-ona) sunt doi steroizi androgeni cu o larga raspandire [300, 301]. O-Metiloxima testosteronei 1a (3-[O-(aminometil)oxima] 17β-hidroxi-4-androsten-3-ona) este cunoscuta, cei doi izomeri geometrici 1b(sin) si 1c(anti) fiind caracterizati fizico-chimic [300, 304]. In cazul α-metil-testosteronei 2a, cei doi izomeri de tip metoxima 2b(sin) , (sin 3-[O-(aminometil)oxima] 17β-hidroxi-17α-metilandrost-4-en-3-ona), respectiv 2c(anti),(anti 3-[O-(aminometil)oxima] 17β-hidroxi-17α-metilandrost-4-en-3-ona) sunt compusi nou sintetizati si caracterizati fizico-chimic [305].
In acest sens, am avut in vedere : i) obtinerea izomerilor geometrici 2b,c corespunzatori ; ii) caracterizarea lor fizico-chimica ; iii) aplicarea descriptorilor topologici si topografici pentru modelari QSPR ale datelor experimentale obtinute prin TLC (Rf) in cazul fiecarui izomer.
6.2.1. Sinteza compusilor 1b,c si 2b,c
Pentru obtinerea compusilor 1b,c si 2b,c s-a aplicat un procedeu in doua etape: i) condensarea cetonelor 1a si 2a cu O-metilhidroxilamina aplicand un mod de lucru cunoscut [303, 306] utilizand etanol ca solvent la refluxare timp de 4 ore in prezenta de acetat de sodiu ; ii) separarea prin TLC preparativ a izomerilor 1b,c si 2b,c. Randamentele cu care s-au obtinut compusii mentionati sunt relativ ridicate si sugereaza ca formarea izomerului sin (1a si 2a) este favorizata comparativ cu formarea izomerului anti (1b si 2b) observatie semnalata si în alte lucrari pe acelasi caz [303].
Structura izomerilor 1b,c si 2b,c a fost confirmata prin 1H-RMN si 13C-RMN.
Spectrele 1H-RMN conduc la urmatoarele observatii : fiecare pereche de izomeri
( 1b,c si 2b,c ) are un spectru caracteristic care se diferentiaza numai in cea ce priveste protonul din pozitia C-4 ; deplasarile chimice pentru protonul din pozitia C-4 sunt identice, respectiv 6.37 ppm pentru izomerul sin indiferent de compusul 1b sau 2b respectiv 5.77 ppm pentru izomerul anti indiferent de compusul 1c sau 2c , fiind relativ similare pentru cele comunicate in cazul acelorasi tipuri de izomeri de tip 3-(alchiloxima) ai cortizonei si testosteronei (6,25 ppm si 6.36 ppm pentru izomerii sin respectiv 5.65 ppm si 5.73 ppm pentru izomerii anti) [303].
6.2.2. Comportarea TLC a compusilor 1a-c si 2a-c
Cromatografia in strat subtire (TLC) poate furniza informatii importante privind structura compusilor daca este corelata cu repartitia solid-lichid a compusilor studiati[54, 65, 66, 155, 214, 307-314].
Silicagelul si amestecul eter etilic-eter de petrol (30-600C) s-au dovedit eficiente pentru separarea izomerilor 1b,c si 2b,c .
In Tabelul 22 sunt prezentate valorile Rf pentru compusii 1a-c si 2a-c aplicand conditiile de faza stationara si mobila mentionata [305].
Tabelul 22. Valorile Rf pentru compusii 1a-c si 2a-ca
asilica gel GF254(Merck), eter etilic-eter de petrol(30-600C) 1:1 v/v, atmosfera nesaturata ascendent unidimensional
Rezultatele TLC mentionate in Tabelul 22 au permis urmatoarele observatii si interpretari: i) Rf 1a < Rf 2a poate fi pusa pe seama prezentei gruparii metil in cazul α-metil-testosteronei 2a, acesta fiind preferential repartizat in faza mobila comparativ cu analogul 1a; ii)metoximarea gruparii carbonil ridica considerabil valoarea Rf indiferent de compus 1a sau 2a dovedind ca initial gruparea carbonil oferea interactii puternice cu suprafata de silicagel, noua grupare introdusa (MeON=) favorizand repartitia in faza mobila; iii) Rf izomerii sin (1b, 2b)> Rf izomerii anti (1c,2c) identic situatiei unor oxime izomere [315, 316] ; iv) diferentele intre valorile Rf (ΔRf) indica prin valorile lor influentele structurale care se mentin riguros pentru perechi de compusi ( analogi) cea ce argumenteaza si corectitudinea experimentarilor pe de o parte, iar pe de alta parte contributiile gruparilor structurale in cea ce priveste repartitia solid-lichid . (ΔRf(2a-1a)=0.02; ΔRf(2b-1b)=0.02; ΔRf(2c-1c)=0.02; ΔRf(1b-1c)=0.14; ΔRf(2b-2c)=0.14)
Sub aspect practic rezultatele TLC mai sus prezentate dovedesc ca cei doi izomeri geometrici sin(1b si 2b) si anti (1c si 2c ) pot fi separati cu mult mai usor printr-un proces de repartitie solid-lichid,comparativ cu steroizii initiali 1a si 2a, derivatizarea gruparii carbonil sub forma de O-metiloxima facilitand un astfel de proces.
6.2.3. Studiul QSPR
Pentru modelarea datelor Rf printr-un studiu QSPR in cazul celor sase compusi 1a-c si 2a-c au fost calculati mai multi descriptori topologici. Acesti descriptori topologici sunt reprezentati de : primul indice Pyka (ISTI) [54], indicele Pogliani (Xcp(p)) [209], indicele Schultz (S) [201], indicele Balaban (J) [5, 63, 243] si produsul tuturor intrarilor din matricea Schultz (PRS) [201]. Valorile acestor indici topologici sunt prezentate in Tabelul 23.
Tabelul 23. Valorile indicilor topologici pentru cei doi steroizi si oximele diastereoizomere ale acestora
Pentru a include in mod satisfacator topologia si geometria moleculelor steroizilor am propus si utilizat un indice J modificat [305] care se calculeaza cu ajutorul formulei :
Jgeom = q/(µ+1)Σ(vivj)-1/2 + C×p-n + I×lnA (199)
unde q este numarul total de legaturi si multiplicitatea lor, este numarul ciclomatic, C este numarul total de atomi, p este pozitia dublei legaturi in acord cu numerotarea facuta, n este numarul dublelor legaturi iar A este suma elementelor unui vector coloana care contine date despre topologia si geometria moleculei indicand varfurile (atomii) fara hidrogeni atasati cu cateva exceptii :
-gruparea metil a carui valoare este +1 pentru isomerii cis si -1 pentru izomerii trans
-oxigenul din gruparea hidroxil (+5 in C=O pentru syn and -5 pentru anti)
-azotul (6).
Pentru indicatorul I am propus urmatoarele valori obtinute cu ajutorul analizei statistice:
Vectorii coloana A pentru cei 6 steroizi sunt prezentati mai jos:
Ecuatia QSPR are forma :
Rf = aX + b (200)
In Tabelul 24 sunt prezentate datele statistice pentru corelatiile monoparametrice liniare cu date de Rf.
Tabelul 24. Datele statistice pentru corelatiile monoparametrice liniare cu date de Rf
Asa cum se observa din Tabelul 24 cele mai bune corelatii se obtin cu indicele Schultz (S) [201] si cele mai slabe rezultate se obtin cu indicele Alyna Pyka (ISTI) [54] in timp ce indicii PRS [201] si Jgeom [305] conduc la corelatii acceptabile.
6.2.4. Concluzii privind sinteza izomerilor geometrici sin(1b si 2b) si anti(1c si 2c)
Sinteza izomerilor geometrici sin(1b si 2b) si anti(1c si 2c) izolati preparativ prin TLC si confirmati prin date RMN a permis validarea modelului topologic J (A.T.Balaban) si a modelului topografic JBBBCC(Beteringhe-Balaban-Constantinescu-Baciu-Caproiu) numit si Jgeom in cea ce priveste posibilitatea separarii izomerilor prin metode TLC.
6.3. MODELAREA TOXICITATII UNOR DERIVATI AROMATICI POLICLORURATI PRIN STUDII QSAR/QSPR
Derivatii aromatici polihalogenati sunt uni din cei mai daunatori compusi pentru mediu clasele cele mai cunoscute din aceasta categorie fiind policlorodibenzofuranii (PCDF)(78a), policlorodibenzo-1,4-dioxinele (PCDD) (78b) si policlorobifenilii (PCDB) (78c). Acesti derivati aromatici policlorurati exercita un puternic efect toxic si asupra organismului uman (efect neurotoxic, cancerigen) [317, 318] iar policlorodibenzo-1,4-dioxinele izomere sunt cunoscute ca unii din cei mai toxici compusi organici [318]. In Figura 78 sunt prezentate structurile moleculare si grafurile chimice in cazul celor trei categorii de derivati aromatici policlorurari.
78a 78b 78c
Figura 78. Structurile moleculare si grafurile caracteristice in cazul policlorodibenzo
furanilor(PCDF) (78a), policlorodibenzo-1,4-dioxinele (PCDD) (78b) si policlorobifenilii (PCDB) (78c).
6.3.1. Izomerii posibili pentru cele trei clase de derivati aromatici policlorurati
Pentru determinarea tuturor izomerilor posibili in cazul celor trei clase de compusi aromatici policlorurati, cel mai simplu mod este de a utiliza teorema lui Polya. Cel mai important element al teoremei este reprezentat de indicele ciclu care depinde automorfismele prezente precum ar fi operatiile de simetrie implicand axele proprii de rotatie. – neclar!!!
6.3.1.1 Izomerii policlorobifenililor
In cazul policlorobifenililor se iau in considerare toti rotamerii posibili ai moleculei de bifenil substituite iar indicele ciclu conduce la un polinom in x al carui grad este egal cu numarul de atomi de halogen din molecula.
In ecuatia 201, fiecare subscript a se refera la ordinul permutarii si fiecare superscript b se refera la numarul permutarilor sau numarul de pozitii neschimbate.
xab = (ya + 1)b (201)
Se obtine asadar o serie [319] (x10 + 2×25 + 2x6x22 + 2x2x42 + x2x44) / 8 din care se genereaza o functie in y de forma : y10 + 3y9 + 12y8 + 24y7 + 42y6 + 46y5 + 42y4 + 24y3 + 13y2 + 3y + 1.
Asa cum se observa din functia prezentata sunt posibili 3 monoclorobifenili, 12 diclorobifenili, 24 triclorobifenili etc. In literatura de specialitate sunt raportati 12 policlorobifenili ca avand un pronuntat efect toxic similar cu cel al tetraclorodibenzodioxinelor [320].
Inainte de a fi interzisi datorita toxicitatii si persistentei in mediu, bifenilii polihalogenati au fost utilizati ca lichide dielectrice in transformatoare electrice, ca agenti de transfer termic, lubrefianti sau aditivi pentru pesticide si materiale plastice [321-323].
6.3.1.2. Izomerii policlorodibenzo-1,4-dioxinelor
Aplicandu-se acelasi procedeu ca in cazul policlorobifenililor se obtine urmatoarea serie [319] : (x8 + 3×24) / 4 din care se obtine functia : y8 + 2y7 + 10y6 + 14y5 + 22y4 + 14y3 + 10y2 + 2y + 1. Exista asadar 2 monoclorodibenzodioxine, 10 dicloro-, 14 triclorodibenzodioxine etc.
Dintre toti izomerii sintetizati, sapte prezinta o toxicitate ridicata si unul dintre acestia (2,3,7,8-tetraclorodibenzo-1,4-dioxina, TCDD, LD50 = 45μg /kg la soareci) este cel mai toxic compus organic sintetic [324-326]. TCDD se formeaza ca produs secundar in cazul sintezelor acidului 2,4,5-triclorofenoxiacetic (ierbicid si agent defoliant) si hexaclorofenului (germicid) din acid cloroacetic si 2,4,5-triclorofenoxidul de sodiu. Acest compus extrem de toxic a provocat daune majore in timpul accidentului de la Sevaso, Italia si a fost utilizat ca agent defoliant (Agent Orange) de catre Armata USA in timpul razboiului din Vietnam.
6.3.1.3. Izomerii policlorodibenzofuranilor
In cazul policlorodibenzofuranilor, teorema Polya conduce la urmatoarea serie [319] : (x8 + x24) / 2 care genereaza urmatoarea functie : y8 + 4y7 + 16y6 + 28y5 + 38y4 + 28y3 + 16y2 + 4y + 1. Asa cum se observa din aceasta functie sunt posibili 4 monoclorodibenzofurani, 16-dicloro-, 28 tri-, 38 tetraclorodibenzofurani etc. Dintre toti policlorodibenzofuranii sintetizati 10 prezinta o toxicitate ridicata [324, 327, 328].
6.3.2. Toxicitatea compusilor aromatici policlorurati
Compusii aromatici policlorurati au o hidrofobicitate ridicata si au efecte multiple asupra organismelor umane cat si animale cum ar fi : efecte hepatotoxice, porfirie, leziuni dermale incluzand cloracnee, efecte endocrine, imunotoxicitate, leziuni gastrice, pierderi in greutate, atropie timica, leziuni reproductive si efecte cancerigene [330, 331]. Aceste efecte sunt rezultatul unui complex format prin legarea a doua enzime asociate cu acesti compusi aromatici policlorurati (hidroxilaza aril hidrocarbura (AHH) si 7-etoxiresorufin O-Deetilasa (EROD)) de receptorul citosolic aril hidrocarbura (AhR) care actioneaza similar la organismele umane si cele animale.
Asa cum s-a aratat in Subcapitolul 6.3.1.2 , 2,3,7,8-tetraclorodibenzo-1,4-dioxina (TCDD) este cel mai toxic compus aromatic policlorurat si reprezinta compusul de referinta pentru toxicitatea relativa a celorlati compusi aromatici policlorurati [332, 333]. Acestui compus ii este atributa valoarea de -9.00 pentru factorul echivalent de toxicitate (TEF) [334, 335] sau valoarea pEC50 = 8.00 pentru afinitatea de legare de receptorul AhR.
S-a aratat in literatura de specialitate [336-338] ca toxicitatea policlorobifenililor orto-substituiti, care nu pot adopta o structura plana, este mai redusa in timp ce toxicitatea policlorobifenililor cu structura plana este similara cu cea a dioxinelor.
6.3.3. Studiu QSAR de modelare a TEF
In literatura de specialitate sunt raportate mai multe lucrari [254, 339] care prezinta valorile factorului echivalent de toxicitate (TEF) pentru cei mai importanti reprezentanti ai celor trei clase de compusi aromatici policlorurati. Corelatiile QSAR au fost studiate utilizand valorile TEF [254, 339] si descriptorii moleculari implementati in programul DRAGON [298, 299] si CODESSA [286-291].
In prezenta lucrare vor fi prezentate ecuatiile QSAR cu cea mai mare putere de predictie in cazul celor trei clase de compusi aromatici policlorurati urmand ca pentru mai multe rezultate sa fie consultata lucrarea [319]. – fa sa rezulte clar ce ai facut tu si prezinta tot ce ai facut tu – nu trimiti in teza la lucrari publicate din lucrari realizate pe parcursul tezei !!!
6.3.3.1. Rezultate QSAR-policlorodibenzofurani
Ecuatia QSAR cu cel mai mare coeficent de corelare, in cazul policlorodibenzofuranilor a fost obtinuta utilizand trei descriptori calculati cu ajutorul programului CODESSA [286-291].
logTEF = -2.851·103(±2.961·102)MinERIC + 0.826(±0.085)Min e-nAtC-Cl + 225.3
(±66.65)MNRIC – 338.1 (202)
N = 26 R = 0.947 S = 0.431 F = 64.93 Q = 2.197
MinERIC = Indicele de reactivitate electrofila minima pentru atomul de C
Min e-nAtC-Cl = Atractia e-n minima pentru legatura C-Cl
MNRIC = Indicele de reactivitate nucleofila maxima pentru atomul de C
In Tabelul 25 sunt prezentate valorile descriptorilor moleculari si valorile TEF in cazul policlorodibenzofuranilor.
Tabelul 25. Valorile descriptorilor moleculari si valorile TEF in cazul policlorodibenzofuranilor
In Figura 79 sunt prezentate datele experimentale si cele calculate cu ajutorul ecuatiei 202 in cazul policlorodibenzofuranilor.
Figura 79. Reprezentarea grafica a datelor experimentale TEF si a celor calculate cu ajutorul ecuatiei 202 in cazul policlorodibenzofuranilor
6.3.3.2. Rezultate QSAR-policlorodibenzo-1,4-dioxine
In cazul policlorodibenzo-1,4-dioxinelor, cel mai mare coeficient de corelare se obtine in ecuatiea QSAR cu trei descriptori moleculari calculati tot cu ajutorul programului CODESSA [286-291].
logTEF = -4.507(±0.301)AVC1 – 859.6(±52.94)MNRIO – 163.9(±18.54)AVO – 372.6 (203)
N = 14 R = 0.986 S = 0.200 F = 121.4 Q = 4.930
AVC1 = Continutul informational mediu (ordinul 1)
MNRIO = Indicele de reactivitate nucleofila maxima pentru atomul de O
AVO = Valenta medie pentru un atom de oxigen
In Tabelul 26 sunt prezentate valorile descriptorilor moleculari si valorile TEF in cazul policlorodibenzo-1,4-dioxinelor.
Tabelul 26. Valorile descriptorilor moleculari si valorile TEF in cazul policlorodibenzo-1,4-dioxinelor
In Figura 80 sunt prezentate datele experimentale si cele calculate cu ajutorul ecuatiei 203 in cazul policlorodibenzo-1,4-dioxinelor.
Figura 80. Reprezentarea grafica a datelor experimentale TEF si a celor calculate cu ajutorul ecuatiei 203 in cazul policlorodibenzo-1,4-dioxinelor.
6.3.3.3. Rezultate QSAR-policlorobifenili
Ecuatia QSAR cu cel mai mare coeficient de corelare in cazul policlorobifenililor cuprinde patru descriptori calculati cu ajutorul programului DRAGON [298, 299].
logTEF = -6.167(±0.963)DP05 + 0.295(±0.204)ATS3e – 2.130(±0.920)MLOGP – 7.407(±3.106)RDF015v + 83.10 (204)
N = 12 R = 0.927 S = 0.437 F = 10.62 Q = 2.121
DP05 = Profilul molecular Randic numarul 5.
ATS3e = Autocorelarea Broto-Moreau structura topologica-lag3/ponderea electrone-
gativitatii atomice Sanderson.
MLOGP = Coeficientul Moriguchi de partitie octanol-apa (logP).
RDF015v = Functia de distributie radiala -1.5/ ponderea volumul atomic van der Waals.
Valorile celor patru descriptori si a celor TEF sunt prezentate in Tabelul 27.
Tabelul 27. Valorile descriptorilor moleculari si valorile TEF in cazul policlorobifenililor
In Figura 81 sunt prezentate datele experimentale si cele calculate cu ajutorul ecuatiei 204 in cazul policlorobifenililor.
Figura 81. Reprezentarea grafica a datelor experimentale TEF si a celor calculate cu ajutorul ecuatiei 204 in cazul policlorobifenililor.
6.3.4. Concluzii privind toxicitatea compusilor aromatici policlorurati
Ecuatiile QSAR prezentate argumenteaza faptul ca toxicitatea ridicata a unor compusi aromatici policlorurati este rezultatul combinarii efectelor electronice, sterice, geometrice (exemplu unghiul diedru in cazul PCB) si hidrofobice, efecte care la randul lor guverneaza interactiile acestor compusi cu receptorii celulari [319].
Toxicitatea policlorobifenililor cu structura plana este ridicata in timp ce izomerii care nu pot adopta o structura plana prezinta o toxicitate mai scazuta . In cazul policlorodibenzo-1,4-dioxinelor si policlorodibenzofuranilor, izomerii care au atomi de clor in pozitiile 2,3,6 si 7 ale ambelor inele benzoice au o toxicitate mai mare fata de a celorlalti izomeri.
6.4. MODELAREA ACTIVITATII DE INHIBARE A ANHIDRAZEI CARBONICE II IN CAZUL UNOR SULFANILAMIDE SI BAZE SCHIFF PRIN STUDII QSAR/QSPR
Enzima numita anhidraza carbonica (CA) a fost studiata intens de-a lungul timpului [340-343] deoarece joaca un rol important in mai multe procese fiziopatologice care includ transportul CO2 prin sange si formarea HCl in stomac. De asemenea CA este responsabila pentru interconversia acidului carbonic si CO2 la bicarbonat si H3O+.
Cei mai cunoscuti inhibitori ai CA sunt derivatii de benzensulfonamida substituiti cu gruparea SO2NH2, inhibitori care fac obiectul mai multor studii QSAR [344-347]. Activitatea de inhibare a CA a acestor derivati se datoreaza legarii anionului SO2NH- de cationul Zn2+ al enzimei mimand anionul bicarbonat in stare de tranzitie.
O alta categorie de inhibitori ai CA-II este reprezentata de bazele Schiff ale derivatilor de sulfanilamida [348, 349].
Noua izoforma a α-CA (CA-II) este o enzima descoperita in organismele umane si a vertebratelor superioare. Pentru noua izoforma au fost sintetizate si caracterizate mai multe clase de inhibitori si activatori [350-353].
Asa cum s-a precizat activitatea de inhibare a CA-II in cazul a 29 derivati de benzensulfonamida a fost modelata in studii QSAR [346] implicand indicele topologic Balaban [5, 63, 129, 243, 244] in timp ce activitatea inhibatorie a 35 de bazele Schiff obtinute de la derivati de sulfanilamida a fost corelata cu indici topologici bazati pe conceptul de distanta [354].
Pentru a se imbunatati coeficientul de corelare s-a realizat un studiu comparativ utilizand valorile activitatii de inhibare a CA-II pentru cele doua clase de compusi (29 derivati de benzensulfonamida si 35 bazele Schiff obtinute de la derivati de sulfanilamida) si descriptorii moleculari implementati in programul CODESSA [286-291] si pachetul de programe POLLY [356], TRIPLET [267] si MOLCONN-Z [357].
In Figura 82 sunt prezentate structurile moleculare pentru cele doua clase de compusi (derivati de benzensulfonamida 82a, bazele Schiff obtinute de la derivati de sulfanilamida 82b).
82a 82b
Figura 82. Structurile moleculare pentru cele doua clase de compusi (derivati de benzensulfonamida 82a, bazele Schiff obtinute de la derivati de sulfanilamida 82b)
In continuare sunt prezentate ecuatiile QSAR pentru cele doua clase de compusi care conduc la cei mai mari coeficienti de corelare (descriptorii moleculari fiind calculati cu ajutorul programului CODESSA) mai multe rezultate fiind disponibile in lucrarea [355].
6.4.1. Modelarea prin studii QSAR a activitatii de inhibare a CA-II a derivatilor de benzensulfonamida si bazelor Schiff obtinute de la derivati de sulfanilamida
6.4.1.1. Ecuatia QSAR reprezentativa in cazul derivatilor de benzensulfonamida
Modelul QSAR cu cel mai mare coeficient de corelare este prezentat cu ajutorul ecuatiei 205.
logK(CAII) = -2.916(±0.252)J + 2.154(±0.170)Min n-nRC-H + 12.16(±0.724)AvgBO – 48.41(±4.695) (205)
N = 29 R = 0.982 S = 0.278 F = 230.3 Q = 3.532 R2 cross-validat = 0.950
J = Indicele Balaban
Min n-nRC-H = Repulsia n-n minima pentru o legatura C-H
AvgBO = Ordinul de legatura mediu pentru un atom de oxigen
In Tabelul 28 sunt prezentate structurile derivatilor de benzensulfonamida, valorile descriptorilor din ecuatia 205 si ale activitatii inhibatorii experimentale si calculate pentru structurile respective.
Tabelul 28. Structurile derivatilor de benzensulfonamida, valorile descriptorilor din ecuatia 205 si ale activitatii inhibatorii experimentale si calculate pentru structurile respective
In Figura 83 sunt prezentate datele experimentale si cele calculate cu ajutorul ecuatiei 205 ale activitatii inhibatorii specifice celor 29 derivati de benzensulfonamida.
Figura 83. Datele experimentale si cele calculate cu ajutorul ecuatiei 205 ale activitatii inhibatorii specifice celor 29 derivati de benzensulfonamida
6.4.1.2. Ecuatia QSAR reprezentativa in cazul bazele Schiff obtinute de la derivati de sulfanilamida
Ecuatia QSAR cu cel mai mare coeficent de corelare (r) este prezentata cu ajutorul ecuatiei 206.
logK(CAII) = 8.075(±1.597)RNAB – 5.345·10-6(±7.336·10-7)GI – 13.64(±3.977)MV / XYZB + 2.203(±0.578) (206)
N = 35 R = 0.873 S = 0.335 F = 33.26 Q = 2.606 R2 cross-validat = 0.690
RNAB = Numarul relativ de legaturi aromatice
GI = Indicele de gravitatie
MV / XYZB = Volumul molecular / Plan (cutie) XYZ
In Tabelul 29 sunt prezentate structurile bazelor Schiff, valorile celor trei descriptori moleculari calculati cu programul CODESSA precum si valorile experimentale si cele calculate cu ajutorul ecuatiei 206 pentru respectivele structuri.
In Figura 84 se prezinta datele experimentale si cele calculate cu ajutorul ecuatiei 206 ale
activitatii inhibatorii specifice celor 35 bazele Schiff obtinute de la derivati de sulfanilamida.
Tabelul 29. Structurile bazelor Schiff, valorile celor trei descriptori moleculari calculati cu programul CODESSA precum si valorile experimentale si cele calculate cu ajutorul ecuatiei 206 pentru respectivele structuri
Figura 84. Datele experimentale si cele calculate cu ajutorul ecuatiei 206 ale
activitatii inhibatorii specifice celor 35 bazele Schiff obtinute de la derivati de sulfanilamida
6.4.2. Modelarea activitatii de inhibare a CA-II a derivatilor de benzensulfonamida si bazele Schiff obtinute de la derivati de sulfanilamida prin studii QSAR implicand descriptorii moleculari
Pentru calculul descriptorilor moleculari implementati in pachetul de programe POLLY [356], TRIPLET [267] si MOLCONN-Z [357], structurile inhibitorilor anhidrazei carbonice fiind reprezentate prin notatia SMILES (Simplified Molecular Input Line Entry System) [358]. Descriptorii moleculari calculati cu ajutorul acestor programe sunt clasificati in trei clase : i) topostructurali (TS)-descriptori ce codeaza strict informatii despre adiacenta si conectivitatea atomilor dintr-o molecula ; ii) topochimici-codeaza in plus fata de descriptorii TS, informatii despre tipul de legatura ; iii) geometrici sau tridimensionali (3D) – cei mai complexi descriptori codand aspecte tridimensionale ale structurii moleculare. Ansamblul de descriptori TS si TC formeaza clasa descriptorilor topologici.
Parametrii statistici pentru fiecare ecuatie QSAR dezvoltata in parte cuprind valoarea lui R2 cross-validat si parametrul PRESS care reprezinta suma patratelor rezidurilor calculate. Cu cat valoarea lui PRESS este mai mica cu atat valoarea predictiva a modelului este mai mare.
In Tabelul 30 sunt prezentate valorile parametrilor statistici [355] pentru clasa derivatilor de benzensulfonamida in timp ce in Tabelul 31 sunt prezentati aceasi parametri statistici pentru bazele Schiff obtinute de la derivati de sulfanilamida.
Tabelul 30. Valorile parametrilor statistici [355] pentru clasa derivatilor de benzensulfonamida
Tabelul 31. Valorile parametrilor statistici [355] pentru clasa bazelor Schiff obtinute de la derivati de sulfanilamida
Coeficientii de corelare obtinuti pentru cele doua clase de inhibitori au valoare mai ridicata atunci cand sunt implicati descriptorii moleculari implementati in cele 4 programe. Rezultatele obtinute demonstreaza faptul ca factorii electronici joaca un rol important in activitatea de inhibare a anhidrazei carbonice (CA II) de catre cele doua clase de derivati.
6.5. MODELAREA HIDROFOBICITATII UNOR DERIVATI DE 4-ARILOXI-7-NITROBENZOFURAZAN SI 2-ARILOXI-(α-ACETIL)FENOXATIINA PRIN STUDII QSPR
Domeniul heterociclilor a reusit sa fascineze intreaga comunitate chimica stiintifica datorita rezultatelor practice si teroretice pe care le ofera. Din acest domeniu vast se desprind doua clase importante de compusi datorita multiplelor utilizari ale acestor compusi. Cele doua clase sunt reprezentate de derivatii de 7-nitrobenzofurazan si derivatii de α-acetilfenoxatiina. – mi se pare nepermis de simplificator !!. In tara noastra contributii majore la chimia derivatilor 7-nitrobenzofurazanului au fost aduse de M. Bem [359, 360] in timp ce lucrarile lui O. Maior [361] si A. C. Radutiu [362] reprezinta contributii importante la chimia derivatilor α-acetilfenoxatiinei.
Dupa cum este bine cunoscut derivatii de furoxan (1,2,5-oxadiazol-2-oxid), benzofuroxan (benzo[1,2-c]1,2,5-oxadiazol-1-oxid), furazan (2,1,3-oxadiazole) si benzofurazan (2,1,3-benzoxadiazole) au fost intens studiati in decursul anilor datorita activitatii lor antibacteriale (gram-negative si gram positive) [363, 364], antiprotozoa (T. vaginalis, Entamoeba histolytica) [363, 364], antifungicide [363, 364] precum si datorita capacitatii acestor derivati de inhibare in vitro a dezvoltarii Trypanosoma cruzi [365] sau rolului de agenti etiologici pentru Trypanosomiasis Americana (Chagas’ Disease) [365]. Un alt aspect derivatilor de nitrobenzofurazan si nitrobenzofuroxan il constitue utilizarea acestora ca inhibitori ai sintezei acidului nucleic in leucocite [366], avand activitate antileucemica si imunosupresiva [367] si in fine ca probe reactive pentru caracterizarea centrilor activi ai papainei (EC 3.4.22.2) [368], ficinei (EC 3.4.22.3) [368] si bromelainei (EC 3.4.22.4) [368]. Un alt domeniu in care derivatii de benzofurazan si benzofuroxan au fost utilizati cu succes este cel al chimiei analitice ca reactivi fluorogenici pentru amino acizi, amine primare si secundare sau polipeptide [359, 360, 369, 370].
Derivatii de fenoxatiina reprezinta o alta clasa de compusi cu activitate biologica [371, 372] si proprietati fluorescente cu aplicatii biomedicale [362, 373-375].
O caracteristica importanta pentru aplicatiile biologice si cele fizico-chimice ale compusilor este reprezentata de balanta hidrofob/hidrofila. Acest parametru se regaseste current in lucrarile de specialitate fie in baza calculelor (logP) [359, 362, 376], fie ca urmare a experimentarilor, dintre care cromatografia pe strat subtire cu faza inversa (RPTLC) ofera o modalitate eleganta de determinare a (RM0) [359, 362].
In literatura de specialitate au fost raportate rezultate privind caracterul hidrofob/hidrofil al unor derivati 4-ariloxi-7-nitrobenzofurazan [359] si 2-ariloxi-(α-acetil)fenoxatiina [362] obtinut prin determinari experimentale ale valorilor RM0 si prin calcul (logP).
Derivatii din cele doua clase de heterocicli au facut obiectul unui studiului QSPR pe care l-am realizat in scopul corelarii valorilor hidrofobicitatii moleculare RM0 cu descriptorii moleculari implementati in programul CODESSA. Am obtinut apoi o relatie cantitativa care sa coreleze valorile RM0 si valorile logP calculate prin metoda Hansch (metoda fragmentelor) [377].
In Figura 85 este prezentate structura fenolilor 1a-g de la care au provenit derivatii de fenoxatiina 2a-g respectiv compusii 3a-f continand restul nitrobenzofurazan (NBD) [359, 362].
Figura 85. Structura fenolilor 1a-g, derivatilor de fenoxatiina 2a-g si 4- ariloxi-7-nitrobenzofurazan 3a-f implicate in studiul QSPR
6.5.1. Studiu QSPR de modelare a hidrofobicitatii moleculare RM0 caracteristice celor doua clase de compusi cu ajutorul
Hidrofobicitatea evaluata din date experimentale [359, 362] depinde de valorile RM0 calculate [378, 379] cu ecuatiile 1 si 2.
RM = log(1/Rf – 1) (207)
RM = RM0 + bK (208)
unde RM0-hidrofobicitatea moleculara este valoarea RM extrapolata la concentratie zero de compus organic in the organic-water mixture; b-schimbarile in valoarea RM cauzate de cresterea concentratiei (K) de component organic in faza mobila.
In cele ce urmeaza este prezentata ecuatia QSPR cu cea mai mare putere de predictie a hidrofobicitatii celor doua clase de compusi [377]:
RM0 = -109.4(±13.67)MPCH + 0.064(±0.004)PPSA3 + 0.339(±0.051)MRECCB – 3.280
(209)
MPCH = Sarcina partiala minima pentru un atom de H [Zefirov's PC]
PPSA3 = Sarcina atomica ponderata PPSA [Quantum-Chemical PC]
MRECCB = Eenrgia minima de rezonanta pentru o legatura C-C.
Parametrii statistici ai fitarii sunt :
N = 20 R = 0.980 S = 0.198 F = 105.6 Q = 4.949 R2 = 0.960
R2 cross-validat = 0.932
In Tabelul 32 si Figura 85 sunt prezentate valorile experimentale si cele estimate (ecuatia 209) ale hidrofobicitatii moleculare RM0.
Tabelul 32. Valorile experimentale si cele estimate (ecuatia 209) ale hidrofobicitatii moleculare RM0 pentru fenolii 1a-g, derivatii de fenoxatiina 2a-g si derivatii de 4-ariloxi-7-nitrobenzofurazan 3a-f
Figura 85. Valorile experimentale si cele estimate (ecuatia 209) ale hidrofobicitatii moleculare RM0 pentru fenolii 1a-g, derivatii de fenoxatina 2a-g si derivatii de 4-ariloxi-7-nitrobenzofurazan 3a-f
6.5.2. Relatia intre valorile logP obtinute prin metoda Hansch si valorile experimentale ale hidrofobicitatii moleculare RM0 pentru fenolii 1a-g, derivatii de fenoxatiina 2a-g si derivatii de 4-ariloxi nitrobenzofurazan 3a-f
Metodele computationale pentru calculul logP au fost introduse cu success mai ales acolo unde au loc interactii intramoleculare complexe. Valorile logP se pot calcula fie ca sumare a constantelor de grup fie ca sumare a contributiilor fragmentelor f [380, 381]. In literatura de specialitate utilizarea parametrului RM0 in corelatii pentru determinarea lui logP este sumarizata in mai multe rapoarte reprezentative [359, 362, 382, 383]. O corelatie liniara exista de asemenea intre RM0 si logP calculat utilizand fie constantele de grup, , sau constantele de fragment, f [384].
Avandu-se in vedere cele expuse mai sus am propus [377] o relatie intre RM0 determinat experimental si logP calculat prin constantele de fragment, f, relatie prezentata in ecuatia 210.
RM0A = logP + (-1)3-n 10-(n+1) log(MR-ST) – K (210)
unde RM0 reprezinta hidrofobicitatea moleculara determinata experimental, logP reprezinta hidrofobicitatea calculata prin metoda Hansch (metoda fragmentelor), n este numarul de substituenti grefati pe nucleul fenolic, MR este refractia molara, ST este suprafata de tensiune – ar fi bine sa muti aici definitia – iar K reprezinta factorul de substituent.
Pentru factorul de substituent K s-a propus valoarea 0 cand pe nucleul fenolic sunt grefati un numar impar de substituenti si valoarea de -0.074 cand pe nucleul fenolic sunt grefati un numar par de substituenti [377]. Cele doua valori au fost obtinute prin analiza corelationala. Valorile refractie molare definite prin formula Lorenz-Lorenz (ecuatia 211) [385, 386] si cele ale suprafetei de tensiune definite prin ecuatia 212 au fost calculate utilizand programul ChemSketch 8.0 Freeware [387].
MR = (n2 – 1 / n2 + 1) (MW / d) (211)
unde n este indicele de refractie, MV = MW / d este volumul molar, MW este masa moleculara iar d este densitatea
= (G / A)P,T (212)
unde G este energia libera Gibbs si A reprezinta suprafata.
In Tabelul 33 sunt prezentate valorile parametrilor structurali, a valorilor RM0 experimentale si calculate cu ecuatia 210 precum si valorile logP calculate prin metoda Hansch (metoda fragmentelor) pentru fenolii 1a-g, derivatii de fenoxatiina 2a-g si derivatii de 4-ariloxi-7-nitrobenzofurazan 3a-f.
Tabelul 33. Valorile parametrilor structurali, a valorilor RM0 experimentale si calculate cu ecuatia 210 precum si valorile logP calculate prin metoda Hansch (metoda fragmentelor) pentru fenolii 1a-g, derivatii de fenoxatiina 2a-g si derivatii de 4-ariloxi-7-nitrobenzofurazan 3a-f
In Figura 86 se prezinta valorile experimentale ale hidrofobicitatii moleculara (RM0) vs. valorile RM0 calculate cu ecuatia 210 impreuna cu ecuatia de corelare liniara si coeficientul de corelare r.
Figura 86.Valorile experimentale si cele estimate (ecuatia 210) ale hidrofobicitatii moleculare RM0 pentru fenolii 1a-g, derivatii de fenoxatiina 2a-g si derivatii de 4-ariloxi-7-nitrobenzofurazan 3a-f
Prezenta in modelul cu puterea predictiva cea mai mare a descriptorului cuanto-chimic PPSA3 (Sarcina atomica ponderata PPSA [Quantum-Chemical PC]) sau implicarea in studiul QSPR pentru corelarea parametrilor RM0 si logP a refractiei moleculare ca o caracteristica care depinde de volumul molar al moleculei si a suprafetei de tensiune, demonstreaza faptul ca pe suprafata moleculelor sunt centri reactivi capabili sa interactioneze prin legaturi de hidrogen cu moleculele de solvent ce le inconjoara.
6.6. O NOUA METODA DE CALCUL A CONSTANTELOR ELECTRONICE HAMMETT DIN POZITIA ORTO A DERIVATILOR AROMATICI SI REALIZAREA UNUI STUDIU QSPR (STRUCTURA-pKa) IN CAZUL UNOR DERIVATI N-METOXILATI AI POLINITROANILINELOR
Polinitroanilinele si derivatii acestora reprezinta o clasa importanta de compusi deoarece ofera informatiivaloroase privind conjugarea in sistemele aromatice [388], legaturile de hidrogen [389] sau asocierea prin transfer de sarcina [389].
Sinteza si proprietatile derivatilor de N-metoxi-polinitroanilina prezentati in Figura 87 au fost raportate in literatura de specialitate impreuna cu valorile pKa determinate pentru respectivii derivati [390-393].
Derivatii de N-metoxi-polinitroanilina prezinta o serie de proprietati interesante cum ar fi: i) oxidarea la radicali liberi stabili de tipul N-aril-N-alcoxiaminil care sunt probabil intermediari la disproportionarea derivatilor de N-metoxi-dinitroanilina la derivati picril [390, 394-396]; ii) intensificarea proprietatilor acido-bazice in prezenta eterilor coroana [391, 397]; iii) reactia cu radicalul liber stabil 2,2-difenil-1-picrilhidrazil cu obtinerea unor noi compusi betainici, intens colorati cu proprietati cromogene si redox reversibile [391, 398].
Figura 87. Structura derivatilor de N-metoxi-polinitroanilina
6.6.1. Efecte electronice de tip Hammett
Hammett este primul care a deschis drumul in tentativa de a cuantifica efectele electronice in sistemele aromatice [399]. Acesta explica aciditatile acizilor benzoici exprimate ca pKa in functie de contributiile inductive si de rezonanta ale substituentilor grefati pe nucleul aromatic. Masura electronica a efectelor electronice se poate obtine din diferenta de pKa dintre acizii benzoici substituiti si acidul benzoic insusi.
log KX – log K0 = -(pKa)X + (pKa)0 = σXρ (213)
unde KX este constanta de echilibru pentru un acid benzoic substituit, K0 este constanta de echilibru pentru acidul benzoic nesubstituit (X0 = H), σX este o constanta de substituent iar ρ este o constanta de reactie care depinde de conditiile de reactie.
Aceasta ecuatie descrie efectele substituentilor din pozitiile meta si para asupra aciditatii acizilor benzoici. Acest rationament poate fi extins si la alti derivati benzoici [400].
In literatura de specialitate exista mai multe lucrari in care sunt raportate valorile constantelor Hammett pentru pozitiile meta si para dar nu si pentru cele din orto [401-403].
Pentru substituentii din pozitiile orto, unde efectele electronice interfera cu cele sterice, am propus o noua metoda [404] pentru calcului constantelor electronice numite constante quasi-Hammett, cu ajutorul ecuatiei 214:
σo = 0.65·σp (214)
in care σp reprezinta valoarea constantei Hammett pentru acelasi substituent din pozitia para [401-403].
Pentru compusii aromatici care au substituenti carboxi, ecuatia 214 devine:
σo = 0.65·σp + 0.50 (215)
Cei doi termeni: 0.65 si 0.50 au fost obtinuti prin tehnica regresiei liniare. In Tabelul 34 sunt prezentate valorile constantelor Hammett si quasi-Hammett (ecuatiile 214 si 215) pentru cei mai uzuali substituenti.
Tabelul 34. valorile constantelor Hammett si quasi-Hammett (ecuatiile 214 si 215) pentru cei mai uzuali substituenti
6.6.2. Studiul QSPR de modelare a pKa in cazul derivatilor N-metoxipolinitroanilinelor
Valorile experimentale pentru aciditatea a 13 derivati de N-metoxipolinitroanilina (Figura 87) [390-393] si valorile globale (Σσ) pentru constantele Hammett si quasi-Hammett au fost corelate cu ajutorul tehnicii regresiei liniare conducand la modelul QSPR prezentat cu ajutorul ecuatiei 216:
pKa = -5.59(±0.71) Σσ + 13.09(±0.71) (216)
N = 13 R = -0.92 SD = 0.87 F = 62 R2 cross-validat = 0.80
In Tabelul 35 sunt prezentate valorile aciditatilor experimentale si cele calculate cu ajutorul ecuatiei 216 pentru cei 13 derivati de N-metoxipolinitroanilina (Figura 87).
Tabelul 35. Valorile aciditatilor experimentale si cele calculate cu ajutorul ecuatiei 216 pentru cei 13 derivati de N-metoxipolinitroanilina (Figura 87)
In Figura 88 este reprezentata valoarea experimentala vs. valoarea calculata (ec. 216) pentru cei 13 derivati de N-metoxipolinitroanilina (Tabelul 35, Figura 87).
Figura 88. Valoarea experimentala vs. valoarea calculata (ec. 216) pentru cei 13 derivati de N-metoxipolinitroanilina (Tabelul 35, Figura 87)
Rationamentul descris in Subcapitolul 6.6.1. reprezinta o modalitate eficienta de calcul a constantelor electronice din pozitiile orto in cazul derivatilor de N-metoxi-polinitroanilina. Rationamentul poate fi extins pentru orice derivat aromatic.
6.7. MODELAREA TOXICITATII UNOR DERIVATI AROMATICI FATA DE TETRAHYMENA PYRIFORMIS CU AJUTORUL UNUI STUDIU QSAR IMPLICAND CONSTANTELE QUASI-HAMMETT SI DESCRIPTORI MOLECULARI
Caracteristica importanta a protozoarelor de a fi sensibile la alterarea mediului le recomanda drept indicatori biologici la poluarea apelor. Cele mai comune specii de protozoare din mediile acvatice sunt speciile Tetrahymena. Aceste specii de protozoare unicelulare, ciliate de pana la 50μm lungime sunt utilizate ca organisme-test pe langa Paramecium caudatum, Colpidium campylum, Spirostomum ambiguum si Spirostomumteres datorita simplicitatii acestora si costurilor reduse de crestere.
Pe de alta parte derivații aromatici sunt larg utilizati industrie și agricultura si sunt potential puternic poluanti ai apelor, in general ai mediului înconjurător.
In consecinta literatura de specialitate abunda in prezentarea unor studii QSAR in care proprietatea dependentă este toxicitatea asupra Tetrahymena pyriformis, iar moleculele setului de antrenare sunt derivati aromatici, in special fenoli și nitroderivati [405-416].
Pentru verificarea calitatii de predictor a unor descriptori s-a realizat un studiu QSAR ce cuprinde o baza de date de 200 compusi aromatici [417]. Geometria moleculelor din setul de antrenare a fost optimizata utilizand programul de mecanică moleculară PCMODEL [418]. PCMODEL creaza un fisier de intrare pentru programul de mecanica cuantica MOPAC [74]. După optimizarea mai riguroasă a geometriei – prin metoda PM3 [419] – utilizandu-se urmatoarele cuvinte cheie: ,,pm3 pulay gnorm=0.01 shift=50 geo-ok camp-king bonds vectors mmok nointer’’- MOPAC creaza un fisier output care va reprezenta fisierul de intrare pentru PRECLAV [294, 295].
Valorile calculate ale ordinelor de legatură au fost utilizate la determinarea aromaticitatii legaturilor chimice si la fragmentarea virtuala a moleculelor analizate. În cadrul algoritmului TPA (Topological Path Aromaticity) [420] o legatură chimică este “aromatica” daca ordinul de legatura B este 1.817 > B > 1.017. Doi atomi grei (adica diferiti de hidrogen), legati printr-o legatura chimică cu ordinul de legatura B, fac parte din acelasi fragment [421] dacă B > 1.017. Programul calculeaza diversi descriptori de fragmentare. Unul dintre acesti descriptori este o ecuație QSPR în care variabilele sunt procentele de masa ale fragmentelor virtuale.
Pe langa descriptorii moleculari obisnuiti calculati de PRECLAV au fost utilizati si doi descriptori suplimentari:
– logaritmul logKow al coeficientului de partiție în sistemul octanol-apă, calculat cu algoritmul KowWin [422] , descriptor considerat o măsură a caracterului lipofil al moleculei analizate.
– descriptorul topologic AAA calculat prin metoda propusă de Beteringhe [404] , descriptor considerat o măsură a efectelor electronice induse de substituentii grefati pe nucleul aromatic.
Valorile proprietatii dependente (–logIGC50-1) (toxicitatea compusilor aromatici) au fost determinate conform protocolului Schultz [406].
Formula finală calculata pentru toxicitatea T este multiliniara:
(logIGC50-1)calc = c0 + ck · pk (217)
Coeficientii ck sunt calculati prin Metoda Celor Mai Mici Patrate. Programul calculeaza succesiv ecuații cu k = 2, 3, … 10 predictori. Odata cu cresterea valorii lui k valoarea functiei de calitate (2) creste, atinge un maxim, apoi scade.
Q = KCV · (N – k) / N (218)
unde: N este numărul de molecule din setul de antrenare, k este numarul de predictori al ecuatiei (217), KCV este corelarea rangurilor Kendall de validare incrucisată dintre valorile calculate și observate ale toxicitatii T; programul foloseste pentru validarea incrucișată procedura LOO (leave one out) [423].
Dintre sutele de mii de ecuații QSAR calculate PRECLAV foloseste pentru predictie numai ecuatia de tip (217) cu cea mai mare valoare a funcției de calitate Q. Ecuatia folosita la predictie include, de regulă, mai putin de sapte predictori.
Identificarea moleculelor “outlier” s-a facut cu un criteriu uzual:
| (logIGC50-1)calc – (logIGC50-1)obs| > 2.5 · s (219) unde s este abaterea standard a valorilor calculate în jurul valorilor observate.
Influenta relativa a oricarui descriptor asupra toxicitatii T s-a calculat cu ajutorul ecuatiei 220:
I = (R2 – r2) / (1 – r2) (220)
unde: R2 este patratul corelatiei Pearson intre valorile Tobs si Tcalc calculate cu k descriptori QSAR; r2 este patratul corelatiei Pearson intre valorile Tobs si Tcalc calculate cu k-1 descriptori QSAR.
O valoare pentru I mai mare ca 400 face ca acei descriptori sa aiba o influenta relativa mare asupra toxicitatii.
6.7.1. Studiu QSAR pentru modelarea toxicitatii a unor derivati aromatici fata de Tetrahymena pyriformis
Setul de antrenare de la care s-a plecat in realizarea studiului QSAR cuprinde 200 derivati aromatici ce contin legaturi Y-H (Y = O, N). Acest set de antrenare este prezentat in Tabelul 36 si cuprinde compusi considerati a fi capabili de a forma legaturi de hidrogen (compusii 1-87) si compusi care nu sunt capabili de a forma legaturi de hidrogen (compusii 88-200).
Tabelul 36. Setul de antrenare utilizat in studiul QSAR, valorile toxicitatii, a descriptorului Beteringhe si coeficientului de partitie octanol-apa.
In cele ce urmeaza este prezentat modelul QSAR pentru compusii considerati a fi incapabili de a forma legaturi de hidrogen (compusii 88-200, Tabelul 36) , urmand ca pentru rezultate suplimentare sa fie consultata referinta [417]. Motivul alegerii acestei ecuatii in prezenta lucrare este prezenta descriptorului calculat dupa metoda Beteringhe [404].
log(ICG50-1) = -5.313ASR – 0.077CLX + 0.433AAA + 0.143VEL – 0.012TEB – 3.734 (221)
N = 113 R2 = 0.895 SD = 0.264 F = 184.1 R2 cross-validat = 0.882
ASR = Sarcina medie neta pentru atomii de carbon (p1).
CLX = Procentul de clor. Sarcina maxima pentru atomii de Cl (p2).
AAA = Descriptorul molecular Beteringhe (p3).
VEL = Spatiul ponderat HOMO-LUMO din volumul molecular (p4).
TEB = Numarul ponderat de benzi de energie totala (p5).
Fragmentul virtual care conduce la o crestere a toxicitatii este NO2.
In Tabelul 37 este prezentata influenta relativa a celor 5 descriptori asupra modelului QSAR prezentat in ecuatia 221.
Tabelul 37. Influenta relativa a celor 5 descriptori asupra modelului QSAR prezentat in ecuatia 221
Se poate concluziona din datele prezentate in Tabelele 36, 37 si cu ajutorul ecuatiei 221 ca toxicitatea compusilor aromatici incapabili de a forma legaturi de hidrogen este proportionala cu forma moleculei precum si cu constantele electronice Hammett sau quasi-Hammett [404]. De asemenea toxicitatea este direct proportionala cu ,,taria chimica’’[424] si este influentata favorabil de prezenta gruparii NO2 grefate pe nucleul aromatic.
In alta ordine de idei se poate afirma ca toxicitatea intregului set de antrenare este proportionala cu forma moleculei si este influentata de efectele electronice induse de substituentii grefati pe nucleul aromatic.
6.8. NOI METODE DE CARACTERIZARE PRIN STUDII QSAR A AFINITATII DE LEGARE A DIARILGUANIDINELOR DE RECEPTORUL NMDA (N-METIL-D-ASPARTAT) SI RECEPTORUL σ
Tehnicile QSAR/QSPR s-au dovedit utile si in cazul caracterizarii afinitatii de legare a unor compusi biologic activi de o serie de receptori. Dintre clasele de receptori cei mai studiati un rol aparte il ocupa clasa receptorilor glutamat postsinaptici care se divid in doua mari clase: i) metabotropici si ii) ionotropici.
Rolul fiziologic al receptorilor metabotropici este incomplet inteles si prin urmare a fost mai putin studiat. Receptorii ionotropici sunt liganzi care mediaza schimburile rapide in permeabilitatea membranei postsinaptice la sodiu sau calciu. Dupa cum este binecunoscut acestia se subdivid [425] in N-metil-D-aspartat (NMDA) [426-429] si acidul -amino-3-hidroxi-5-metil-4-isoxazol-propionic (AMPA) [430, 431]. Efectele acidului kainic (KA) sunt mediate de AMPA astfel incat cele mai multe studii se refera la receptorul AMPA/KA [430, 431].
Receptorul NMDA este cel mai studiat din cauza disponibilitatii sale pentru o serie de antagonisti competitivi sau necompetitivi [426-429]. Prin stimulare excesiva acesta este implicat pe termen lung intr-o degradare neuronala progresiva cum ar fi epilepsia [426], sindromul Alzheimer [432, 433] si Huntington [431-434], moartea celulelor nervoase in etape [426, 430], scleroza laterala amiotropica [435]. Cercetarile din ultimii ani au fost indreptate in directia obtinerii unor noi liganzi care interactioneaza cu receptorul NMDA [436-439] inhiband necompetitiv raspunsul acestuia. Din aceasta clasa de liganzi fac parte : N-(1-fenilciclohexil) piperidina (PCP) [440] , N-[1-(-tienil) ciclohexil] piperidina (TCP) [441] , (+) – 5 – metil – 10 , 11 – dihidro – 5H -dibenzo[a,b]ciclohepten-5,10-imina (MK-801) [441] si (+)-10,5-(iminometano)10,11-dihidro-5H-dibenzo[a,b]cicloheptena [428, 438]. Mai multi liganzi care interactioneaza cu receptorul NMDA de asemenea se leaga si de receptorii σ (N,N’-di-o-tolilguanidina, DTG) [428, 438]. Receptorii σ nu apar a fi asociati cu receptorul NMDa iar functiile fiziologice ale acestora sunt necunoscute [427].
Diarilguanidinele reprezinta o noua clasa de compusi care in experimente electrofiziologice s-au dovedit a fi antagonisti necompetititvi ai receptorului NMDA blocand raspunsul acestui receptor, unii dintre acesti compusi fiind agenti neuroprotectori cu valoare terapeutica pentru pacientii suferind de atacuri cerebrale, hipoglicemie [427, 442, 443].
Afinitatea de legare de receptorii NMDA si σ a unui set de antrenare cuprinzand 49 derivati de diarilguanidina impartiti in 4 clase (21compusi din clasa N, N’-difenilguanidinelor (1), 8 compusi din clasa N, N’-dinaftilguanidinelor (2) , 18 compusi din clasa N-naftil-N’-fenilguanidinelor (3) si 2 compusi din clasa guanidinelor amestecate (4)) a fost modelata utilizand tehnica QSAR [444]. Valorile afinitatii de legare a acestor derivati de diarilguanidina au fost corelate comparativ cu o varietate de descriptori moleculari inclusi in programele CODESSA si PRECLAV precum si cu noul indice topologic AAd derivat din invariantii locali ai grafurilor asociate diarilguanidinelor [444].
In Figura 89 sunt prezentate structurile celor patru clase de diarilguanidine implicate in studiul comparativ QSAR.
Figura 89. Structurile celor patru clase de diarilguanidine implicate in studiul comparativ QSAR
In Figura 90 este prezentata structura receptorului NMDA cu radioligand specific [3H]-(+)-5(S)-metil-10(R),11-dihidro-5H-dibenzo[a,b]ciclohepten-5,10-imina (MK-801, 5) si cea a receptorul σ-radioligand specific [3H]-di-o-tolilguanidina (DTG, 6).
Figura 90. Structura receptorului NMDA cu radioligand specific [3H]-(+)-5(S)-metil-10(R),11-dihidro-5H-dibenzo[a,b]ciclohepten-5,10-imina (MK-801, 5) si cea a receptorul σ-radioligand specific [3H]-di-o-tolilguanidina (DTG, 6)
Activitatile biologice pentru cele 49 de diarilguanidine au fost calculate cu ajutorul ecuatiei 222 pentru care valorile experimentale ale lui IC50 au fost determinate de catre Keana si colaboratorii [427, 428].
A = log(383000/ IC50) (222)
In cele ce urmeaza sunt prezentate ecuatiile QSAR cu cea mai mare putere de predictie in cazul ambilor receptori, pentru rezultate suplimentare putand fi consultata referinta [444].
6.8.1. Studiu QSAR de modelare a afinitatii de legare de receptorii NMDA si σ a unor derivati de diarilguanidina implicand descriptorii moleculari implementati in programul CODESSA
Ecuatia cu cea mai mare putere de predictie implicand descriptorii moleculari implementati in programul CODESSA se obtine in cazul receptorului [3H]-6 (DTG) si este prezentata cu ajutorul ecuatiei 223 :
logA = 103.3(±15.55)HDCA-2 / SQRT + 2.935(±0.405)FNSA-2 / PNSA –5.732(±1.111)SIGMA-PIMax BO – 329.4(±43.51)FPSA-3 / PPSA – 0.093(±0.024)HDSA-2 +4.522(±0.831)TEI + 80.13(±27.30)NPCAMin + 5.125 (±1.450)CBOAvg – 0.127(±0.039)KSI + 2.437(±1.328)NVAAvg + 0.799 (223)
N=49 R2 = 0.836 SD = 0.423 F = 19.32 Q = 2.160 R2 cross-validat = 0.737
HDCA-2 / SQRT : HA dependent HDCA-2/SQRT(TMSA) [Zefirov's PC]
FNSA-2 / PNSA : FNSA-2 Fractionat PNSA (PNSA-2/TMSA) [Quantum-Chemical PC]
SIGMA-PIMax BO : Ordinul de legatura SIGMA-PI maxim
FPSA-3 / PPSA : FPSA-3 Fractionat PPSA (PPSA-3/TMSA) [Zefirov's PC]
HDSA-2 : HA dependent HDSA-2 [Quantum-Chemical PC]
TEI : Indicele electronic topografic (toate legaturile) [Zefirov's PC]
NPCAMin : Sarcina partiala minima pentru un atom de N [Zefirov's PC]
CBOAvg : Ordinul de legatura mediu pentru un atom de C
KSI : Indicele de forma Kier (ordinul 1)
NVAAvg : Valenta medie pentru un atom de N
In Tabelul 38 si Figura 91 este prezentata activitatea biologica observata si calculata (ecuatia 223) a diarilguanidinelor in cazul receptorului σ.
Tabelul 38. Activitatea biologica observata si calculata a diarilguanidinelor in cazul receptorului σ
Figura 91. Activitatea biologica experimentala versus cea calculata pentru diarilguanidine in cazul receptorului σ
6.8.2. Studiu QSAR de modelare a afinitatii de legare de receptorii NMDA si σ a unor derivati de diarilguanidina implicand descriptorii moleculari implementati in programul PRECLAV
Ecuatia cu cea mai mare putere de predictie implicand descriptorii moleculari implementati in programul PRECLAV se obtine in cazul receptorului [3H]-5 (MK-801) si este prezentata cu ajutorul ecuatiei 224 :
logA = 121.6 nhs – 34.74 F 63 + 16.27 lhd – 3.769 M 36 -1.319 zgg + 13.62 R 29 -13.72 A 109 + 32.30 A 60 – 1.377 P 26 + 2.138 P 97 + 2.674 (224)
N=49 R2 = 0.868 SD = 0.308 F = 25.56 Q = 3.026 R2 cross-validat = 0.802
nhs : Numarul de legaturi simple NH sau legaturi slabe / Numarul total de legaturi
F 63 : Forta electrostatica rezultanta pentru atomul proba 63
lhd : SpatiulE(lumo+1) – E(homo-1)
M 36 : Paralaxa medie a legaturilor chimice pentru atomul proba 36
zgg : Indicele topologic Zagreb / Numarul de atomi grei
R 29 : Suma fortelor de respingere pentru atomul proba 29
A 109 : Suma fortelor de atractie pentru atomul proba 109
A 60 : Suma fortelor de atractie pentru atomul proba 60.
P 26 : Paralaxa maxima a legaturilor chimice pentru atomul proba 26
P 97 : Paralaxa maxima a legaturilor chimice pentru atomul proba 97
In Tabelul 39 si Figura 92 este prezentata activitatea biologica observata si calculata (ecuatia 224) a diarilguanidinelor in cazul receptorului NMDA.
Tabelul 39. Activitatea biologica observata si calculata a diarilguanidinelor in cazul receptorului NMDA
Figura 92. Activitatea biologica experimentala versus cea calculata pentru diarilguanidine in cazul receptorului NMDA
6.8.3. Noul indice topologic AAd derivat din invariantii locali ai grafurilor diarilguanidinelor
Dupa cum s-a aratat in Partea generala a acestei lucrari, in cazul grafurilor moleculare, varfurile sunt reprezentate de atomi iar liniile sunt reprezentate de legaturile covalente. Oricarui din aceste grafuri moleculare ii corespunde un set de invariantii locali care sunt proprietati topologice ce pot fi conservate prin izomorfismul molecular.Un invariant general al grafului este acela care este acelasi pentru doua sau mai multe grafuri (molecule) si reprezinta gradul de similaritate molecular.
Pentru obtinerea setului de invarianti locali X corespunzator invariantilor locali ai varfurilor grafurilor chimice xi se considera sistemul de ecuatii liniare :
Q· X = R (225)
in care Q este o matrice derivata din matricea de adiacenta, R este un vector coloana iar X reprezinta vectorul coloana al setului de invarianti locali.
Ca matrice Q, s-a utilizat matricea distantelor (D)obtinuta cu ajutorul programului MOPAC [74], iar elementele aii de pe diagonala a caror valoare este 0 au fost inlocuite cu un parametru pi care este tocmai indicele topologic J (Balaban) [5, 23, 63, 242, 243]. Vectorul coloana R a fost obtinut prin inmultirea matricei de adiacenta (A) corespunzatoare fiecarui graf chimic cu un vector coloana Z ale carui elemente reprezinta numerele atomice zi corespunzatoare fiecarui atom din molecula cu exceptia hidrogenului. Sistemul de ecuatii (225) devine:
D· X = A · Z (226)
Utilizand setul de invarianti locali ai varfurilor xi din setul de invarianti locali X a fost propus noul indice topologic AAd in scopul unei mai bune caracterizari a interactiei diarilguanidinelor cu cele doua tipuri de receptori [444]:
AAd = (q / q+N)Σ log (xi)2 (227)
in care q reprezinta numarul de laturi din graful chimic, N este numarul de noduri si xi reprezinta setul de invarianti locali ai varfurilor.
Noul indice topologic AAd a fost utilizat pentru imbunatatirea calitatii predictive a ecuatiei QSAR caracteristica receptorului σ.
Ecuatia QSAR implicand si noul indice topologic AAd este prezentata cu ajutorul ecuatiei 228:
logA = 129.9(±13.67)HDCA-2 / SQRT + 2.332(±0.368)FNSA-2 / PNSA –0.023(±0.003)HDSA-1 – 262.5(±35.40)FPSA-3 / PPSA + 2.596(±0.574)TEI +0.130(±0.024)Min n-nRC-C + 3.613(±1.270)CBOAvg – 0.179(±0.084)AAd – 0.246(±0.081)NASEMax – 6.633(±2.389)FHDSA / HDSA + 31.56 (228)
N=49 R2 = 0.887 SD = 0.412 F = 24.40 Q = 2.286 R2 cross-validat = 0.795
HDCA-2 / SQRT : HA dependent HDCA-2/SQRT(TMSA) [Zefirov's PC]
FNSA-2 / PNSA : FNSA-2 Fractionat PNSA (PNSA-2/TMSA) [Quantum-Chemical PC]
HDSA-1 : HA dependent HDSA-1 [Quantum-Chemical PC]
FPSA-3 / PPSA : FPSA-3 Fractionat PPSA (PPSA-3/TMSA) [Zefirov's PC]
TEI : Indicele electronic topografic(toate legaturile) [Zefirov's PC]
Min n-nRC-C : Repulsia n-n minima pentru o legatura C-C
CBOAvg : Ordinul de legatura mediu pentru un atom de C
AAd : Indicele topologic derivat din invariantii locali ai grafurilor
NASEMax : Starea energetica atomica maxima pentru un atom de N
FHDSA / HDSA : FHDSA Fractionat HDSA (HDSA/TMSA) [Quantum-Chemical PC]
In Tabelul 40 si Figura 93 este sunt prezentate valorile indicelui AAd, activitatea biologica observata si calculata a diarilguanidinelor (ecuatia 228) in cazul receptorului σ.
Tabelul 40. Valorile indicelui AAd, activitatea biologica observata si calculata a diarilguanidinelor (ecuatia 228) in cazul receptorului σ
Figura 93. Activitatea biologica experimentala versus cea calculata pentru diarilguanidine in cazul receptorului σ cand in ecuatia QSAR se foloseste AAd
Se poate concluziona ca prin utilizarea programului PRECLAV se observa o usoara crestere a valorii lui r cand se utilizeaza ( r = 0.932 in cazul receptorului NMDA si 0.938 in cazul receptorului σ) in timp ce cu programul CODESSA se obtine o valoare r = 0.880 in cazul receptorului NMDA si valoarea 0.914 in cazul receptorului σ. Faptul ca in ecuatiile QSAR finale obtinute cu programul PRECLAV sint mai multi descriptori grid decit globali arata ca interactiile electrostatice ale moleculelor cu o anumita forma sint mai importante decit alte caracteristici moleculare (masa moleculara, numar de atomi de un anumit tip, tipul de legaturi chimice etc.).
Utilizeaza noul indice topologic AAd derivat din invariantii locali ai grafurilor chimice ale diarilguanidinelor conduce la ideea ca o mai buna caracterizare structurala a diarilguanidinelor se poate obtine cu acesti invarianti locali ceea ce este explicabil deoarece asa cum reiese din ecuatia 226 se iau in considerare pentru calculul acestor invarianti atat matricea de distante D, cat si matricea de adiacenta A si un vector coloana Z ale carui elemente sunt numerele atomice ale fiecarui atom in parte zi. – de vorbit !!
Rezultatele din prezentul studiu QSAR confirma inca o data ca difenilguanidinele substituite simetric precum si N-naftil-N’-fenilguanidinele analoge manifesta o afinitate de la buna la moderata fata de receptorul NMDA dar au o afinitate comparabila si fata de receptorul σ iar N,N-dinaftil si N-naftil-N’-(3-fenil subtituit) guanidinele tri si tetrasubstituite manifesta o afinitate si selectivitate mare fata de receptorul NMDA in comparatie cu receptorul σ.
6.9. MATRICEA LEGATURII DE VALENTA O NOUA MATRICE SURSA PENTRU INVARIANTI LOCALI AI LEGATURILOR DIN CARE POT FI DEFINITI NOI INDICI TOPOLOGICI
Pentru un astfel de graf molecular a fost definita o noua matrice care reprezinta o modalitate de codificare a informatiei structurale. Aceasta noua matrice se numeste matricea legaturii de valenta (VBM )
Daca in definirea matricii de distante si de adiacenta se considera graful molecular fara hidrogen, in cazul matricii MLV atomii de hidrogen joaca un rol important in cadrul grafului respectiv.
Matricea MLV este o matrice nesimetrica in care termenii de pe diagonala se refera la legaturi in timp ce termenii care nu se afla pe diagonala se refera la perechile de legaturi ce au un atom comun. Toate legaturile sunt orientate spre atomul cu cel mai mare grad de substitutie (Ccuat.>Ctert.>Csec.> Cprimar), definindu-se in acest sens un asa zis capat greu si un capat usor al fiecarei legaturi.
Termenii din triunghiul superior al matricii MLV se refera la legaturile conectate la capetele grele iar iar termenii din triunghiul inferior se refera la legaturile legate de capetele usoare.
In Figura 94 sunt prezentate matricile de adiacenta (94a), de distante (94b) si MLV (94c) in cazul 2-metil-butanului.
94a 94b
94c
Figura 94. Matricile de adiacenta (94a), de distante (94b) si MLV (94c) in cazul 2-metil-butanului
Reguli de constructie a matricii MLV :
1. Pe linia H se prezinta numarul de legaturi spre hidrogen atasati de fiecare legatura.
2. Pe coloana H se noteaza cu 1 legaturile care au la capatul usor numai atomi de hidrogen.
3. In triunghiul inferior se noteaza cu 1 conexiunea unui capat usor la o legatura C-C.
4. In triunghiul superior se noteaza cu 1 conexiunea unui capat greu la o legatura C-C. Pentru legaturile C-H capatul usor (H) nu are legaturi.
5. Termenii de pe diagonala reprezinta diferenta dintre suma valentelor capetelor fiecarei legaturi si numarul total al atomilor de hidrogen atasati de respectivele capete.
6.9.1. Noi invarianti locali ai legaturilor. Definitii si exemple
Un invariant al grafului reprezinta o proprietate topologica care este conservata prin izomorfism molecular. Un invariant inclusiv al grafului este unul care are aceasi valoare pentru doua sau mai multe grafuri (ex. molecule) si reprezinta gradul de similaritate moleculara [262, 263, 319, 446, 447].
Dupa cum este binecunoscut [262, 263, 319, 446, 447] o metoda de obtinere a setului de invarianti locali X este reprezentata de rezolvarea sistemului de ecuatii liniare 229:
Q · X = R (229)
in care Q este matricea legaturii de valenta (MLV), X este vectorul coloana al invariantilor locali ai legaturilor xi iar R reprezinta vectorul coloana ce cuprinde valorile ordinelor de legatura caracteristice pentru fiecare legatura. Ordinele de legatura apartinand vectorului coloana R au fost calculate cu ajutorul modulului implementat in programul CODESSA [286-291]. Strategia de calcul se bazeaza pe ordinele de legatura Mulliken pentru o pereche de specii atomice A si B care se pot defini cu ajutorul ecuatiei 230:
in care prima sumare se face peste toate orbitalele moleculare ocupate (ni reprezinta numarul de orbitale moleculare ocupate), celelalte doua sumari facandu-se peste orbitalele atomice μ si υ apartinand atomilor A si B (A≠B) din molecula. Coeficientii orbitalilor moleculari sunt reprezentati de ciμ respectiv cjυ.
In Tabelul 41 sunt prezentate ca exemplu valorile invariantilor locali ai legaturilor (xi) rezultate in urma rezolvarii sistemului din ecuatia 229 in cazul izomerilor heptanului.
Tabelul 41. Valorile invariantilor locali ai legaturilor (xi) rezultate in urma rezolvarii sistemului din ecuatia 229 in cazul izomerilor heptanului
6.9.2. Noi indici topologici derivati din invariantii locali ai legaturilor.
Degenerescenta operationala
Matricea MLV a fost utilizata pentru calcularea seturilor de invarianti locali X pentru izomerii constitutionali ai alcanilor C3-C10. Utilizandu-se invariantii locali ai legaturilor (xi) din aceste seturilor de invarianti locali X au fost construiti noi indici topologici definiti in ecuatiile ce urmeaza:
IT (231) = Σ xi (231)
IT (231) = Σ xi2 (232)
IT (231) = Σ xi1/2 (233)
In studiile QSPR de asemenea a fost implicat si indicele AAd definit cu ajutorul ecuatiei 227 [444]:
AAd = (q / q+N)Σ log (xi)2
Degenerescenta operationala este rareori intalnita si conduce la aceasi indici topologici (IT) pentru grafuri neizomorfe si care nu au o degenerescenta atribuita.
O astfel de degenerescenta operationala a fost gasita si in cazul indicilor topologici definiti cu ajutorul ecuatiei 231 in cazul 2,3-dimetilpentanului si 3,3-dimetilpentanului (izomeri ai heptanului) si in cazul 2,2,4-trimetilpentanului si 2,3,3-trimetilpentanului (izomeri ai octanului).
In Figura 95 sunt prezentate grafurile izomerilor pentru care s-a observat degenerescenta operationala: 2,3-dimetilpentan (95a) si 3,3-dimetilpentan (95b) precum si 2,2,4-trimetilpentan (95c) respectiv 2,3,3-trimetilpentan (95d).
95a 95b 95c 95d
Figura 95. Grafurile izomerilor pentru care s-a observat degenerescenta operationala: 2,3-dimetilpentan (95a) si 3,3-dimetilpentan (95b) precum si 2,2,4-trimetilpentan (95c) respectiv 2,3,3-trimetilpentan (95d)
In Tabelul 42 sunt prezentate valorile invariantilor locali ai legaturilor (xi) precum si cele ale indicilor topologici (IT) definiti cu ajutorul ecuatiei 231 pentru izomerii prezentati in Figura 95.
Tabelul 42. Valorile invariantilor locali ai legaturilor (xi) precum si cele ale indicilor topologici (IT) definiti cu ajutorul ecuatiei 231 pentru izomerii prezentati in Figura 95.
6.9.3. Corelarea noilor indicilor topologici cu punctele de fierbere ale alcanilor
C3-C10
Indicii topologici definiti cu ajutorul ecuatiilor 231-233 precum si indice AAd [444] derivati din invariantii locali ai legaturilor au fost corelati cu punctele de fierbere ale izomerilor constitutionali ai alcanilor C3-C10 obtinandu-se coeficienti de corelare mai mari de 0.85.
Indicele topologic IT (231) a fost utilizat intr-o corelare multiliniara cu indicele Q si indicele Balaban J pentru modelarea punctelor de fierbere ale alcanilor C4-C9 iar rezultatele vor fi prezentate in capitolul urmator.
6.9.10. DEFINIREA NOULUI INDICE TOPOLOGIC Q. APLICATII
Caile sau lanturile (drumurile) de diferite lungimi dintr-un graf chimic reprezinta baza pentru caracterizarea mediului atomic dintr-o molecula, pentru caracterizarea moleculelor in ansamblu sau pentru caracterizarea selor de molecule [448-451]. In aceste lanturi (drumuri) nu se repeta nici o muchie (legatura covalenta) iar un lant este o secventa continua de atomi si legaturi adiacente. Intr-un circuit se repeta un atom (varf al grafului). J. R. Platt sugereaza [179] ca numarul acestor drumuri poate fi utilizat ca un potential descriptor molecular.
Numarul de lanturi de lungime 1, p1, reprezinta numarul de legaturi C-C, numarul de drumuri de lungime 2, p2, reprezinta numarul de doua legaturi consecutive C-C. In acest fel se pot defini numarul total de drumuri dintr-un graf chimic, Σ(i)pi.
Pe baza notiunilor de mai sus a fost definit un nou indice topologic (Q):
Q = Σ(i) pi2 (234)
unde pi reprezinta numarul de drumuri de lungime 1, 2,…., i din graful chimic respectiv.
Indicele Q prezinta degenerare joasa si este un numar intreg.
6.9.10.1. Aplicatiile noului indice topologic Q
Valoarea predictiva a noului indice topologic Q a fost testata in modelarea punctelor de fierbere a izomerilor constitutionali C4-C9 precum si in cazul a 27 cicloalcani (Figura 96). Valorile punctelor de fierbere la presiune normala atat pentru izomerii constitutionali C7-C9 precum si pentru cei 27 de cicloalcani (Figura 96) au fost preluate din referintele [222, 451].
In Figura 96 sunt prezentate structurile celor 27 cicloalcani [451] implicati in studiile QSPR.
Figura 96. Structurile celor 27 cicloalcani [451] implicati in studiile QSPR
Ecuatia QSPR monoparametrica pentru modelarea punctelor de fierbere ale izomerilor constitutionali ai alcanilor C4-C9 este prezentata in cele ce urmeaza:
bp0C = 0.348(±0.082)Q + 39.80 (235)
N = 72 R = 0.866 SD = 18.21 F = 210.8 R2 cross-validat = 0.714
Pentru imbunatatirea calitatii predictive a ecuatiei 235 s-a construit un model biparametric implicand indicii Q si J :
bp0C = 0.473(±0.037)Q -30.31(±7.276)J + 111.2 (236)
N = 72 R = 0.901 SD = 16.40 F = 238.7 R2 cross-validat = 0.758
Valoarile punctelor de fierbere ale izomerilor constitutionali ai alcanilor C4-C9 au fost utilizate in corelari pentru constructia ecuatiei triparametrice in care intervine pe langa indicii Q si J si indicele derivat din matricea MLV, IT (231).
bp0C = 6.343(±5.037)IT(231) + 0.449(±0.041)Q – 28.11(±7.429)J + 98.95 (237)
N = 72 R = 0.921 SD = 10.8 F = 264.6 R2 cross-validat = 0.816
In Tabelul 43 sunt prezentate valorile punctelor de fierbere determinate experimental precum si valorile indicilor Q, J si IT(231) pentru izomerii constitutionali ai alcanilor C4-C9.
Tabelul 43. Valorile punctelor de fierbere la presiune normala determinate experimental precum si valorile indicilor Q, J si IT(231) pentru izomerii constitutionali ai alcanilor
C4-C9
In cazul structurilor ciclcie prezentate in Figura 96 ecuatia QSPR cu cea mai mare putere predictiva este prezentata in cele ce urmeaza:
bp0C = 0.034(±0.010)Q -59.79(±24.76)J + 164.6 (238)
N = 27 R = 0.652 SD = 24.36 F = 8.890 R2 cross-validat = 0.405
In Tabelul 44 sunt prezentate valorile punctelor de fierbere la presiune normala determinate experimental precum si valorile indicilor Q si J pentru cicloalcanii prezentati in Figura 96.
Tabelul 44. Valorile punctelor de fierbere la presiune normala determinate experimental precum si valorile indicilor Q si J pentru cicloalcanii prezentati in Figura 96
6.9.11. CONCLUZII GENERALE
Dupa o prezentare succinta in Partea generala a contributiilor teoriei grafurilor in domeniul chimiei si a celor mai importanti descriptori moleculari din cle trei generatii, in Partea originala aceasta lucrare a incercat sa prezinte contributiile proprii la descrierea si predictia proprietatilor moleculare ale compusilor chimici. Aceste contributii s-au materializat in:
– definirea unor noi indici topologici care apoi au fost implicat in studii QSAR /QSPR pentru modelarea proprietatilor moleculare ale compusilor chimici.
– constructia unei noi matrici numita matricea legaturii de valenta ca sursa de invarianti locali ai legaturilor din care pot fi apoi definiti noi indici topologici.
– o metoda eleganta de calcul a constantelor electronice din pozitiile orto in cazul derivatilor N-metoxipolinitroanilinai.
– studii QSAR / QSPR comparative in care pentru calculul descriptorilor moleculari implicati in aceste studii au fost utilizate cele mai importante programe: PRECLAV, CODESSA, DRAGON.
Din categoria descriptorilor moleculari nou definiti fac parte:
i) indicele geometric Jgeom utilizat pentru predictia valorilor Rf in cazul izomerilor Z+E metiloximati ai testosteronei si 17-metiltestosteronei.
ii) indicele AAd derivat din invariantii locali ai grafurilor diarilguanidinelor, indice utilizat pentru descrierea si predictia afinitatii de legare a acestor derivati de receptorul σ.
iii) un asa numit indice de hidrofobicitate RMOA cu ajutorul caruia se poate prezice hidrofobicitatea moleculara RM0 in cazul unor derivati ai 4-ariloxi-7-nitrobenzofurazanului si 2-ariloxi-(-acetil) fenoxatiinei utilizand valorile logP calculate cu ajutorul constantelor de fragment Hansch precum si 2 parametrii strict legati de structura moleculara (refractia moleculara RM si suprafata de tensiune ST).
iv) indicele quadratic suma Q cu ajutorul caruia pot fi modelate punctele de fierbere ale alcanilor C4-C9 precum si 27 ciclcoalcani.
Matricea legaturii de valenta nou definita in literatura de specialitate reprezinta o sursa importanta de obtinere a invariantilor locali ai legaturilor din care se pot construi indici topologici noi care s-au dovedit eficienti in modelarea punctelor de fierbere ale alcanilor C3-C10.
Metoda originala de calcul a constantelor electronice ale substituentilor din pozitiile orto ale derivatilor N-metoxi-polinitroanilinai a fost extinsa cu rezultate bune si la alte sisteme aromatice.
Studii QSAR / QSPR comparative in care pentru calculul descriptorilor moleculari implicati in aceste studii au fost utilizate cele mai importante programe: PRECLAV, CODESSA, DRAGON au avut drept scop identificarea performantelor respectivelor programe in modelarea diferitelor proprietati ale compusilor chimici (toxicitate, hidrofobicitate, puncte de fierbere, activitati biologice etc.).
Capitolul 7
BIBLIOGRAFIE
[1] J. M. Lehn, Dynamic combinatorial chemistry and virtual combinatorial libraries,
Chem. Eur. J., 1999, 5, 2455-2463.
[2] J. M. Lehn, Toward complex matter: Supramolecular chemistry and self-organization
Proc. Natl. Acad. Sci. USA, 2002, 99, 4763-4768.
[3] G. Lippens, J. M. Wieruszeski, R. Warrass, P. R. Pailley, G. Montagne, La RMN haute résolution à l'angle magique en chimie combinatoire, L'actuallité chimique , Sept. 2000, no. 9, 21-25.
[4] I. Huc, J. M. Lehn, Chimie combinatoire et chimie supramoleculaire, L'actuallité chimique, Sept. 2000, no. 9, 51-56.
[5] J. Devillers and A.T. Balaban (editors), Topological Indices and Related Descriptors
in QSAR and QSPR, Gordon and Breach, The Netherlands, 1999.
[6] L. B. Kier and L. H. Hall, Molecular Structure Description. The Electrotopological
State, Academic Press, New York, 1999.
[7] R. Todeschini and V. Consonni, Handbook of Molecular Descriptors, Wiley-VCH, New York, 2000.
[8] A.Cayley, An Elementary Treatise on Elliptic Functions, 2nd ed. London: G. Bell, 1895.
[9] D. Konig, Theorie der endlichen und unendlichen Graphen. Kombinatorische Topologie der Streckenkomplexe, Akademische Verlagsgesellschaft, Leipzig, 1936.
[10] I. Tomescu, Grafuri si programare liniara. Introducere elementara., Ed. Didactica si Pedagogica, Bucuresti, 1975.
[11] J. A. Bondy, U. S. R. Murty, Graph Theory with Applications, Elsevier Science Publishing Co., Inc., 52 Vanderbilt Avenue, New York, 1976.
[12] R. Diestel, Graph theory (Electronic Edition 2000), Springer-Verlag, New York, 2000.
[13] A.Cayley, On the Theory of Analytical Forms called Trees, Philos. Mag., 1857, 13,
172-176.
[14] D. Ciubotariu, S. Muresan, V. Gogonea, M. Medeleanu, D. Dragos, Metoda Hansch Clasica. Parametri structurali pentru QSAR. In : Relatii cantitative structura chimica-activitate biologica (QSAR). Metoda MTD (editori : A. Chiriac, D. Ciubotariu, Z. Simon ), Editura Mirton, Timisoara, 1996, p. 116-131.
[15] J. H. Van’t Hoff, Sur les formules de structure dans l´espace, Arch. Néerl., 1874, 9, 445-454.
[16] J. A. Le Bel, Sur les relations qui existent entre les formulas atomiques des corps organiques et le pouvoir rotatoire de leurs dissolutions, Bull. Soc. Chim. Fr., 1874, 22, 337-347.
[17] A. Werner, Beitrag zur Konstitution anorganischer Verbindungen, Z. Anorg. Chem., 1893, 3, 267 – 330.
[18] F. Harary, Graph Theory, Reading Mass, Addison-Wesley, 1969.
[19] A. T. Balaban, Chemical Applications of Graph Theory, Academic Press, London, 1976.
[20] D. H. Rouvray, A. T. Balaban, In : Application of Graph Theory (J. R. Wilson, L. W. Beineke editori), Academic Press, London, 1979.
[21] A. T. Balaban, Some Chemical Applications of Graph Theory, Match, 1975, 1, 33-60.
[22] A. T. Balaban, Application of Graph Theory In Chemistry, J. Chem. Inf. Comput. Sci., 1985, 25, 334-343.
[23] A. T. Balaban, A. Chiriac, I. Motoc, Z. Simon, Steric Fit in Quantitative Structure-Activity Relations, Lecture Notes in Chemistry, No. 15, Springer-Verlag, Berlin, 1980.
[24] H. R. Henze, C. M. Blair, The number of structurally isomeric alcohols of the methanol series, J. Am. Chem. Soc., 1931, 53, 3042-3046 si 3077-3085.
[25] G. Pŏlya, Kombinatorische Anzahlbestimmungen für Gruppen, Graphen, und chemische Verbindungen, Acta Math., 1937, 68, 145-254.
[26] R. W. Robinson, F. Harary, A. T. Balaban, The numbers of chiral and achiral alkanes and monosubstituted alkanes, Tetrahedron, 1976, 32, 355-361.
[27] A. T. Balaban, M. D. Banciu, Schemes and Transformations in the (CH)2k Series. Valence Isomers of [8]- and [10]- Annulene, J. Chem. Educ., 1984, 61, 766-770.
[28] A. T. Balaban, Chemical graphs. XVIII. Graphs of degres four or less, isomers of annulenes, and nomenclature of bridged polycyclic structures, Rev. Roum. Chim., 1973, 18, 635-653.
[29] A. T. Balaban, Chemical graphs. XXIII. General cubic graphs with one loop, and homovalenes or their derivatives, Rev. Roum. Chim., 1974, 19, 1611-1619.
[30] A. T. Balaban, Chemical graphs. XXII. Valence isomers of heteroannulenes or of substituted annulenes. Coisomeric cubic multigraphs, Rev. Roum. Chim., 1974, 19, 1323-1342.
[31] M. Avram, E. Sliam, C. D. Nenitzescu, Über Metallkomplexe von Abkömmlingen des Tricyclo[4.2.2.02.5]decadiens und –triens, Liebigs Ann. Chem., 1960, 636, 184-189.
[32] W. von E. Doering, J. W. Rosenthal, 9,10-Dihydronaphthalene. Formation from Bullvalene and Nenitzescu's Hydrocarbon, Thermal Reorganization, and Photorearrangement to Bullvalene, J. Am. Chem. Soc., 1966, 88, 2078-2079.
[33] J. Lederberg, G. L. Sutherland, B. G. Buchanan, E. A. Feigenbaum, A. V. Robertson, A. M. Duffield, C. Djerassi, Applications of artificial intelligence for chemical inference. I. Number of possible organic compounds. Acyclic structures containing carbon, hydrogen, oxygen, and nitrogen, J. Am. Chem. Soc., 1969, 91, 2973-2976.
[34] A. T. Balaban, F. Harary, Chemical graphs—V : Enumeration and proposed nomenclature of benzenoid cata-condensed polycyclic aromatic hydrocarbons, Tetrahedron, 1968, 24, 2505-2516.
[35] J. V. Knop, K. Szymanski, Z. Jericevic, N. Trinajstic, On the Total Number of Polyhexes, Match: Commun. Math. Chem., 1984, 16, 119-134.
[36] D. Bonchev, A. T. Balaban, Topological centric coding and nomenclature of polycyclic hydrocarbons. I. Condensed benzenoid systems (polyhexes, fusenes), J. Chem. Inf. Comput. Sci., 1981, 21, 223-229.
[37] A. T. Balaban, From Chemical Topology to 3D Geometry, J. Chem. Inf. Comput. Sci., 1997, 37, 645-650.
[38] A.T. Balaban, D. Farcasiu, R. Banica, Chemical graphs. II. Graphs of multiple 1,2-shifts in carbonium ions and related systems, Rev. Roum. Chim., 1966, 11, 1205-1227.
[39] K. E. DeBruin, K. Naumann, G. Zon, K. Mislow, Topological representation of the stereochemistry of displacement reactions at phosphorus in phosphonium salts and cognate systems, J. Am. Chem. Soc., 1969, 91, 7031-7040.
[40] J. D. Dunitz, V. Prelog, Ligand Reorganization in the Trigonal Bipyramid, Angew. Chem. Internat. Edit., 1968, 7, 725-726.
[41] J. I. Musher, Modes of rearrangement in phosphoranes, J. Am. Chem. Soc., 1972, 94, 5662-5665.
[42] R. Luckenbach, Dynamic Stereochemistry of Pentacoordinated Phosphorus and Related elements, G. Thieme, Stuttgart, 1973, p. 214.
[43] F. Ramirez, I. Ugi, Turnstile Rearrangement and Pseudorotation in the Permutational Isomerization of Pentavalent Phosphorus Compounds. In: Advances in Physical Organic Chemistry, Vol. 9, Herausg.: V. Gold, Academic Press, London 1971, pp. 25-126.
[44] J. Brocas, M. Gielen, R. Willem, The Permutational Approach to Dynamic Stereochemistry, McGrew-Hill, New York, 1983.
[45] J. B. Hendrickson, Systematic synthesis design. 6. Yield analysis and convergency, J. Am. Chem. Soc., 1977, 99, 5439-5450.
[46] A.T. Balaban, Chemical graphs. XXXVIII. Synthon graphs, Math. Chem. (MATCH), 1980, 8, 159-192.
[47] M. Bersohn, A. Esack, Computers and organic synthesis, Chem. Rev., 1976, 76, 269-282.
[48] L. B. Kier, L. H. Hall, Molecular Connectivity in Chemistry and Drug Research, Academic, New York, 1976.
[49] I. Lukovits, A Compact Form of the Adjacency Matrix, J. Chem. Inf. Comput. Sci., 2000, 40, 1147-1150.
[50] Q. N. Hu, Y. Z. Liang, K. T. Fang, The Matrix Expression, topological Index and Atomic Attribute of Molecular Topological Structure, J. Data Sci., 2003, 1, 361-389.
[51] J. V. Knop, W. R. Müller, K. Szymanski, N. Trinajstic, Enumeration of Planar Polyhex Hydrocarbons, Reports Mol. Theor., 1990, 1, 95-98.
[52] J. V. Knop, W. R. Müller, K. Szymanski, N. Nikolic, N. Trinajstic, Computer Generation of Certain Classes of Molecules, SKTH / Kemija u industriji, Zagreb, 1985.
[53] M. Randic, On Canonical Numbering of Atoms in a Molecule and Graph Isomorphism, J. Chem. Inf. Comput. Sci., 1977, 17, 171-180.
[54] A. Pyka, A New Optical Topological Index (Iopt) for Predicting the Separation of D and L Optical Isomers by TLC. Part III, J. Planar Chromatog., 1993, 6, 282-288.
[55] I. Gutman, W. Linert, I. Lukovits, A. A. Dobrynin, Trees with Extremal Hyper-Wiener Index: Mathematical Basis and Chemical Applications, J. Chem. Inf. Comput. Sci., 1997, 37, 349-354.
[56] I. Lukovits, Isomer Generation: Syntactic Rules for Detection of Isomorphism, J. Chem. Inf. Comput. Sci., 1999, 39, 563-568.
[57] J. R. Platt, Encyclopedia of Physics, S. Flugge (ed.), vol.37, Springer, Berlin, 1961, p. 173.
[58] D. Bonchev, N. Trinajstic, Information theory, distance matrix, and molecular branching, J. Chem. Phys., 1977, 67, 4517-4533.
[59] O. Ivanciuc, T. Ivanciuc, D. J. Klein, W. A. Seitz, A. T. Balaban, Quantitative Structure-Retention Relationships for Gas Chromatographic Retention Indices of Alkylbenzens with Molecular Graph Descriptors, SAR and QSAR Environ. Res., 2001, 11, 419-452.
[60] H. Schultz, Topological Organic Chemistry. 13. Transformation of Graph Adjacency
Matrixes To Distance Matrixes, J. Chem. Inf. Comput. Sci., 2000, 40, 1158-1159.
[61] S. C. Basak, S. Bertelsen, G. D. Grunwald, Application of Graph Theoretical Parameters in Quantifying Molecular Similarity and Structure-Activity Relationships, J. Chem. Inf. Comput. Sci., 1994, 34, 270-276.
[62] A. Mercader, E. A. Castro, A. A. Toropov, Maximum Topological Distances Based Indices as Molecular Descriptors for QSAR. 4. Modeling the Enthalpy of Formation of Hydrocarbons from Elements, Int. J. Mol. Sci., 2001, 2, 121-132.
[63] A. T. Balaban, Topological Indices based on topological distances in molecular graphs, Pure&Appl. Chem., 1983, 55, 199-206.
[64] O. Ivanciuc, Design of topological indices. Part 22. Structural descriptors computed from truncated molecular matrices, Rev. Roum. Chim., 2001, 46, 411-420.
[65] A. Pyka, Correlation of Topological Indexes with the Chromatographic Separation of Isomers: Part II, J. Planar Chromatog., 1992, 5, 435-440.
[66] A. Pyka, A New Stereoisomeric Topological Index (ISTI) for Predicting the Separation of Stereoisomers in TLC. Part VII., J. Planar Chromatog., 1994, 7, 389-394.
[67] O. Ivanciuc, Design of topological indices. Part 23. Structural descriptors derived from the distance-path matrix of vertex- and edge-weighted molecular graphs, Rev. Roum. Chim., 2001, 46, 543-552.
[68] D. Veijan, The Distance Matrix for a Simplex, Croat. Chem. Acta, 1995, 68, 39-52.
[69] Z. Mihalic, N. Trinajstic, A Graph Theoretical Approach to Structure Property Relationships, J. Chem. Educ., 1992, 69, 701-712.
[70] Z. Mihalic, S. Nikolic, N. Trinajstic, Comparative Study of Molecular Descriptors Derived from the Distance Matrix, J. Chem. Inf. Comput. Sci., 1992, 32, 28-37.
[71] F. S. Roberts, Discrete Mathematical Model, Prentice Hall, Englewood Cliffs, NJ, 1976, p. 58.
[72] W. R. Müller, K. Szymansky, J. V. Knop, N. Trinajstic, An Algorithm for Construction of the Molecular Distance Matrix, J. Comput. Chem., 1987, 8, 170-173.
[73] M. Barysz, G. Jashari, R. S. Lall, V. K. Srivastava, N. Trinajstic, On the distance matrix of molecules containing heteroatoms. In: Chemical Applications of Topology and Graph Theory, (editor P. King), Elsevier, Amsterdam, 1983, p. 222-227.
[74] J. J. P. Stewart, MOPAC Manual, 6th Edition, Frank J. Seiler Research Laboratory United States Air Force Academy, CO 80840, October 1990.
[75] R. Shchepin, D. Litvinov, WinMopac 7.21, Perm State University, 2000. (http://www.psu.ru/science/soft/winmopac/index_e.html)
[76] O. Maior, D. Gavriliu and S. Stoia, Syntheses of some phenoxathiin derivatives with antimicrobial activity, South. Braz. J. Chem., 1995, 3, 79-88.
[77] Hypercube, Inc., Hyperchem 7.03, 1115 NW 4th Street, Gainesville, Florida 32601, USA, 2002 (http://www.hyper.com/index.htm).
[78] J. J. Gosper, BabelWin, Brunel University, 1998 (http://www.ccl.net/cca/software/
MS -WIN95-NT/babel/index.shtml).
[79] O. Ivanciuc, T. S. Balaban, A. T. Balaban, Design of topological indices. Part 4. Reciprocal distance matrix, related local vertex invariants and topological indices, J. Math. Chem., 1993, 12, 309-318.
[80] D. Plavsic, S. Nikolic, N. Trinajstic, Z. Mihalic, On the Harary Index for the Characterization of Chemical Graphs, J. Math. Chem., 1993, 12, 235-250.
[81] O. Ivanciuc, T. Ivanciuc, A. T. Balaban, Design of Topological Indices. Part 10. Parameters Based on Electronegativity and Covalent Radius for the Computation of Molecular Graph Descriptors for Heteroatom-Containing Molecules, J. Chem. Inf. Comput. Sci., 1998, 38, 395-401.
[82] O. Ivanciuc, Design of Topological Indices. 1. Definition of a Vertex Topological Index in the Case of 4-Trees, Rev. Roum. Chim., 1989, 34, 1361-1368.
[83] T. S. Balaban, P. A. Filip, O. Ivanciuc, Computer Generation of Acyclic Graphs Based on Local Vertex Invariants and Topological Indices. Derived canonical Labeling and Coding of Trees and Alkanes, J. Math. Chem., 1992, 11, 79-105.
[84] F. Buckley, F. Harary, Distance in Graphs, Addison-Wesley, Reading, MA, 1990, p. 213-214.
[85] O. Ivanciuc, A. T. Balaban, Design of Topological Indices. Part 8. Path Matrices and Derived molecular Graph Invariants, Commun. Math. Chem. (MATCH), 1994, 30, 141-152.
[86] D. Amic, N. Trinajstic, On the Detour Matrix, Croat. Chem. Acta, 1995, 68, 53-62.
[87] N. Trinajstic, S. Nikolic, B. Lucic, D. Amic, Z. Mihalic, The Detour Matrix in Chemistry, J. Chem. Inf. Comut. Sci., 1997, 37, 631-638.
[88] M. V. Diudea, G, Katona, I. Lukovits, N. Trinajstic, Detour and Cluj-Detour Indices,
Croat. Chem. Acta, 1998, 71, 459-471.
[89] M. Randic, L. M. DeAlba, F. E. Harary, Graphs with the Same Detour Matrix, Croat. Chem. Acta, 1998, 71, 53-68.
[90] V. N. Faddeeva, Computational Methods of Linear Algebra, Dover, New York, 1959
[91] T. Zivkovic, On the Evaluation of the Characteristic Polynomial of a Chemical Graph, J. Comput. Chem., 1990, 11, 217-222.
[92] D. H. Rouvray, In : Chemical Applications of Graph Theory, (A. T. Balaban editor), Academic Press, London, 1976, p. 180-181.
[93] N. Trinajstic, Chemical Graph Theory, CRC Press, Boca Raton, FL, 1983, 2nd ed., 1992, p. 32-33.
[94] E. Estrada, Edge Adjacency Relationships and a Novel Topological Index Related to Molecular Volume, J. Chem. Inf. Comput. Sci., 1995, 35, 31-33.
[95] E. Estrada, A. Ramirez, Edge Adjacency Relationships and Molecular Topographic Descriptors. Definition and QSAR Applications, J. Chem. Inf. Comput. Sci., 1996, 36, 837-843.
[96] E. Estrada, Spectral Moments of the Edge Adjacency Matrix in molecular Graphs. 1. Definition and Applications to the Prediction of Physical Properties of Alkanes, J. Chem. Inf. Comput. Sci., 1996, 36, 844-849.
[97] E. Estrada, Spectral Moments of the Edge Adjacency Matrix in molecular Graphs. 2. Molecules Containing Heteroatoms and QSAR Applications, J. Chem. Inf. Comput. Sci., 1997, 37, 320-328.
[98] I. Lukovits, I. Gutman, Edge-Decomposition of the Wiener Number, Commun. Math. Chem. (MATCH), 1994, 31, 133-144.
[99] B. Mohar, MATH/CHEM/COMP 1988, (A.Graovac editor), Elsevier, Amsterdam, 1989, p. 1-8.
[100] D. M. Cvetkovic, M. Doob, I. Gutman, A. Torgasev, Recent Results in the Theory of Graph Spectra, North-Holland, Amsterdam, 1988, p.125.
[101] D. M. Cvetkovic, M. Doob, H. Sachs, Spectra of Graphs, Academic, New York, 1980, p. 252.
[102] O. Ivanciuc, Chemical Graph Polynomials. Part 3. The Laplacian Polynomial of Molecular Graphs, Rev. Roum. Chim., 1993, 38, 1499-1508.
[103] N. Trinajstic, D. Babic, S. Nikolic, D. Plavsic, D. Amic, Z. Mihalic, The Laplacian Matrix in chemistry, J. Chem. Inf. Comput. Sci., 1994, 34, 368-376.
[104] B. Mohar, D. Babic, N. Trinajstic, A Novel Definition of the Wiener Index for Trees, J. Chem. Inf. Comput. Sci., 1993, 33, 153-154.
[105] B. Mohar, In: Graph Theory, Combinatorics and Applications, (Y. Alavi, G. Chartrand O. R. Ollermann, A. J. Schwenk editori), Willey, New York, 1991, p. 871-898.
[106] L. H. Hall, Computational aspects of molecular connectivity and its role in structure-property modeling. In: Computational Chemical Graph Theory, (D. H. Rouvray editor), Nova Science Publishers, New York, 1990.
[107] M. Randic, Similarity Based on Extended Basis Descriptors, J. Chem. Inf. Comput. Chem., 1992, 32, 686-692.
[108] M. V. Diudea, Wiener and Hyper-Wiener Numbers in a Single Matrix, J. Chem. Inf. Comput. Chem., 1996, 36, 833-836.
[109] M. V. Diudea, Cluj Matrix Invariants, J. Chem. Inf. Comput. Chem., 1997, 37, 300-305.
[110] M. V. Diudea, Cluj Matrix CJu : source of various graph descriptors, Commun. Math. Comput. Chem. (MATCH), 1997, 35, 169-183.
[111] M. V. Diudea, I. Gutman, Wiener-Type Topological Indices, Croat. Chem. Acta, 1998, 71, 21-51.
[112] D. J. Klein, M. Randic, Resistance distance, J. Math. Chem., 1993, 12, 81-95.
[113] O. Ivanciuc, A. T. Balaban, Graph Theory in Chemistry. In : The Encyclopedia of Computational Chemistry (P. V. R. Schleyer, N. L. Allinger, T. Clark, J. Gasteiger, P. A. Kollman, H. F. Schaefer III, P. R. Schreiner editori), John Wiley & Sons, Chichester, 1998, p. 1169-1190.
[114] O. Ivanciuc, T. Ivanciuc, Matrices and Structural Descriptors Computed from Molecular Graph Distances. In : Topological Indices and Related Descriptors in QSAR and QSPR (J. Devillers, A. T. Balaban editori), Gordon and Breach Science Publishers, The Netherlands, 1999, p. 221-277.
[115] M. V. Diudea, O. Minailiuc, G. Katona, I. Gutman, Szeged matrices and related numbers, Commun. Math. Comput. Chem. (MATCH), 1997, 35, 129-143.
[116] M. Randic, Linear combination of path numbers as molecular descriptors, New J. Chem., 1997, 21, 945-951.
[117] O. Ivanciuc, QSAR Comparative Study of Wiener Descriptors for Weighted Molecular Graphs, J. Chem. Inf. Comput. Sci., 2000, 40, 1412-1422.
[118] O. Ivanciuc, T. Ivanciuc, A. T. Balaban, Quantitative structure-property relationship evaluation of structural descriptors derived from the distance and reverse Wiener matrixes, Internet Electron J. Mol. Des., 2002, 1, 467-487.
[119] M. V. Diudea, Walk Numbers eWM : Wiener Numbers of Higher Rank. J. Chem. Inf. Comput. Sci., 1996, 36, 535-540.
[120] O. Ivanciuc, M. V. Diudea, P. V. Khadikar, New Topological Matrices and Their Polynomials, Indian J. Chem., 1998, 37A, 574-585.
[121] M. Randic, Hosoya matrix – A source of new molecular descriptors, Croat. Chem. Acta, 1994, 67, 415-429.
[122] M. Randic, On characterization of pharmacophore, Acta Chim. Slov., 2000, 47, 143-151.
[123] V. G. Espeso, J. J. M. Vara, B. L. Lazaro, F. R. Parcerisas, D. Plavsic, On the Hosoya Hyperindex and the Molecular Indices Based on a New Decomposition of the Hosoya Z Matrix, Croat. Chem. Acta, 2000, 73, 1017-1026.
[124] I. Gutman, S. Klavzar, Chemical Graph Theory of Fibonacenes, Commun. Math. Comput. Chem.(MATCH), 2006, 55, 39-54.
[125] A. Kurosh, Higher Algebra, Mir, Moscow, 1975, cap.9, p.139, 199.
[126] A. Schwenck, New Directions in the Theory oh Graph, (F. Harary editor), Academic, New York, 1973, p.275.
[127] D. H. Rouvray, The Search for Useful Topological Indices in Chemistry, Am. Sci., 1973, 61, 729-736.
[128] A. T. Balaban, Chemical graphs. XXXIV. Five new topological indices for the branching of tree-like graphs, Theor.Chim. Acta (Berlin), 1979, 53, 355-360.
[129] A. T. Balaban, O. Ivanciuc, Historical Development of Topological Indices. In: Topological Indices and Related Descriptors in QSAR and QSPR, (J. Devillers, A. T. Balaban editori), Gordon and Breach Science Publishers, The Netherlands, 1999, p. 21-57.
[130] H. Wiener, Structural Determination of Paraffin Boiling Points, J. Am. Chem. Soc., 1947, 69, 17-20.
[131] A. Dobrynin, R. Entringer, I. Gutman, Wiener Index of Trees: Theory and Applications, Acta Appl. Math., 2001, 66, 211-249.
[132] M. Randic, Molecular Descriptors for Structure-Property Studies, Chem. Phys. Lett., 1993, 211, 487-483.
[133] D. J. Klein, I. Lukovsits, I. Gutman, On the Definition of the Hyper-Wiener Index for Cycle-Containing Structures, J. Chem. Inf. Comput. Sci., 1995, 35, 50-52.
[134] D. Bonchev, The Overall Wiener Index-A New Tool for Characterization of Molecular Topology, J. Chem. Inf. Comput. Sci., 2001, 41, 582-592.
[135] I. Gutman, Formula for the Wiener Number of Trees and Its Extension to Graphs Containing Cycles, Graph Theory Notes, NYAS, 1994, 27, 9-15.
[136] D. E. Needham, I. C. Wei, P. G. Seybold, Molecular Modeling of the Physical Properties of the Alkanes, J. Am. Chem. Soc., 1988, 110, 4186-4194.
[137] M. Garbalena, W. C. Herndon, Optimum Graph-Theoretical Models for Enthalpic Properties of Alkanes, J. Chem. Inf. Comput. Sci., 1992, 32, 37-42.
[138] X. Li, J. Lin, The Valence Overall Wiener Index for Unsaturated Hydrocarbons, J. Chem. Inf. Comput. Sci., 2002, 42, 1358-1362.
[139] L. Xu, C. Y. Hu, Application of Chemical Graph, Scientific Press, Beijing, 2000.
[140] F. Yang, Z. D. Wang, Y. P. Huang, X. R. Ding, Modification of Wiener Index and Its Application, J. Chem. Inf. Comput. Sci., 2003, 43, 753-756.
[141] J. G. Stark, H. G. Wallace, Chemistry data book, John Murray, 50 Albemarle Street, London, 1975.
[142] I. Lukovits, An All-Path Version of the Wiener Index, J. Chem. Inf. Comput. Sci., 1998, 38, 125-129.
[143] A. A. Dobrynin, On the Wiener index decomposition for catacondensed benzenoid graphs, Indian J. Chem., 2003, 42A, 1270-1271.
[144] A. A. Dobrynin, I. Gutman, The average Wiener index of hexagonal chains, Comp. Chem., 1999, 23, 571-576.
[145] A. A. Dobrynin, Wiener index decomposition based on vertex degrees of catacondensed benzenoid graphs, Commun. Math. Comput. Chem. (MATCH), 2003, 49, 37-46.
[146] I. Gutman, J. W. Kennedy, L. V. Quintas, Wiener numbers of random benzenoid chains, Chem. Phys. Lett., 1990, 173, 403-408.
[147] M. Randic, Novel Molecular Descriptor for Structure-Property Studies, Chem. Phys. Lett., 1993, 211, 478-483.
[148] D. Plavsic, N. Lers, K. S. Bionda, On the Relation between W’ / W Index, Hyper-Wiener Index, and Wiener Number, J. Chem. Inf. Comput. Sci., 2000, 40, 516-519.
[149] M. Randic, X. Guo, T. Oxley, H. J. Krishnapriyan, wiener Matrix: source of novel Graph Invariants, J. Chem. Inf. Comput. Sci., 1993, 33, 709-716.
[150] I. Lukovits, W. A. Linert, A Novel Definition of the Hyper-Wiener Index For Cycles, J. Chem. Inf. Comput. Sci., 1994, 34, 899-902.
[151] I. Gutman, J. H. Potgieter, Wiener index and intermolecular forces, J. Serb. Chem. Soc., 1997, 62, 185-192.
[152] A. Pyka, Topological Indices and RM Values of Isomeric Fenol Derivatives in Structure-Biological Activity Studies: Part VI, J. Planar Chromatog., 1995, 8, 52-62.
[153] A. Pyka, Topological Indexes and RM Values of Fenol and Isomeric Clorofenols in Structure-Biological Activity Studies. Part VIII, J. Planar Chromatog., 1995, 8, 219-226.
[154] A. Pyka, Topological Indices and RM Values of Benzoic Acid Derivatives: A Structure-Biological Activity Investigation, Part IV, J. Planar Chromatog., 1994, 7, 108-116.
[155] A. Pyka, The Application of Topological Indexes (It) for Prediction of the RM Values of Isomeric Alcohols.Part V, J. Planar Chromatog., 1994, 7, 41-48.
[156] A. Pyka, K. Bober, Selected structural descriptors and RM values for calculation and prediction of molar volume of homologous series of saturated fatty acids, Indian J. Chem., 2003, 42A, 1360-1367.
[157] S. C. Basak, B. D. Gute, G. D. Grunwald, Use of Topostructural, Topochemical, and Geometric Parameters in the Prediction of Vapor Pressure: A Hierarchical QSAR Approach, J. Chem. Inf. Comput. Sci., 1997, 37, 651-655.
[158] H. Hosoya, Chemical Meaning of Octane Number Analyzed by Topological Indices, Croat. Chem. Acta, 2002, 75, 433-445.
[159] A. R. Katritzky, U. Maran, V. S. Lobanov, M. Karelson, Structurally Diverse Quantitative Structure-Property Relationship Correlations of Technologically Relevant Physical Properties, J. Chem. Inf. Comput. Sci., 2000, 40, 1-18.
[160] S. C. Basak, B. G. Gute, G. D. Grunwald, A Comparative Study of Topological and Geometrical Parameters in Estimating Normal Boiling Point and Octanol/Water Partition Coefficient, J. Chem. Inf. Comput. Sci., 1996, 36, 1054-1060.
[161] S. C. Basak, D. R. Mills, A. T. Balaban, B. G. Gute, Prediction of Mutagenicity of Aromatic and Heteroaromatic Amines from Structure: A Hierarchical QSAR Approach, J. Chem. Inf. Comput. Sci., 2001, 41, 671-678.
[162] S. C. Basak, B. D. Gute, S. Ghatak, Prediction of Complement-Inhibitory Activity of Benzamidines Using Topological and Geometric Parameters, J. Chem. Inf. Comput. Sci., 1999, 39, 255-260.
[163] V. K. Agrawal, S. Bano, K. C. Mathur, P. V. Khadikar, Novel application of Wiener vis-à-vis Szeged indices: Antitubercular activities of quinolones, Proc. Indian Acad. Sci. (Chem. Sci.), 2000, 112, 137-146.
[164] A. R. Katritzky, E. S. Ignatchenko, R. A. Barcock, V. S. Lobanov, Prediction of Gas Chromatographic Retention Times and Response Factors Using a General Quantitative Structure-Property Relationship Treatment, Anal. Chem., 1994, 66, 1799-1807.
[165] N. Bosnjak, Z. Mihalic, N. Trinajstic, Application of topographic indices to chromatographic data: calculation of retention indices of alkanes J. Chromatogr., 1991, 540, 430-434.
[166] M. F. Soares, F. D. Monache, V. E. F. Heinzen, R. A. Yunes, Prediction of Gas Chromatographic Retention Indices of Coumarins, J. Braz. Chem. Soc., 1999, 10, 189-196.
[167] I. Gutman, I. G. Zenkevich, Wiener index and vibrational energy, Z. Naturforsch., 2002, 57a, 824-828.
[168] P. V. Khadicar, S. Karmarkar, S. Joshi, I. Gutman, Estimation of the protonation constants of salicylhydroxamic acids by means of the Wiener topological index, J. Serb. Chem. Soc., 1996, 61, 89-95.
[169] S. Mendiratta, A. K. Madan, Structure-Activity Study on Antiviral 5-Vinylpyrimidine Nucleoside Analogs Using Wiener's Topological Index, J. Chem. Inf. Comput. Sci., 1994, 34, 867-871.
[170] S. Nikolic, N. Raos, Estimation of Stablity Constants of Mixed Amino Acid Complexes with Copper(II) from Topological Indices, Croat. Chem. Acta, 2001, 74, 621-631.
[171] N. Raos, Suitability of the Topological Index W1/3 for Estimation of the
Stability Constants of Coordination Compounds Croat. Chem. Acta, 2002, 75, 117-120.
[172] A. T. Balaban, D. Mills, O. Ivanciuc, S. C. Basak, Reverse Wiener Indices, Croat. Chem. Acta, 2000, 73, 923-941.
[173] S. Markovic, I. Gutman, Z. Bancevic, Correlation between Wiener and quasi-Wiener indices in benzenoid hydrocarbons, J. Serb. Chem. Soc., 1995, 60, 633-636.
[174] I. Gutman, B. Mohar, The Quasi-Wiener and the Kirchhoff Indices Coincide, J. Chem. Inf. Comput. Sci., 1996, 36, 982-985.
[175] D. Bonchev, A. T. Balaban, X. Liu, D. J. Klein, Molecular cyclicity and centricity of polycyclic graphs. 1. Cyclicity based on resistance distances or reciprocal distances, Internat. J. Quantum Chem., 1994, 50, 1-20.
[176] A. B. Israel, T. N. E. Greville, Generalized Inverses-Theory and Applications, Wiley, New York, 1974.
[177] H. Hosoya, A newly proposed quantity characterizing the topological nature of structural isomers of saturated hydrocarbons, Bull. Chem. Soc. Japan, 1971, 44, 2323-2339.
[178] H. Hosoya, K. Kawasaki, K. Mizutani, Topological Index and Thermodynamic Properties, Bull. Chem. Soc. Japan, 1972, 45, 3415-3421.
[179] J. R. Platt, Influence of neighbor bonds on additive bond properties in paraffins, J. Chem. Phys., 1947, 15, 419-420; Prediction of isomeric differences in paraffin properties, J. Phys. Chem., 1952, 56, 328-336.
[180] M. Gordon, G. R. Scantlebury, Nonrandom polycondensation: Statistical theory of the substitution effect, Trans. Faraday Soc., 1964, 60, 604-621.
[181] S. Nikolic, N. Trinajstic, I. M. Tolic, Complexity of Molecules, J. Chem. Inf. Comput. Sci., 2000, 40, 920-926.
[182] S. Nikolic, I. M. Tolic, N. Trinajstic, I. Baucic, On the Zagreb Indices as Complexity Indices, Croat. Chem. Acta, 2000, 73, 909-921.
[183] A. Golbraikh, D. Bonchev, A. Tropsha, Novel Chirality Descriptors Derived from Molecular Topology, J. Chem. Inf. Comput. Sci., 2001, 41, 147-158.
[184] I. Gutman, N. Trinajstic, Graph theory and molecular orbitals. Total π-electron energy of alternant hydrocarbons, Chem. Phys. Lett., 1972, 17, 535-537.
[185] S. Nikolic, G. Kovacevic, A. Milicevic, N. Trinajstic, The Zagreb Indices 30 Years After, Croat. Chem. Acta, 2003, 76, 113-124.
[186] A. Milicevic, S. Nikolic, On Variable Zagreb Indices, Croat. Chem. Acta, 2004, 77, 97-101.
[187] I. Gutman, S. J. Cyvin, Introduction to the Theory Benzenoid Hydrocarbons, Springer-Verlag, Berlin(Germany), 1989.
[188] S. Nikolic, A. Milicevic, N. Trinajstic, A. Juric, On Use of the Variable Zagreb vM2 Index in QSPR: Boiling Points of Benzenoid Hydrocarbons, Molecules, 2004, 9, 1208-1221.
[189] S. Bajaj, S. S. Sambi, A. K. Madan, Prediction of Anti-Inflammatory Activity of N-Arylanthranilic Acids: Computational Approach Using Refined Zagreb Indices, Croat. Chem. Acta, 2005, 78, 164-174.
[190] A. T. Balaban, Chemical graphs. Part 35. Five new topological indices for the branching of tree-like graphs, Theor. Chim. Acta, 1979, 5, 239-261.
[191] F. Harary, Graph Theory, Reading Mass, Addison-Wesley, 1972, p.35.
[192] A. T. Balaban, Chemical graphs. I. Valence isomerism of cyclopolyenes Rev. Roum. Chim., 1966, 11, 1097-1116; Chemical graphs. VIII. Valence isomerism and general cubic graphs, Rev. Roum. Chim., 1970, 15, 463-485.
[193] A. T. Balaban, I. Motoc, Chemical Graphs. XXXVI. Correlations between octane numbers and topological indices of alkanes, Math. Chem. (MATCH), 1979, 5, 197-218.
[194] S. Nikolic, N. Trinajstic, Z. Mihalic, The Wiener index: developments and applications, Croat. Chem. Acta, 1995, 68, 105-129.
[195] M. V. Diudea, O. Ivanciuc, Molecular Topology, Complex, Cluj, 1995.
[196] A. T. Balaban, Local versus Global (i.e. Atomic versus Molecular) Numerical Modeling of Molecular Graphs, J. Chem. Inf. Comput. Sci., 1994, 34, 398-402.
[197] M. V. Diudea, O. Ivanciuc, S. Nikolic, N. Trinajstic, Matrices of reciprocal distance, polynomials and derived numbers, Commun. Math. Comput. Chem. (MATCH), 1997, 35, 41-64.
[198] B. Lucic, I. Lukovits, S. Nikolic, N. Trinajstic, Distance-Related Indexes in the Quantitative Structure-Property Relationship Modeling, J. Chem. Inf. Comput. Sci., 2001, 41, 527-535.
[199] (a) W. R. Muller, K. Szymanski, J. V. Knop, N. Trinajstic, Molecular Topological Index, J. Chem. Inf. Comput. Sci., 1990, 30, 160-163.
(b) Z. Mihalic, S. Nikolic, N. Trinajstic, Comparative Study of Molecular Descriptors Derived from the Distance Matrix, J. Chem. Inf. Comput. Sci., 1992, 32, 28-37.
[200] I. Gutman, Selected Properties of the Schultz Molecular Topological Index, J. Chem. Inf. Comput. Sci., 1994, 34, 1087-1089.
[201] H. P. Schultz, E. B. Schultz, T. P. Schultz, Topological Organic Chemistry. 9. Graph Theory and Molecular Topological Indices of Stereoisomeric Organic Compounds, J. Chem. Inf. Comput. Sci., 1995, 35, 864-870.
[202] H. P. Schultz, E. B. Schultz, T. P. Schultz, Graph Theory, Matrix Permanents, and Topological Indices of Alkanes, J. Chem. Inf. Comput. Sci., 1992, 32, 69-72.
[203] H. P. Schultz, E. B. Schultz, T. P. Schultz, Topological Organic Chemistry. 5. Graph Theory, Matrix Hafnians and Pfaffians, and topological Indices of Alkanes, J. Chem. Inf. Comput. Sci.,1992, 32, 364-368.
[204] A. J. Pettofrezzo, Matrices and Transformations ; Prentice-Hall ; Englewood Cliffs, NJ,1966, p.16
[205] Handbook of Chemistry and Physics, 71st ed.; (D. R. Lide Editor); CRC Press:Boca Raton, FL. 1991.
[206] H. P. Schultz, T. P. Schultz, Topological Organic Chemistry. 6. Graph Theory and Molecular Topological Indices of Cycloalkanes, J. Chem. Inf. Comput. Sci., 1993, 33, 240-244.
[207] I. Gutman, Selected Properties of the Schultz Molecular Topological Index, J. Chem. Inf. Comput. Sci., 1994, 34, 1087-1089.
[208] D. J. Klein, Z. Mihalic, D. Plavsic, N. Trinajstic, Molecular Topological Index: A Relation with the Wiener Index, J. Chem. Inf. Comput. Sci., 1992, 32, 304-305.
[209] L. Pogliani, On a Graph Theoretical Characterization of Cis/Trans Isomers, J. Chem. Inf. Comput. Sci., 1994, 34, 801-804.
[210] N. J. Turro, Geometric and topological thinking in organic chemistry, Angew. Chem., Int. Ed. Engl., 1986, 25, 882-901.
[211] E. Estrada, Three-Dimensional Molecular Descriptors Based on Electron Charge Density Weighted Graphs, J. Chem. Inf. Comput. Sci., 1995, 35, 708-713.
[212] J. Sadlej, Semiempirical Methods of Quantum Chemistry; Ellis Horwood Ltd.: West Sussex, 1985; p.152.
[213] M. J. S. Dewar, E. G. Zoebisch, E. F. Healy, J. J. P. Stewart, AM1: A New General Purpose Quantum Mechanical Molecular Model, J. Am. Chem. Soc., 1985, 107, 3902-3909.
[214] A. Pyka, Correlation of Topological Indexes with Chromatographic Separation of Isomers, J. Planar Chromatog., 1991, 4, 316-318.
[215] A. Pyka, Correlation of Topological Indexes with Chromatographic Separation of Isomers: Part II, J. Planar Chromatog., 1992, 5, 435-440.
[216] I. Lukovits, M. Razinger, On Calculation of the Detour Index, J. Chem. Inf. Comput. Sci., 1997, 37, 283-286.
[217] P. E. John, Uber die Berechnung des Wiener-Index für ausgewählte Δ-dimensionale Gitterstrukturen, Commun. Math. Chem.(MATCH), 1995, 32, 207-219.
[218] G. Rücker, C. Rücker, Symmetry-Aided Computation of the Detour Matrix and the Detour Index, J. Chem. Inf. Comput. Sci., 1998, 38, 710-714.
[219] I. Lukovits, The Detour Index, Croat. Chem. Acta, 1996, 69, 873-882.
[220] P. V. Khadikar, N. V. Deshpande, P. P. Kale, A. Dobrynin, I. Gutman, G. Dömötör, The Szeged Index and an Analogy with the Wiener Index, J. Chem. Inf. Comput. Sci., 1995, 35, 547-550.
[221] I. Gutman, S. Klavzar, An Algorithm for the Calculation of the Szeged Index of Benzenoid Hydrocarbons, J. Chem. Inf. Comput. Sci., 1995, 35, 1011-1014.
[222] G. Rücker, C. Rücker, On Topological Indices, Boiling Points, and Cycloalkanes, J. Chem. Inf. Comput. Sci., 1999, 39, 788-802.
[223] O. Ivanciuc, Design of topological indices. Part 17. The Szeged operator as a source of new structural descriptors, Rev. Roum. Chim., 2000, 45, 1105-1114.
[224] M. Randic, On characterization of molecular branching, J. Am. Chem. Soc., 1975, 97, 6609-6615.
[225] L. B. Kier, L. H. Hall, W. J. Murray, M. Randic, Molecular connectivity. Part 1. Relationship to nonspecific local anesthesia, J. Pharm. Sci., 1975, 64, 1971-1974.
[226] L. B. Kier, W. J. Murray, M. Randic, L. H. Hall, Molecular connectivity. Part 5. Connectivity series concept applied to density, J. Pharm. Sci., 1976, 65, 1226-1230.
[227] O. Chan, I. Gutman, T. K. Lam, R. Merris, Algebraic Connections between Topological indices, J. Chem. Inf. Comput. Sci., 1998, 38, 62-65.
[228] A. Bondi, Van der Waals Volumes and Radii, J. Phys. Chem., 1964, 68, 441-451.
[229] D. Ciubotariu, S. Holban, L. Cotarca, V. Pogonea, Proc. Pittsburgh Conf. Analit. Chem. Appl. Spectrosc., 5-9 March,1984, Abstr. Vol, p.289.
[230] L. Buydens, D. L. Massart, P. Geerlings, Prediction of Gas Chromatographic Retention Indexes with Topological, Physicochemical, and Quantum Chemical Parameters, Anal. Chem., 1983, 55, 738-744.
[231] M. Randic, Novel graph theoretical approach to heteroatoms in QSAR, Chemometrics Intel. Lab. Syst., 1991, 10, 213-227.
[232] M. Randic, S. C. Basak, On Use of the Variable Connectivity Index 1χf in QSAR: Toxicity of Aliphatic Ethers, J. Chem. Inf. Comput. Sci., 2001, 41, 614-618.
[233] M. Randic, M. Pompe, The Variable Connectivity Index 1χf versus the Traditional Molecular Descriptors: A Comparative study of 1χf Against Descriptors of CODESSA, J. Chem. Inf. Comput. Sci., 2001, 41, 631-638.
[234] M. Randic, D. Plavsic, N. Lers, Variable connectivity Index for Cycle-Containing Structures, J. Chem. Inf. Comput. Sci., 2001, 41, 657-662.
[235] Q. N. Hu, Y. Z. Liang, Y. L. Wang, C. J. Xu, Z. D. Zeng, K.T. Fang, X. L. Peng, Y. Hong, External Factor Variable connectivity Index, J. Chem. Inf. Comput. Sci., 2003, 43, 773-778.
[236] L. B. Kier, Shape indexes of orders one and three from molecular graphs, Quant. Struct.-Act. Relat., 1986, 5, 1-7.
[237] L. B. Kier, Inclusion of symmetry as shape attributes in kappa index analysis, Quant. Struct.-Act. Relat., 1987, 6, 8-12.
[238] L. B. Kier, Indexes of molecular shape from chemical graphs, Acta Pharm. Jugosl., 1986, 36, 171-188.
[239] L. B. Kier, Indexes of Molecular shape from Chemical Graphs, Medicinal Res. Rev., 1987, 70, 417-440.
[240] K. S. Pitzer, The volumetric and thermodynamic properties of fluids. I. Theoretical basis and virial coefficients, J. Am. Chem. Soc., 1955, 97, 3427-3433.
[241] M. Randic, Novel Shape Descriptors for Molecular Graphs, J. Chem. Inf. Comput. Sci., 2001, 41, 607-613.
[242] A. T. Balaban, I. Motoc, D. Bonchev, D. Mekenyan, Steric Effects In Drug Design, (M. Charton si I. Motoc editori), Springer, Berlin, 1983, p.21-55.
[243] A. T. Balaban, Highly discriminating distance-based topological index, Chem. Phys. Lett., 1988, 83, 399-404.
[244] A. T. Balaban, N. I. Pallas, T. S. Balaban, Asymptotic values of topological indices J and J’ (average distance sum connectivities) for infinite acyclic and cyclic graphs, Commun. Math. Chem. (MATCH), 1985, 17, 121-146.
[245] A. T. Balaban, L. V. Quintas, The smallest graphs, trees, and 4-trees with degenerate topological index J, Commun. Math. Chem. (MATCH), 1983, 14, 212-233.
[246] A. B. Roy, S. C. Basak , D. K. Harris, V. R. Magnuson, In: Mathematical Modelling in Science and Technology, (X. J. R. Avila, R. Bellman, V. L. Luke, A. K. Riegler), vol. 2, Univ. of Missouri, Rolla, 1980, p. 851.
[247] A. T. Balaban, Chemical graphs. Part 48. Topological index J for heteroatom-containing molecules taking into account periodicities of element properties, Commun. Math. Chem. (MATCH), 1986, 21, 115-122.
[248] A. T. Balaban, O. Ivanciuc, Fortran 77 computer program for calculating the topological index J for molecules containing heteroatoms, Stud. Phys. Theor. Chem., 1988, 63, 193-212.
[249] A. Thakur, M.Thakur, P. V. Khadikar, C. T. Supuran, P. Sudele, QSAR study on Benzen Sulphonamide Carbonic Anhydrase Inhibitors:Topological Approach Using Balaban Index, Bioorg. Med. Chem., 2004, 12, 789-793.
[250] J. J. Sutherland, D. F. Weaver, Development of Quantitative Structure-Activity Relationships and Classification Models for Anticonvulsant Activity of Hydantoin Analogues, J. Chem. Inf. Comput. Sci., 2003, 43, 1028-1036.
[251] D. Bonchev, C. F. Mountain, W. A. Seitz, A. T. Balaban, Modeling the Anticancer Action of Some Retionoid Compounds by Making Use of the OASIS Method, J. Med. Chem., 1993, 36, 1562-1569.
[252] Z. Simon, A. T. Balaban, D. Ciubotariu and T. S. Balaban, QSAR for Carcinogenesis by Polycyclic Aromatic Hydrocarbons and Derivatives in Terms of Delocalization Energy, Minimal Sterical Differences and Topological Indices, Rev. Roum. Chim., 1985, 30, 985-1000.
[253] S. C. Basak, D. Mills, M. M. Mumtaz, K. Balasubramanian, Use of topological indices in predicting aryl hydrocarbon receptor binding potency of dibenzofurans: A hierarchical QSAR approach, Ind. J. Chem., 2003, 42A, 1385-1391.
[254] R. D. Beger, J. G. Wilkes, Models of Polychlorinated Dibenzodioxins, Dibenzofurans, and Bifenils Binding Affinity to the Aryl Hydrocarbon Receptor Developed Using 13C NMR Data, J. Chem. Inf. Comput. Sci., 2001, 41, 1322-1329.
[255] A. T. Balaban, L. B. Kier, N. Joshi, Correlations between Chemical Structure and Normal Boiling Points of Acyclic Ethers, Peroxides, Acetals, and Their Sulfur Analogues, J. Chem. Inf. Comput. Sci., 1992, 32, 237-244.
[256] S. C. Basak, G. D. Grunwald, Molecular Similarity and Estimation of Molecular Properties, J. Chem. Inf. Comput. Sci., 1995, 35, 366-372.
[257] L. Brillouin, Science and Information Theory, Academic, New York, 1956.
[258] C. Shannon, W. Weaver, Mathematical Theory of Communication, University of Illinois, Urbana, 1949.
[259] N. Rashevsky, Life, Information Theory, and Topology, Bull. Math. Biophys., 1955, 17, 229-235.
[260] S.C. Basak, A. B. Roy, J. J. Ghosh, Study of the structure-function relationship of pharmacological and toxicological agents using information theory. In: Proc. 2nd Internat. Conf. on Mathematical Modelling (X. J. R. Avula, R. Bellman, Y. L. Luke, A. K. Riegler, editori), Univ. of Missouri, Rolla, 1979, p. 851-856.
[261] C. Raychaudhury, S. K. Ray, A. B. Roy, J. J. Ghosh, S. C. Basak, Discrimination of isomeric structures using information theoretic topological indices, J. Comput. Chem., 1984, 5, 581-588.
[262] S. C. Basak, A. T. Balaban, G. D. Grunwald, B. D. Gute, Topological Indices: Thei Nature and Mutual Relatedness, J. Chem. Inf. Comput. Sci., 2000, 40, 891-898.
[263] S. H. Bertz, Branching in graphs and molecules, Discrete Apll. Math., 1988, 19, 41-70.
[264] A. T. Balaban, T. S. Balaban, New vertex invariants and topological indices of chemical graphs based on information on distances, J. Math. Chem., 1991, 8, 383-397.
[265] D. Bonchev, O. Mekenyan, N. Trinajstic, Isomer discrimination by topological information approach, J. Comput. Chem., 1981, 2, 127-148.
[266] D. Bonchev, Information Theoretic Indices for Characterization of Chemical Structures, Research Studies Press, Chichester, 1983.
[267] P. A. Filip, T. S. Balaban, A. T. Balaban, A New Approach for Divising Local Graph Invariants: Derived Topological Indices with Low Degeneracy and Good Correlational Ability, J. Math. Chem., 1987, 1, 61-83.
[268] W. T. Yee, K. Sakamoto, Y. J. Ihaya, Information theory of molecular properties. I. A theoretical study of the information content of organic molecules, Rept. Univ. Electro-Comm., 1977, 27, 53-63 (Chem. Abstr. 1977, 87, 151563).
[269] L. H. Hall, L. B. Kier, Electrotopological state indices for atom type: A novel combination of electronic, topological, and valence state information, J. Chem. Inf. Comput. Sci., 1995, 35, 1039-1045.
[270] L. H. Hall, C. T. Story, Boiling point and critical temperature of a heterogeneous data set: QSAR with atom type electrotopological state indices using artificial neural networks, J. Chem. Inf. Comput. Sci., 1996, 36, 1004-1014.
[271] A. L. Horvath, Boiling points of halogenated organic compounds, Chemosphere, 2001, 44, 897-905.
[272] W. Fisanick, K. Cross, A. III Rusink, Similarity Searching on CAS Registry Substances. 1. Global Molecular Property and Generic Atom Triangle Geometric Seraching, J. Chem. Inf. Comput. Sci., 1992, 32, 664-674.
[273] W. Fisanick, K. Cross, A. II Rusinko, Characteristics of Computer-Generated 3D and Related Molecular Property Data for CAS Registry Substances, Tetrahedron Comouter Methodol., 1990, 3, 635-652.
[274] C. W. von der Lieth, K. S. Nothof, U. Prior, A Bond Flexibility Index Derived from Constitution of Molecules, J. Chem. Inf. Comput. Sci., 1996, 36, 711-716.
[275] M. Randic, Graph Theoretical Descriptors of Two-Dimensional Chirality with Possible Extension to Three-Dimensional Chirality, J. Chem. Inf. Comput. Sci., 2001, 41, 639-649.
[276] M. Randic, On characterization of molecular attributes, Acta Chim. Slovenica, 1998, 45, 239-252.
[277] M. Petitjean, Applications of the radius-diameter diagram to the classification of topological and geometrical shapes of chemical compounds, J. Chem. Inf. Comput. Sci., 1992, 32, 331-337.
[278] V. Sharma, R. Goswami, A. K. Madan, Eccentric Connectivity Index: A Novel Discriminating Topological Descriptor for Structure-Property and Structure-Activity Studies, J. Chem. Inf. Comput. Sci., 1997, 37, 273-282.
[279] J. R. Baghey, S. A. Thomas, F. G. Rudo, H. K. Spencer, B. M. Doorley, M. H. Oeshrev, T. P. Jetossi, M. J. Benvenga, T. Spaulding, New 1-(heterocyclylalkyl)-4-(propionanilido)-4-piperidinyl metil ester and metilene metil ether analgesics, J. Med. Chem., 1991, 34, 827-841.
[280] L. B. Kier, L. H. Hall, Molecular Connectivity VII. Specific Treatment of Heteroatoms, J. Pharm. Sci., 1976, 65, 1806-1811.
[281] S. Gupta, M. Singh, A. K. Madan, Superpendentic Index: A Novel Topological Descriptor for Predicting Biological Activity, J. Chem. Inf. Comput. Sci., 1999, 39, 272-277.
[282] P. V. Khadikar, S. Karmarkar, V. K. Agrawal, A Novel PI Index and Its Applications to QSPR/QSAR Studies, J. Chem. Inf. Comput. Sci., 2001, 41, 934-949.
[283] P. V. Khadikar, S. Karmarkar, R. G. Varma, On the estimation of PI Index of polyacenes, Acta Chim. Slov., 2002, 49, 755-771.
[284] Y. Y. Yao, L. Xu, Y. Q. Yang, X. S. Yuan, Study on Structure-Activity Relationships of Organic Compounds: Three New Topological Indices and Their Applications, J. Chem. Inf. Comput. Sci., 1993, 33, 590-594.
[285] B. Ren, A new topological index for QSPR of Alkanes, J. Chem. Inf. Comput. Sci., 1999, 39, 339-343.
[286] http://www.semichem.com
[287] A. R. Katritzky, S. Perumal, R. Petrukhin, E. Kleinpeter, CODESSA-Based theoretical QSPR Model for hydantoin HPLC-RT lipophilicities, J. Chem. Inf. Comp. Sci. 2001, 41, 569-574.
[288] A. R. Katritrzky, V. S. Lobanov, M. Karelson, CODESSA: A Reference Manual (Version 2.0), Gainesville, Florida, 1994.
[289] S. Sild, M. Karelson, A General QSPR Treatment for Dielectric Constants of Organic Compounds, J. Chem. Inf. Comput. Sci., 2002, 42, 360–367.
[290] A. R. Katritrzky, R. Petrukhin, S. Perumal, M. Karelson, I. Prakash, N. Desai, A QSPR Study of Sweetness Potency Using CODESSA Program, Croat. Chem. Acta, 2002, 75, 475–502.
[291] A. R. Katritrzky, R. Jain, A. Lomaka, R. Petrukhin, M. Karelson, A. E. Visser, R. D. Rogers, Correlation of the Melting Points of Potential Ionic Liquids (Imidazolium Bromides and Benzimidazolium Bromides) Using the CODESSA Program, J. Chem. Inf. Comput. Sci., 2002, 42, 225–231.
[292] http://www.mdl.com/solutions
[293] http://www.tripos.com/index.php?family=modules, SimplePage,,,&page=comp_inf
ormatics
[294] L. Tarko, O. Ivanciuc, QSAR Modeling of the Anticonvulsant Activity of Phylacetanilides with PRECLAV (Property Evaluation by Class Variables), Commun. Math. Chem. (MATCH), 2001, 44, 201-214.
[295] L. Tarko, I. Lupescu, D. C. Groposila, Sweetness power QSARs by PRECLAV software, Arkivoc, 2005, x, 254-271.
[296] K. Gilbert, J. J. Gajewski, Serena Software, Box 3076, Bloomington, IN, USA.
[297] M. Saunders, K. N. Houk, Y. D. Wu, W. C. Still, M. Lipton, G. Chang, W. Guida, Conformations of cycloheptadecane. A comparison of methods for conformational searching, J. Am. Chem. Soc., 1990, 112, 1419-1427.
[298] http://www.talete.mi.it/
[299] R. Todeschini and V. Consonni, Handbook of Molecular Descriptors, Wiley-VCH, New York, 2000.
[300] S. Görög, Quantitative Analysis of Steroids, Akademiai Kiado, Budapest, 1983.
[301] S. Görög, Advances in Steroids Analysis. In: Proceedings of the Symposium on the Analysis of Steroids, (S. Görög), Edger, Hungary, May 20-22, 1981.
[302] A.F. McKay, D.L. Garmaise, G.Y. Paris, S.Gelblum, Bacteriostats: III. Oxyamines and their derivatives, Can. J. Chem., 1960, 38, 343-358.
[303] H. Mikola and E. Hänninen, Introduction of aliphatic amino and hidroxi groups to keto steroids using O-substituted hidroxilamines, Bioconjugate Chem., 1992, 3, 182-186.
[304] M. Fales and T. Luukkainen, O-Metiloximes as Carbonyl Derivatives in Gas Chromatography, Mass Spectrometry, and Nuclear Magnetic Resonance, Anal. Chem. ,1965, 37, 955-957.
[305] A. Beteringhe, I. Baciu, M. T. Caproiu, T. Constantinescu, A. T. Balaban, O-Metiloximes of testosterone and of 17α-metiltestosterone: TLC and QSPR study of Rf values, J. Planar Chromatog., 2003, 16, 268-270.
[306] K. Blau and G.S. King, Handbook of Derivatives for Chromatography, Heyden and Son, London-Bellmar, N.J., 1977, p.242.
[307] S. Hara, K. Oka, Y. Ike, Quantitative Resolution of Syn and Anti Isomers of Steroidal , -Unsaturated Oximes and O-metiloximes, Chem. Ind., 1967, no. 20, 832-833.
[308] K. Oka, S. Hara, Nuclear magnetic resonance spectra of syn and anti isomers of steroidal 3-ketoximes, Chem. Ind., 1968, no. 27, 911-912.
[309] K. Nacek, Pharmaceutical Applications of Thin-Layer and Paper Chromatography, Elsevier, Amsterdam, 1977, p.283.
[310] H. J. Petrowitz, Zur Kieselgelschicht-Chromatographie der stereoisomeren Menthole, Angew. Chem., 1960, 72, 921.
[312] H. J. Petrowitz and G. Pastuska, Über die Kieselgeschicht-Chromatographie gesättigter aliphatischer Dicarbonsäuren, J. Chromatogr., 1962, 7, 128-130.
[313] M. Hranisavljević- Jakovljević, I. Pejković- Tadić, A. Stojiljković, Thin-layer chromatography of isomeric oximes, J. Chromatogr., 1963, 12, 70-73
[314] H. J. Petrowitz, Chemical constitution and chromatographic behavior : Influence of isomeric and stereoisomeric constitutions on the chromatographic migration, J. Chromatogr., 1971, 63, 9-14.
[315] J. R. Platt, Encyclopedia of Physics, S. Flugge (ed.), vol.37, Springer, Berlin, 1961, p.173.
[316] K. Ruedenberg, Free-Electron Network Model for Conjugated Systems. V. Theoretical Equivalence with the LCAO MO Model, J. Chem. Phys., 1954, 22, 1878-1895.
[317] P. De Voogt, U. A. T. Brinkman, Production, properties and usage of polychlorinated bifenils. In: Halogenated Bifenils, Terfenils, Naphthalenes, Dibenzodioxins and Related Products, (R. D. Kimbrough, A. Jensen editori), Elsevier, Amsterdam, 1989, p. 3-46.
[318] T. Webster, B. Commoner, Overview: The dioxin debate. In: Dioxins and Health, (A. Schecter editor), Plenum Press, New York, 1994, p. 1-50.
[319] A. Beteringhe, A. T. Balaban, QSAR for toxicities of polyclorodibenzofurans, polyclorodibenzo-1,4-dioxins, and polyclorodibenzobifenils, Arkivoc, 2004, i, 163-182.
[320] S. Safe, L. Safe, M. Mullin, Introductory chapter: Polychlorinated bifenils: Environmental occurrence and analysis. In: Environmental Toxin Series 1. Polychlorinated Bifenils (PCBs): Mammalian and Environmental Toxicology, (S. Safe, O. Hutzinger editori), Springer-Verlag, Berlin, 1990, p.1-49.
[321] P. Espandiari, T. P. Twaroski, M. Festag, E. Y. Lee, H. P. Glauert, L. W. Robertson, Effect of 4-clorobifenils as an initiator of rat liver carcinogenesis. In: PCBs – Recent Advances in the Environmental Toxicology and Health Effects ( L. W. Robertson, L. G. Hansen editori), University Press of Kentucky. Lexington, 2001, 399-401.
[322] V. Lang, Polychlorinated bifenils in the environment, J. Chromatog., 1992, 595, 1-43.
[323] L. W. Wood, P. O’Keefe, B. Bush, Similarity analysis of PAH and PCB bioaccumulation patterns in sediment-exposed Chironomus tentans larvae, Environ. Toxicol. Chem., 1997, 16, 283-305.
[324] S. Safe, O. Hutzinger, PCDDs and PCDFs: Sources and environmental impact. In: Environmental Toxin Series 3. Polychlorinated Dibenzo-p-dioxins and Furans, (PCDDs/PCDFs), Sources and Environmental Impact, epidemiology, Mechanisms of Actions, Health Risks, (S. Safe, O. Hutzinger editori), Springer-Verlag, Berlin, 1990, p.1-20.
[325] S. Mason, K. Farell, B. Keys, J. P. Pliszczynska, L. Safe, S. Safe, Polychlorinated dibenzo-p-dioxins: Quantitative in vitro and in vivo structure-activity relationships, Toxicology, 1986, 41, 21-31.
[326] C. L. Waller, J. D. McKinney, Comparative molecular field analysis of polyhalogenated dibenzo-p-dioxins, dibenzofurans, and bifenils, J. Med. Chem., 1992, 35, 3660-3666.
[327] H. Poinger, N. Pluss, C. Schlater, Subchronic toxicity of some chlorinated dibenzofurans in rats, Chemosphere, 1989, 18, 265-275.
[328] S. Bandiera, T. Sawyer, M. Romkes, B. Zmudzka, L. Safe, S. Mason, B. Keys, S. Safe, Polychlorinated dibenzofurans (PCDFs): Effects of structure on binding to the 2,3,7,8-TCDD cytosolic receptor protein, AHH induction and toxicity, Toxicology, 1984, 32, 131-144.
[329] S. D. Dimitrov, N. C. Dimitrova, J. D. Walker, G. D. Veith, O. Mekenyan, Pure Appl. Chem., 2002, 74, 1823-1830.
[330] S. Safe, Polychlorinated bifenils (PCBs): Mutagenicity and carcinogenicity, Mutation Res., 1989, 220, 31-47.
[331] R. Schoeny, Mutagenicity testing of chlorinated bifenils and chlorinated dibenzofurans, Mutation Res., 1982, 101, 45-56.
[332] W. W. Blaser, R. A. Bredeweg, L. A. Shadoff, R. H. Stehl, Determination of chlorinated dibenzo-p-dioxins in pentaclorofenol by gas chromatography-mass spectrometry, Anal. Chem., 1976, 48, 984-986.
[333] L. A. Shadoff, R. A. Hummel, L. Lamparski, J. H. Davidson, A search for 2,3, 7, 8-tetraclorodibenzo-p-Dioxin (TCDD) in an environment exposed annually to 2,4,5-tricloro-phenoxyacetic acid ester (2,4,5-T) herbicides, Bull. Environ. Contam. Toxicol., 1977, 18, 478-485.
[334] G. Eadon, L. Kaminsky, J. Silkworth, K. Aldous, D. Hilker, P. O-Keefe, R. Smith, J. F. Gierthy, J. Hawley, N. Kim, A. DeCaprio, Calculation of 2,3,7,8-TCDD equivalent concentrations of complex environmental contaminant mixtures, Environ. Health Perspect., 1986, 70, 221-227.
[335] M. J. DeVito, L. S. Birnbaum, Dioxins: model chemicals for assessing receptor-mediated toxicity, Toxicology, 1995, 102, 115-123.
[336] D. G. Patterson, G. D. Jr. Todd, W. E. Turner, M. Maggio, L. R. Alexander, L. L. Needham, Levels of non-ortho-substituted (coplanar), mono- and di-ortho-substituted polychlorinated bifenils, dibenzo-p-dioxins, and dibenzofurans in human serum and adipose tissue, Environ. Health Perspect., 1994, 102(Suppl. 1), 195-204.
[337] C. S. Hong, B. Bush, J. Xio, Isolation and determination of mono-ortho and non-ortho substituted PCBs (coplanar PCBs) in human milk by HPLC porous graphitic carbon and GC/ECD, Chemosphere, 1992, 24, 465-473.
[338] J. L. Sericano, S. H. Safe, T. L. Wade, J. M. Brooks, Toxicological significance of non-, mono- and di-ortho substituted polychlorinated bifenils in oysters from Galveston and Tampa Bays, Environ. Toxicol. Chem., 1994, 13, 1797-1803.
[339] M. Caprioara, M. Diudea, QSAR modeling of polychlorinated. aromatic compounds, Indian J. Chem., 2003, 42A, 1368-1378.
[340] A. K. Stewart, C. A.R. Boyd, R. D. Vaughan-Jones, A novel role for carbonic anhydrase: cytoplasmic pH gradient dissipation in mouse small intestinal enterocytes, J. Physiol., 1999, 516, 209-217.
[341] M. Giordano, A. Norici, M. Forssen, M. Eriksson, J. A. Raven, An anaplerotic role for mitochondrial carbonic anhydrase in Chlamydomonas reinhardtii, Plant Physiology, 2003, 132, 2126-2134.
[342] N. Robertson, C. Potter, A. L. Harris, Role of carbonic anhydrase IX in human tumor cell growth, survival, and invasion, Cancer Res., 2004, 64, 6160-6165.
[343] C. J. Lynch, H. Fox, S. A. Hazen, B. A. Stanley, S. Dodgson, K. F. Lanoue, Role of hepatic carbonic andydrase in de novo lipogenesis, Biochem. J., 1995, 310, 197-202.
[344] B. W. Clare, C. T. Supuran, Carbonic anhydrase inhibitors. Part 41. Quantitative structure-activity correlations involving kinetic rate constants of 20 sulfonamide inhibitors from a non-congeneric series, Eur. J. Med. Chem., 1997, 32, 311-319.
[345] V. K. Agrawal, R. Srivastava, P. V. Khadikar, QSAR studies on some antimalarial sulfonamides, Bioorg. Med. Chem., 2001, 9, 3287-3293.
[346] A. Thakur, M. Thakur, P. V. Khadikar, C. Supuran, P. Sudele, QSAR study on benzensulphonamide carbonic anhydrase inhibitors: Topological approach using Balaban index, Bioorg. Med. Chem., 2004, 13, 789-793.
[347] M. C. Menziani, P. G. Debenedetti, F. Gago, W. G. Richards, The binding of benzensulphonamides to carbonic anhydrase enzyme. A molecular mechamics study and quantitative structure activity relationships, J. Med. Chem., 1989, 32, 951-956.
[348] C. T. Supuran, B. W. Clare, Carbonic anhydrase inhibitors. Part 47. Quantum chemical quantitative structure-activity relationships for a group of sulfanilamide base inhibitors of carbonic anhydrase, Eur. J. Med. Chem., 1998, 33, 489-500.
[349] A. Saxena, P. V. Khadikar, QSAR studies on sulfanilamide Schiff’s base inhibitors of carbonic anhydrase, Acta Pharm., 1999, 49, 171-179.
[350] C. Supuran, A. T. Balaban,M. D. Gheorghiu, A. Schiketanz, A. Dinculescu, I. Puscas, Carbonic anhydrase inhibitors. II. Membrane-impermeable derivatives of 1,3,4-thiadiazole-2-sulfonamide, Rev. Roum. Chim., 1990, 35, 399-405.
[351] M. A. Ilies, M. D. Banciu, M. Ilies, F. Chiraleu, F. Briganti, A. Scozzafava, C. T. Supuran, Carbonic anhydrase activators. Part 17. Synthesis and activation study of a series of 1-(1,2,4-triazole-(1H)-3-yl)-2,4,6-trisubstituted-pyridinium salts against isoenzymes I, II and IV, Eur. J. Med. Chem., 1997, 32, 911-918.
[352] A. Scozzafava, F. Briganti, M. A. Ilies, C. T. Supuran, Carbonic anhydrase inhibitors: Synthesis of membrane-impermenat low molecular weight sulfonamides possessing in vivo selectivity for the membrane-bound versus cytosolic isoenzymes, J. Med. Chem., 2000, 43, 292-300.
[353] M. Ilies, M. D. Banciu, M. A. Ilies, A. Scozzafava, M. T. Caproiu, C. T. Supuran, Carbonic anhydrase activators: Design of high affinity isoenzymes I, II, and IV activators, incorporating tri-/tetrasubstituted-pyridinium-azole Moieties, J. Med. Chem., 2002, 45, 504-510.
[354] V. K. Agrawal, S. Srivastava, P. V. Khadikar, C. T. supuran, Quantitative structure-activity relationship study on sulfanilamide Schiff’s bases: Carbonic anhydrase (CA) inhibitors, Bioorg. Med. Chem., 2003, 11, 5353-5362.
[355] A. T. Balaban, S. C. Basak, A. Beteringhe, D. Mills, C. T. Supuran, QSAR study using topological indices for inhibition of carbonic anhydrase II by sulfanilamides and Schiff bases, Molecular Diversity, 2004, 8, 401-412.
[356] S. C. Basak, D. K. Harris, V. R. Magnuson, POLLY, Version 2.3, Copyright of the University of Minnesota, 1988.
[357] Molconn-Z: v 3.50, Hall Associates Consulting Quincy, MA, 2000.
[358] D. Weininger, SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules, J. Chem. Inf. Comput. Sci., 1988, 28, 31-36.
[359] M. Bem, M. T. Caproiu, D. Stoicescu, T. Constantinescu, A. T. Balaban, Synthesis of 4-aryloxy-7-nitrobenzofurazan Derivatives from 4-cloro-7-nitrobenzofurazan and Various Phenoxide Anions (Including Pharmaceuticals) in the Presence of Crown Ethers, CEJC, 2003, 3, 260-276.
[360] M. Bem, M. Vasilescu, M. T. Caproiu, C. Draghici, A. Beteringhe, T. Constantinescu, M. D. Banciu, A. T. Balaban, Structural factors influencing the reaction rates of 4-aryloxy-7-nitrobenzofurazans with amino acids, CEJC, 2004, 2, 672-685.
[361] D. Gavriliu, T. Loloiu, A. Nicolae, G. Loloiu, O. Maior, Syntheses of New Carbonyl Derivatives from α-Halohetaryl Ketones, Chemistry of Heterocyclic Compounds, 2002, 38, 242-248.
[362] A. C. Radutiu, I. Baciu, M. T. Caproiu, C. Draghici, A. Nicolae, T. Constantinescu, A. T. Balaban, 2-(α-Aryloxyacetyl)-phenoxathiin derivatives. Synthesis and properties, Rev. Roum. Chim. 2006, in curs de publicare.
[363] R. Calvino, V. Mortarini, A. Gasco, A. Sanfilippo, M. L. Ricciardi, Antimicrobial properties of some furazan and furoxan derivatives, Eur. J. Med. Chem. – Chim. Ther. 1980, 15, 485-487.
[364] H. Cerecetto, W. Rorcal, Pharmacological properties of furoxans and benzofuroxans: Recent Developments, Mini-Rev. Med. Chem. 2005, 5, 57-71.
[365] H. Cerecetto, R. Di Maio, M. Gonzalez, M. Risso, P. Saenz, G. Seoane, A. Denicola, G. Peluffo, C. Quijano, C. Olea-Azar, 1,2,5-Oxadiazole N-oxide derivatives and related compounds as potential antitrypanosomal drugs: structure-activity relationships, J. Med. Chem. 1999, 42, 1941-1950.
[366] M. W. Whitehouse, P. B. Ghosh, 4-Nitrobenzofurazans and 4-Nitrobenzofuroxans : a new class of thiol-neutralising agents and potent inhibitors of nucleic acid synthesis in leucocytes, Biochem. Pharmacol. 1968, 17, 158-161.
[367] P. B. Ghosh, M. W. Whitehouse, Potential antileukemic and immunosuppressive drugs. Preparation and in vitro pharmacological activity of some 2, 1, 3-benzoxadiazole (benzofurazans) and their N-oxides (benzofuroxans), J. Med. Chem. 1968, 11, 305-311.
[368] M. Shipton, T. Stuchbury, K. Brocklehurst, 4-Cloro-7-nitrobenzo-2-oxa-1,3-diazoleas a reactivity probe for the investigation of the thiol proteinases. Evidence that ficin and bromelain may lack carboxyl groups conformationally equivalent to that of aspartic acid-158 of papain, Biochem. J. 1976, 159, 235-244.
[369] P. B. Ghosh, M. W. Whitehouse, 7-Cloro-4-nitrobenzo-2-oxa-1,3-diazole : a new fluorigenic reagent for amino acids and other amines, Biochem. J. 1968, 108, 155-156.
[370] T. Toyo’oka, Fluorescent chiral derivatization reagents possessing benzofurazan structure for the resolution of optical isomers in HPLC: their synthesis, characteristics and applications, Curr. Pharm. Anal. 2005, 1, 57-64.
[371] G. W. Rewcastle, G. J. Atwell, B. D. Palmer, W. A. Denny, Potential antitumor agents. 62. Structure-activity relationships for tricyclic compounds related to the colon tumor active drug 9-oxo-9H-xanthene-4-acetic acid, J. Med. Chem. 1991, 34, 491-496.
[372] O. Maior, D. Gavriliu, S. Stoia, Syntheses of some phenoxathiin derivatives with antimicrobial activity, South. Braz. J. Chem. 1995, 3, 79-88.
[373] A. Mehlhorn, B. Schweizer, K. Schewtlich, MO-calculations of the energy transfer activities of organic -structures in the photo-fries rearrangement-II: Selection of sensitizers and inhibitors of the photo-fries reaction based on theoretical absorption and fluorescence data, Tetrahedron, 1977, 33, 1489-1491.
[374] T. Constantinescu, A. Mischie, O. Maior, F. Badea, M. Vasilescu, M. T. Caproiu, R. Socoteanu, D. Nourescu, New fluorescent derivatives of phenoxathiin. Synthesis and properties, Rev. Roum. Chim. 2000, 45, 1009-1018.
[375] D. Nourescu, O. Maior, M. T. Caproiu, M. Vasilescu, G. I. Pencu, C. Luca, R. Socoteanu, A. Mischie, T. Constantinescu, Phase transfer catalysed O-alkylation of estrogen hormones. Fluorescent derivatives, Rev. Roum. Chim. 2000, 45, 887-894.
[376] A. Leo, C. Hansch and D. Elkins, Partition coefficients and their uses, Chem. Rev. 1971, 71, 525-616.
[377] A. Beteringhe, A. C. Radutiu, M. Bem, T. Constantinescu, A. T. Balaban, QSPR study for hydrophobicity of 4-aryloxy-7-nitrobenzofurazan and 2-aryloxy-(α-acetyl)-phenoxathiin derivatives, Internet Electon. J. Mol. Des., 2006, 5, 237-246.
[378] A. D. Kossoy, D. S. Risley, R. M. Kleyle and D. Nurok, Novel computational method for the determination of the partition coefficients by planar chromatography, Anal. Chem. 1992, 64, 1345-1349.
[379] T. Cserhati and E. Forgacs, Retention of some monoamine oxidase inhibitory drugs on a -cyclodextrin polymer-coated silica column, J. Chromatog. A. 1994, 660, 313-318.
[380] T. Fujita, J. Iwasa and C. Hansch, A new substituent constant, n, nerived from partition coefficients, J. Am. Chem. Soc. 1964, 86, 5175-5180.
[381] C. Hansch and A. Leo, Substituent Constants for Correlation Analysis in Chemistry and Biology, Wiley, New York, 1979.
[382] J. L. Biagi, M. C. Guerra, A. M. Barbaro, S. Barbieri, M. Recanatini, P. A. Borea and M. C. Pietrogrande, Study of the lipophilic character of xanthine and adenosine derivatives: I. RM and logP values, J. Chromatog. 1990, 498, 179-190.
[383] A. Tsantili-Kakoulidou and A. Antoniadou-Vyza, Hydrophobicity studies on diadamantanyl derivatives : Comparison between calculated partition coefficients and experimental lipophilicity indices determined by reversed-phase high-performance chromatography and thin-layer chromatography, J. Chromatog. 1988, 445, 317-326.
[384] M. C. Guerra, A. M. Barbaro, G. L. Biagi, M. C. Pietrogrande, P. A. Borea, A. Andreani and G. Cantelli-Forti, Rm Values, retention times and values of a series of potentially mutagenic nitroimidazo[2,1-b] thiazoles, J. Chromatog. 1985, 320, 281-291.
[385] A. K. Ghose and G. M. Crippen, Atomic physicochemical parameters for three-dimensional structure-directed quantitative structure-activity relationships I. Partition coefficients as a measure of hydrophobicity, J. Comput. Chem. 1986, 7, 565-577.
[386] J. A. Padron, R. Carrasco and R. F. Pellon, Molecular descriptor based on a molar refractivity partition using Randic-type graph-theoretical invariant, J. Pharm. Pharmaceut. Sci. 2002, 5, 258-265.
[387] http://www.acdlabs.com/download/chemsk.html
[388] G. W. Wheland, Resonance in Organic Chemistry, Wiley, New York, 1955.
[389] I. D. Rae, A proton magnetic resonance study of molecular overcrowding in N-alkyl-o-nitroanilinas, Austral. J. Chem., 1965, 18, 1807-1810.
[390] N. Zarna, G. Stanciuc, T. Constantinescu, F. Chiraleu, H. Caldararu, A. Caragheorgheopol, M. T. Caproiu, M. Ionescu, A. T. Balaban, Electronic structure and acido-basic properties of some N-alkoxy-polynitroanilinas, Roum. Chem. Quart. Rev., 1994, 2, 67-81.
[391] I. C. Covaci, T. Constantinescu, M. T. Caproiu, C. Draghici, P. Ionita, C. Luca, G. Stanciuc, M. Maganu, A. T. Balaban, 3,5-Dinitro-4-metoxiaminobenzoic acid and its derivatives, Rev. Roum. Chim., 1999, 44, 333-340.
[392] I. C. Covaci, T. Constantinescu, M. T. Caproiu, F. Dumitrascu, C. Luca, A. T. Balaban, New N-metoxi-dinitro-anilina derivatives: Synthesis, structure and pKa values, Rev. Roum. Chim., 1999, 44, 531-537.
[393] I. C. Covaci, T. Constantinescu, M. T. Caproiu, C. Luca, A. T. Balaban, solid supramolecular complexes of potassium salts of N-metoxinitroanilina derivatives and Metoxiamino-3,5-dinitropiridina with 18-crown-6-ether, Eur. J. Org. Chem., 2000, 3569-3573.
[394] E. Kolehmainen, K. Laihia, G. Stanciuc, A. T. Balaban, Strong para-substituted effects on rotational barriers in N-alkoxy-4-R-2,6-dinitrobenzenamines. Dynamic 1H-NMR study, Rev. Roum. Chim., 1999, 44, 475-478.
[395] G. Stanciuc, M. T. Caproiu, A. Caragheorgheopol, H. Caldararu, A. T. Balaban, R. I. Walter, Factors affecting stability and equilibria of free radicals. XII. N-Alkoxypicrylamines and ESR spectra of the corresponding capto-dative persistent aminyls, J. Magn. Res., 1987, 75, 63-72.
[396] G. Stanciuc, N. Zarna, N. Spataru, T. Constantinescu, A. Caragheorgheopol, H. Caldararu, A. T. Balaban, factors affecting stability and equilibria of free radicals. Part XXII. Bond dissociation energy of N-alkoxypolynitroanilinas, Rev. Roum. Chim., 1996, 41, 755-761.
[397] N. Zarna, G. stanciuc, T. Constantinescu, A. T. Balaban, K. Laihla, E. Kolehmainen, Hydrophobic supramolecular complexes of alkali cations with 18-crown-6 as ligand and N-metoxi-2,4,6-trinitroanilina as pair anion in a two-phase system, Rev. Roum. Chim., 1996, 41, 875-881.
[398] T. Constantinescu, M. T. Caproiu, N. Zarna, H. Caldararu, G. stanciuc, M. Radu, V. Badescu, A. T. Balaban, Reaction of 2,2-difenil-1-pycrilhydrazyl (DPPH) with N-alkoxy di- and trinitroanilinas, New J. Chem., 1997, 41, 575-579.
[399] L. P. Hammett, The effect of structure on the reaction of organic compounds. Benzen derivatives, J. Am. Chem. Soc., 1937, 59, 96-103.
[400] K. B. Wiberg, Substituent effects on the acidity of weak acids. 1. Bicyclo(2.2.2) octane-1-carboxylic acids and Bicyclo(1.1.1)pentane-1-carboxylic acids, J. Org. Chem., 2002, 67, 1613-1617.
[401] H. H. Jaffe, A reexamination of the Hammett equation, Chem. Rev., 1953, 53, 191-219.
[402] C. Hansch, A. Leo, Substituent Constantsn for Correlation Analysis in Chemistry and Biology, Wiley-Interscience, New York, 1979.
[403] C. Hansch, A. Leo, R. W. Taft, A survey of Hammett substituent constants and resonance and field parameters, Chem. Rev., 1991, 91, 165-195.
[404] A. Beteringhe, QSPR study on pKa values of N-Metoxi-polynitroanilina derivatives, CEJC, 2005, 3, 585-591.
[405] M. T. D. Cronin, B.W. Gregory, T.W. Schultz, Quantitative Structure-Activity Analyses of Nitrobenzen Toxicity to Tetrahymena pyriformis, Chem. Res. Toxicol., 1998, 11, 902-908.
[406] M. T. D. Cronin, N. Manga, J. R. Seward, G. D. Sinks, T. W. Schultz, Parametriza-tion of Electrophilicity for the Prediction of the Toxicity of Aromatic Compounds, Chem. Res. Toxicol., 2001, 14, 1498-1505.
[407] S. B. Mekapati, C. Hansch, On the Parametrization of the Toxicity of Organic Chemicals to Tetrahymena pyriformis. The Problem of Establishing a Uniform Activity, J. Chem. Inf. Comput. Sci., 2002, 42, 956-961.
[408] X. Wang, C. Sun, Y. Wang, L. Wang, Quantitative structure-activity relationships for the inhibition toxicity to root elongation of Cucumis sativus of selected fenols and interspecies correlation with Tetrahymena pyriformis, Chemosphere, 2002, 46, 153-161.
[409] S. Ren, T. W. Schultz, Identifying the mechanism of aquatic toxicity of selected compounds by hydrophobicity and electrophilicity descriptors, Toxicol. Lett., 2002, 129,151-160.
[410] K. L. E. Kaiser, S. P. Niculescu, T. W. Schultz, Probabilistic neural network modeling of the toxicity of chemicals to Tetrahymena pyriformis with molecular fragment descriptors, SAR and QSAR Environ. Res., 2002, 13, 57-67.
[411] K. Roy, G. Ghosh, Introduction of Extended Topochemical Atom (ETA) Indices in the Valence Electron Mobile (VEM) Environment as Tools for QSAR/QSPR Studies, IEJMD, 2003, 2, 599-620
[412] T. W. Schultz, T. I. Netzeva, M. T. D. Cronin, Selection of data sets for qsars: analyses of tetrahymena toxicity from aromatic compounds, SAR and QSAR Environ. Res., 2003, 14, 59-81.
[413] T. W. Schultz, M. T. D. Cronin, Essential and desirable characteristics of ecotoxicity quantitative structure-activity relationships, Environ. Toxicol. Chem., 2003, 22, 599-607.
[414] T. W. Schultz, J. Seward-Nagel, K. A. Foster, V. A. Tucker, Population growth impairment of aliphatic alcohols to Tetrahymena, Environ. Toxicol., 2004, 19, 1-10.
[415] S. R. Gaglardi, T. W. Schultz, Regression Comparisons of Aquatic Toxicity of Benzen Derivatives: Tetrahymena pyriformis and Rana japonica, Bull. Environ. Contam. Toxicol., 2005, 74, 256-262.
[416] T.W. Schultz, T. I. Netzeva, D.W. Roberts, M. T. D. Cronin, Structure-Toxicity Relationships for the Effects to Tetrahymena pyriformis of Aliphatic, Carbonyl-Containing, , -Unsaturated Chemicals, Chem. Res.Toxicol., 2005, 18, 330-341.
[417] L. Tarko, A. Beteringhe, QSAR studies related to toxicity of aromatic compounds on Tetrahymena pyriformis, QSAR&Comb. Sci., 2006, 25, in curs de publicare.
[418] PCModel v. 9.0, Serena Software, Box 3076, Bloomington, IN, USA.
[419] J. J. P. Stewart, Optimization of parameters for semiempirical methods. I. Method, J. Comput. Chem., 1989, 10, 209-220.
[420] L.Tarko, P. Filip, Aromaticity of topological path- a non-Hückel model of aromaticity, Rev. Roum. Chim. 2003, 48, 745 – 758.
[421] L. Tarko, Fragmentarea virtuala a moleculelor si evaluarea similaritatilor, Rev. Chim. (București), 2004, 55, 539 – 546.
[422] KowWin v. 1.67, included in EPI suite v. 3.12, developed by the U.S. Environmental Protection Agency.
[423] L. Eriksson, E. Johansson, M. Muller, S. Wold, On the selection of the training set in environmental QSAR analysis when compounds are clustered, J. Chemometrics, 2000, 14, 599-616.
[424] J. J. Gilman, Chemical and physical ”hardness", Mat. Res. Innovat. 1997, 1, 71-76.
[425] D. T. Monaghan, R. J. Bridges, C. W. Cotman, The Excitatory Amino Acid Receptors: Their Classes, Pharmacology, and Distinct Properties in the Function of the Central Nervous System, Annu. Rev. Pharmacol. Toxicol. 1989, 29, 365-402.
[426] K. W. Muir, K. R. Lees, Clinical Experience With Excitatory Amino Acid Antagonist Drugs, Stroke 1995, 26, 503-513.
[427] N. L. Reddy, L. Y. Hu, R. E. Cotter, J. B. Fischer, W. J. Wong, R. N. McBurney, E. Weber, D. L. Holmes, S. T. Wong, R. Presad, J. F. W. Keana, Synthesis and structure-activity studies of N,N'-diarylguanidine derivatives. N-(1-naphthyl)-N'-(3-etilfenil)-N'-metilguanidine: a new, selective noncompetitive NMDA receptor antagonist, J. Med. Chem. 1994, 37, 260-267.
[428] J. F. W. Keana, R. N. McBurney, M. W. Scherz, J. B. Fischer, P. N. Hamilton, S. M. Smith, A. C. Server, S. Finkbeiner, C. F. Stevens, C. Jahr, E. Weber, Synthesis and Characterization of a Series of Diarylguanidines that are Noncompetitive N-Metil-D-Aspartate Receptor Antagonists with Neuroprotective Properties, Proc. Natl. Acad. Sci. USA, 1989, 86, 5631-5635.
[429] N. A. Anis, S. C. Berry, N. R. Burton, D. Lodge, The dissociative anaesthetics, ketamine and phencyclidine, selectively reduce excitation of central mammalian neurones by N-metil-aspartate, Br. J. Pharmacol., 1983, 79, 565-575.
[430] J. Ohmori, S. Sakamoto, H. Kubota, M. S. Sasamata, M. Okada, S. Kawasaki, K. Hidaka, J. Togami, T. Furuya, K. Murase, 6 – (1H – Imidazol – 1 – yl) – 7 – nitro-2, 3(1H,4H) – quinoxalinedione hydrochloride (YM90K) and related compounds: structure-activity relationships for the AMPA-type non-NMDA receptor, J. Med. Chem., 1994, 37, 467-475.
[431] M. L. Barreca, R. Gitto, S. Quartarone, L. De Luca, G. De Sarro, A. Chimirri, Pharmacophore Modeling as an Efficient Tool in the Discovery of Novel Noncompetitive AMPA Receptor Antagonists, J. Chem. Inf. Comput. Sci., 2003, 43, 651-655.
[432] S. A. Lipton, P. A. Rosenberg, Mechanisms of Disease: Excitatory Amino Acids as a Final Common Pathway for Neurologic Disorders, N. Engl. J. Med., 1994, 330, 613-622.
[433] J. T. Greenmayer, The role of glutamate in neurotransmission and in neurologic disease, Arch. Neurol., 1986, 43, 1058-1063.
[434] W. F. Margos, J. T. Greenamyre, J. B. Jr. Penney, A. B. Young, Glutamate dysfunction in Alzheimer's disease: an hypothesis , Trends Neurosci., 1987, 10, 65-68.
[435] D. W. Choi, Glutamate neurotoxicity in cortical cell culture is calcium dependent, Neurosci. Lett., 1985, 58, 293-297.
[436] E. H. F. Wong, J. A. Kemp, T. Priestley, The Anticonvulsant MK-801 is a Potent N-metil-D-aspartate Antagonist, Proc. Natl. Acad. Sci. USA, 1986, 83, 7104-7108.
[437] E. Weber, M. Sonders, M. Quarum, S. McLean, S. Pou, J. F. W. Keana, 1,3-Di(2-[5-3H]tolyl)guanidine: A Selective Ligand that Labels -Type Receptors for Psychotomimetic Opiates and Antipsychotic Drugs, Proc. Natl. Acad. Sci. USA, 1986, 83, 8784-8788.
[438] J. P. Vincent, B. Kartalovski, P. Geneste, J. M. Kamenka, M. Lazdunski, Interaction of Phencyclidine („Angel Dust'') with a Specific Receptor in Rat Brain Membranes, Proc. Natl. Acad. Sci. USA, 1979, 76, 4678-4682.
[439] J. Benavides, J. P. Rivy, C. Carter, B. Scatton, Differential modulation of [3H]TCP binding to the NMDA receptor by L-glutamate and glycine, Eur. J. Pharmacol., 1988, 149, 67-72.
[440] W. Danysz, C. G. Parsons, Glycine and N-Metil-D-Aspartate Receptors: Physiological Significance and Possible Therapeutic Applications, Pharmacol. Rev., 1998, 50, 597-664.
[441] M. A. Sills, P. S. Loo, Tricyclic antidepressants and dextromethorphan bind with higher affinity to the phencyclidine receptor in the absence of magnesium and L-glutamate, Mol. Pharmacol., 1989, 36, 162-165.
[442] S. R. Zukin, R. S. Zukin, Specific [3H]phencyclidine Binding in Rat Central Nervous System, Proc. Natl. Acad. Sci. USA, 1979, 76, 5372-5376.
[443] S. R. Safir, S. Kushner, L. M. Brancone, Y. Subbarow, Experimental chemotherapy of trypanosomiasis. II. The preparation of compounds related to p-fenilenediguanidine, J. Org. Chem., 1948, 13, 924-932.
[444] A. Beteringhe, P. Filip, L. Tarko, QSAR study for diarylguanidines, noncompetitive NMDA receptor antagonists. A new topological index AAd derived from local invariants of the chemical graphs of diarylguanidines, Arkivoc, 2005, x, 45-62.
[445] A. Beteringhe, A. T. Balaban, P. Filip, The Valence Bond Matrix in Chemistry, J. Chem. Inf. Model., 2006, manuscris ce urmeaza a fi trimis la publicat.
[446] A. T. Balaban, QSAR and computational methods in drug discovery, In: Encyclopedia of Analytical Chemistry (R. A. Meyers, editor), Wiley, Chichester, 2000, vol. 8, p 7288.
[447] A. T. Balaban, A personal view about topological indices for QSAR/QSPR, In: QSAR/QSPR Studies by Molecular Descriptors (M. Diudea, editor), Huntington, New York, 2000, pp 1-25.
[448] M. Randic, On the Role of Mathematical Chemistry in QSAR, SAR QSAR Environ. Res., 2006, in curs de publicare.
[449] M. Randic, N. Trinajstic, On Isomeric Variation in Decanes, Commun. Math. Chem. (MATCH), 1982, 13, 271-290.
[450] M. Randic, Characterization of atoms, molecules and classes of molecules based on paths enumerations, Commun. Math. Chem. (MATCH), 1979, 7, 5-64.
[451] A. T. Balaban, D. Mills, V. Kodali, S. C. Basak, Complexity of chemical graphs in terms of size, branching, and cyclicity, QSAR, SAR QSAR Environ. Res., 2006, in curs de publicare.
Anexa 1
Timestamp: 2006-04-04-22-35-12-0080000000-win32
User Info: AndutzuB, andutzu,
*******************************************************************************
AM1 CALCULATION RESULTS
*******************************************************************************
* AMPAC Version 8.16.7
* Presented by:
*
* Semichem, Inc.
* PO Box 1649
* Shawnee KS 66222
* (913)268-3271
* (913)268-3445 (fax)
*
* Licensed to: Every User
* Contact Name: Demo
*
* Customer Serial Number: 900
* Issue Date: 3/ 2/2006
* Expiration Date: 4/15/2008
* AMSOL SM5x Option: Yes
* Expiring single-user license key
* TRUSTE – MINIMISE ENERGY USING TRUST REGION
* FORCE – FORCE CALCULATION SPECIFIED
* THERMO – THERMODYNAMIC QUANTITIES TO BE CALCULATED
* GEO-OK – OVERRIDE INTERATOMIC DISTANCE CHECK
* ESP – ELECTROSTATIC POTENTIAL CALCULATION
* VECTORS – SELECTED FINAL EIGENVECTORS TO BE PRINTED
* BONDS – FINAL BOND-ORDER MATRIX TO BE PRINTED
* SYBYL – OUTPUT FOR INTERFACE TO SYBYL
* PI – RESOLVE DENSITY MATRIX INTO SIGMA AND PI BONDS
* ENPART – ENERGY TO BE PARTITIONED INTO COMPONENTS
* GRADIENTS- ALL GRADIENTS TO BE PRINTED
* KPOLAR – CALCULATE HYPER-POLARIZATION TENSORS
* AM1 – THE AM1 HAMILTONIAN TO BE USED
*******************************************************************************
CODESSA AM1 PRECISE GRAD GEO-OK LICENSE SYBYL SIZES TRUSTE RHF VECTORS +
BONDS PI ENPART KPOLAR ESP FORCE THERMO
ATOM CHEMICAL BOND LENGTH BOND ANGLE TWIST ANGLE
NUMBER SYMBOL (ANGSTROMS) (DEGREES) (DEGREES)
(I) NA:I NB:NA:I NC:NB:NA:I NA NB NC
1 C
2 C 1.52096 * 1
3 H 1.10916 * 111.19069 * 1 2
4 H 1.10914 * 111.19774 * 120.01389 * 1 2 3
5 H 1.10918 * 111.18139 * -119.98650 * 1 2 3
6 H 1.10917 * 111.18880 * 179.99889 * 2 1 3
7 H 1.10920 * 111.17085 * -60.02582 * 2 1 3
8 H 1.10913 * 111.20079 * 59.97661 * 2 1 3
MOLECULAR POINT GROUP SYMMETRY CRITERIA
D3D 0.10000000
SINGLET STATE CALCULATION
** REFERENCES TO PARAMETERS **
H (AM1): M.J.S. DEWAR ET AL, J. AM. CHEM. SOC. 107 3902-3909 (1985).
C (AM1): M.J.S. DEWAR ET AL, J. AM. CHEM. SOC. 107 3902-3909 (1985).
––––––––-
* External Contributors *
––––––––-
Electrostatic Potential Charge Calculation:
––––––––––––––-
The ESP charge method was contributed by Brent B. Besler (Wayne State
University) and Kenneth D. Merz (Penn State University).
Finite Field Polarizability Module:
––––––––––––
The finite field polarizability calculation method
was contributed by Henry Kurtz at Memphis State University.
CARTESIAN COORDINATES
NO. ATOM X Y Z
1 6 0.0000 0.0000 0.0000
2 6 1.5210 0.0000 0.0000
3 1 -0.4009 1.0342 0.0000
4 1 -0.4011 -0.5173 -0.8954
5 1 -0.4008 -0.5169 0.8958
6 1 1.9219 -1.0342 0.0000
7 1 1.9215 0.5168 -0.8960
8 1 1.9221 0.5174 0.8953
STANDARD DEVIATION ON ENERGY (KCAL) 0.00000014507
STANDARD DEVIATION ON GRADIENT (KCAL/A,RD,RD) 0.00002577 0.00002391 0.00002230
"FORCE" CALCULATION (RELEASE MARCH 1999)
HEAT OF FORMATION= -17.414457 kcal/mole
RMS GRADIENT NORM= 0.002792 kcal/mole/A
ORIENTATION OF MOLECULE IN FORCE CALCULATION:
NO. ATOM X Y Z NO. ATOM X Y Z
1 6 0.0000 0.0000 0.0000 2 6 1.5003 0.0000 0.0000
3 1 -0.3952 1.0448 0.0000 4 1 -0.3952 -0.5225 -0.9048
5 1 -0.3952 -0.5224 0.9049 6 1 1.8955 -1.0448 0.0003
7 1 1.8954 0.5222 -0.9050 8 1 1.8955 0.5227 0.9047
HESSIAN BUILT IN 18 INTERNAL COORDINATES DEFINED AS FOLLOW:
ATOM CHEMICAL BOND LENGTH BOND ANGLE TWIST ANGLE
NUMBER SYMBOL (ANGSTROMS) (DEGREES) (DEGREES)
(I) NA:I NB:NA:I NC:NB:NA:I NA NB NC
1 C
2 C 1.50026 * 1
3 H 1.11709 * 110.71837 * 1 2
4 H 1.11708 * 110.71956 * 120.00271 * 1 2 3
5 H 1.11709 * 110.71795 * -119.99811 * 1 2 3
6 H 1.11709 * 110.71806 * 179.98373 * 2 1 3
7 H 1.11709 * 110.71751 * -60.01499 * 2 1 3
8 H 1.11708 * 110.72022 * 59.98328 * 2 1 3
VIBRATIONAL FREQUENCIES AND ERRORS (CM-1),
REDUCED FORCE CONSTANTS (MILLIDYNE/ANGSTROMS),
DIPOLE DERIVATIVES (DEBYE/ANGSTROMS),
IR INTENSITIES (DEBYE**2/ANGSTROMS**2),
AND NORMAL MODES (CARTESIAN COORDINATES):
FREQ : 0.000 0.000 0.000 0.000 0.000 0.000 201.544 889.431
ERROR : 0.000 0.000 0.000 0.000 0.000 0.000 5.879 0.467
F-CST : 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.01197 0.23305
DIP(X): 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
DIP(Y): 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.049
DIP(Z): 0.000 0.000 0.000 0.000 0.000 0.000 0.000 -0.271
DIP TOT 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.276
IR ITEN 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.076
1C (x) 0.0000 0.0000 0.0000 0.0000 0.0000 -0.1824 0.0000 0.0000
1C (y) -0.0401 -0.0202 -0.0091 0.2317 -0.0149 0.0000 0.0000 0.0081
1C (z) 0.1109 0.1468 0.0229 0.0420 0.1408 0.0000 0.0000 0.0445
2C (x) 0.0000 0.0000 0.0000 0.0000 0.0000 -0.1824 0.0000 0.0000
2C (y) 0.1314 -0.1752 0.0404 0.0581 0.0552 0.0000 0.0000 0.0081
2C (z) 0.0837 0.0770 0.1768 0.0213 -0.1065 0.0000 0.0000 0.0445
3H (x) -0.1195 0.1079 -0.0345 0.1209 -0.0489 -0.1824 0.0000 -0.0896
3H (y) -0.0853 0.0206 -0.0222 0.2774 -0.0334 0.0000 0.0000 -0.0309
3H (z) 0.3485 0.2211 -0.2766 0.0689 0.0019 0.0000 -0.4066 -0.1834
4H (x) 0.0433 -0.0961 0.1101 -0.0730 -0.1248 -0.1824 0.0000 0.4708
4H (y) 0.1142 0.0690 -0.2464 0.2959 -0.2101 0.0000 -0.3522 -0.0269
4H (z) 0.0029 0.1373 0.1118 0.0367 0.3081 0.0000 0.2033 -0.1721
5H (x) 0.0762 -0.0118 -0.0756 -0.0480 0.1736 -0.1824 0.0000 -0.3812
5H (y) -0.2848 -0.0278 0.2021 0.2588 0.1433 0.0000 0.3522 -0.0387
5H (z) 0.0029 0.1373 0.1118 0.0367 0.3080 0.0000 0.2033 -0.1742
6H (x) 0.1195 -0.1079 0.0344 -0.1209 0.0489 -0.1823 0.0000 -0.0896
6H (y) 0.1765 -0.2160 0.0535 0.0123 0.0738 0.0000 -0.0001 -0.0310
6H (z) -0.1538 0.0027 0.4763 -0.0056 0.0324 0.0000 -0.4066 -0.1834
7H (x) -0.0761 0.0118 0.0756 0.0479 -0.1736 -0.1824 0.0000 -0.3812
7H (y) 0.3761 -0.1676 -0.1709 0.0309 -0.1030 0.0000 0.3522 -0.0387
7H (z) 0.1917 0.0865 0.0879 0.0266 -0.2737 0.0000 0.2032 -0.1742
8H (x) -0.0433 0.0961 -0.1101 0.0729 0.1247 -0.1824 0.0000 0.4708
8H (y) -0.0229 -0.2644 0.2776 -0.0062 0.2504 0.0000 -0.3521 -0.0269
8H (z) 0.1918 0.0865 0.0878 0.0266 -0.2738 0.0000 0.2034 -0.1721
FREQ : 889.443 1182.960 1182.972 1247.494 1393.828 1393.845 1395.150 1395.164
ERROR : 0.636 0.443 0.676 0.180 0.724 0.376 0.636 0.425
F-CST : 0.23306 0.41226 0.41226 0.45846 0.57233 0.57234 0.57341 0.57343
DIP(X): 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
DIP(Y): 0.271 0.000 0.000 0.000 0.001 0.000 -0.042 0.195
DIP(Z): -0.049 0.000 0.000 0.000 0.000 0.001 -0.195 -0.042
DIP TOT 0.276 0.000 0.000 0.000 0.001 0.001 0.200 0.200
IR ITEN 0.076 0.000 0.000 0.000 0.000 0.000 0.040 0.040
1C (x) 0.0000 0.0000 0.0000 0.1572 0.0000 0.0000 0.0000 0.0000
1C (y) -0.0445 -0.0117 -0.1131 0.0000 0.0090 0.0513 0.0112 -0.0509
1C (z) 0.0081 -0.1131 0.0117 0.0000 0.0511 -0.0095 0.0511 0.0107
2C (x) 0.0000 0.0000 0.0000 -0.1572 0.0000 0.0000 0.0000 0.0000
2C (y) -0.0444 0.0117 0.1131 0.0000 -0.0093 -0.0511 0.0106 -0.0512
2C (z) 0.0081 0.1131 -0.0117 0.0000 -0.0512 0.0088 0.0510 0.0111
3H (x) 0.4919 0.0474 0.4596 0.2553 0.0309 0.1763 0.0417 -0.1899
3H (y) 0.1698 0.0089 0.0868 0.0446 0.0149 0.0849 0.0208 -0.0947
3H (z) -0.0335 0.0826 -0.0085 0.0000 -0.5107 0.0950 -0.5008 -0.1049
4H (x) -0.1683 -0.4217 -0.1888 0.2553 -0.1675 -0.0598 -0.1858 0.0603
4H (y) 0.1811 0.0105 0.0834 -0.0223 0.1940 -0.4111 0.1807 0.4045
4H (z) -0.0375 0.0859 -0.0070 -0.0386 -0.0189 0.2706 0.0027 -0.2683
5H (x) -0.3236 0.3743 -0.2708 0.2553 0.1367 -0.1166 0.1442 0.1296
5H (y) 0.1789 0.0068 0.0838 -0.0223 -0.3216 -0.3152 -0.3352 0.2964
5H (z) -0.0257 0.0855 -0.0107 0.0386 -0.1096 -0.2468 -0.1105 0.2457
6H (x) 0.4919 -0.0473 -0.4596 -0.2553 -0.0321 -0.1754 0.0395 -0.1909
6H (y) 0.1698 -0.0090 -0.0868 -0.0446 -0.0153 -0.0845 0.0196 -0.0952
6H (z) -0.0334 -0.0825 0.0085 0.0000 0.5121 -0.0881 -0.5000 -0.1083
7H (x) -0.3235 -0.3744 0.2708 -0.2553 -0.1365 0.1139 0.1451 0.1311
7H (y) 0.1789 -0.0068 -0.0838 0.0223 0.3244 0.3172 -0.3302 0.2969
7H (z) -0.0257 -0.0855 0.0107 -0.0386 0.1113 0.2463 -0.1070 0.2468
8H (x) -0.1684 0.4217 0.1888 -0.2553 0.1686 0.0616 -0.1845 0.0598
8H (y) 0.1810 -0.0105 -0.0834 0.0223 -0.1925 0.4059 0.1850 0.4084
8H (z) -0.0375 -0.0859 0.0070 0.0386 0.0175 -0.2688 -0.0006 -0.2704
FREQ : 1431.245 1445.496 3048.850 3048.880 3072.083 3072.111 3148.041 3164.714
ERROR : 0.473 0.488 0.109 0.134 0.188 0.249 0.232 0.401
F-CST : 0.60347 0.61555 2.73842 2.73847 2.78031 2.78036 2.91950 2.95050
DIP(X): 0.111 0.000 0.000 0.000 0.000 0.000 0.000 -0.031
DIP(Y): 0.000 0.000 0.000 0.000 -0.032 -0.038 0.000 0.000
DIP(Z): 0.000 0.000 0.000 0.000 0.038 -0.032 0.000 0.000
DIP TOT 0.111 0.000 0.000 0.000 0.050 0.050 0.000 0.031
IR ITEN 0.012 0.000 0.000 0.000 0.002 0.002 0.000 0.001
1C (x) -0.0853 -0.1274 0.0000 0.0000 0.0000 0.0000 -0.0262 -0.0331
1C (y) 0.0000 0.0000 0.0338 -0.0460 0.0388 0.0458 0.0000 0.0000
1C (z) 0.0000 0.0000 -0.0460 -0.0338 -0.0458 0.0389 0.0000 0.0000
2C (x) -0.0853 0.1274 0.0000 0.0000 0.0000 0.0000 0.0262 -0.0331
2C (y) 0.0000 0.0000 -0.0338 0.0460 0.0389 0.0458 0.0000 0.0000
2C (z) 0.0000 0.0000 0.0460 0.0338 -0.0458 0.0388 0.0000 0.0000
3H (x) 0.3389 0.2883 0.1203 -0.1635 0.1338 0.1579 0.1306 0.1314
3H (y) 0.1469 0.1335 -0.3037 0.4128 -0.3286 -0.3877 -0.3813 -0.3794
3H (z) 0.0001 0.0001 -0.0244 -0.0180 -0.0236 0.0201 0.0000 0.0000
4H (x) 0.3389 0.2883 0.0815 0.1859 0.0697 -0.1949 0.1307 0.1314
4H (y) -0.0735 -0.0668 0.1269 0.2241 0.1109 -0.2302 0.1907 0.1897
4H (z) -0.1272 -0.1156 0.1642 0.4125 0.1337 -0.4196 0.3303 0.3286
5H (x) 0.3389 0.2883 -0.2018 -0.0224 -0.2036 0.0371 0.1306 0.1314
5H (y) -0.0734 -0.0667 -0.2519 -0.0544 -0.2451 0.0719 0.1906 0.1896
5H (z) 0.1272 0.1156 0.4430 0.0339 0.4357 -0.0636 -0.3302 -0.3285
6H (x) 0.3389 -0.2882 -0.1203 0.1635 0.1339 0.1578 -0.1308 0.1313
6H (y) 0.1470 -0.1335 0.3037 -0.4129 -0.3289 -0.3874 0.3817 -0.3790
6H (z) 0.0000 0.0000 0.0243 0.0181 -0.0235 0.0202 -0.0001 0.0001
7H (x) 0.3389 -0.2882 0.2017 0.0225 -0.2037 0.0371 -0.1307 0.1312
7H (y) -0.0734 0.0667 0.2517 0.0545 -0.2451 0.0719 -0.1907 0.1894
7H (z) 0.1273 -0.1156 -0.4429 -0.0342 0.4360 -0.0636 0.3305 -0.3282
8H (x) 0.3389 -0.2882 -0.0814 -0.1860 0.0697 -0.1948 -0.1308 0.1313
8H (y) -0.0735 0.0668 -0.1269 -0.2244 0.1108 -0.2303 -0.1910 0.1896
8H (z) -0.1273 0.1156 -0.1641 -0.4127 0.1335 -0.4194 -0.3306 0.3282
ZERO POINT ENERGY: 46.61 kcal/mole, ERROR: 0.009
NORMAL MODES (INTERNAL COORDINATES),
(b) FOR BOND, (a) FOR ANGLE, (t) FOR TWIST ANGLE:
FREQ : 0.000 0.000 0.000 0.000 0.000 0.000 201.544 889.431
2C (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.0048
3H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0874
4H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0252
4H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.4591
4H (d) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.2927
5H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.0204
5H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.3717
5H (d) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.3615
6H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0048
6H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.0874
6H (d) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.7784 0.4361
7H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0204
7H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.3718
7H (d) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.7784 0.0747
8H (b) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 -0.0252
8H (a) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.4591
8H (d) 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.7784 0.1434
FREQ : 889.443 1182.960 1182.972 1247.494 1393.828 1393.845 1395.150 1395.164
2C (b) 0.0000 0.0000 0.0000 -0.3144 0.0000 0.0000 0.0000 0.0000
3H (b) 0.0264 0.0025 0.0244 0.0070 -0.0054 -0.0309 -0.0058 0.0262
3H (a) -0.4797 -0.0617 -0.5989 -0.0963 -0.0155 -0.0901 -0.0376 0.1731
4H (b) -0.0090 -0.0224 -0.0100 0.0070 0.0294 0.0105 0.0257 -0.0083
4H (a) 0.1641 0.5496 0.2460 -0.0963 0.0852 0.0301 0.1689 -0.0548
4H (d) -0.2485 0.3447 -0.2494 0.0000 -0.7592 0.6466 -0.6918 -0.6214
5H (b) -0.0173 0.0199 -0.0144 0.0070 -0.0240 0.0204 -0.0199 -0.0179
5H (a) 0.3156 -0.4878 0.3529 -0.0963 -0.0698 0.0600 -0.1315 -0.1183
5H (d) 0.1292 0.3883 0.1738 0.0000 -0.9313 -0.3327 -0.8928 0.2897
6H (b) -0.0264 0.0025 0.0244 0.0070 -0.0056 -0.0308 0.0054 -0.0264
6H (a) 0.4797 -0.0616 -0.5990 -0.0963 -0.0166 -0.0893 0.0364 -0.1736
6H (d) 0.0795 0.0000 0.0000 0.0000 -0.0014 -0.0073 1.0555 0.2249
7H (b) 0.0173 0.0199 -0.0144 0.0070 -0.0240 0.0200 0.0200 0.0181
7H (a) -0.3155 -0.4879 0.3528 -0.0963 -0.0696 0.0576 0.1319 0.1190
7H (d) 0.2088 -0.3883 -0.1738 0.0000 0.9349 0.3343 0.1703 0.5119
8H (b) 0.0090 -0.0224 -0.0100 0.0070 0.0296 0.0108 -0.0254 0.0082
8H (a) -0.1642 0.5495 0.2461 -0.0963 0.0862 0.0318 -0.1682 0.0546
8H (d) -0.1689 -0.3447 0.2493 0.0000 0.7571 -0.6409 0.3588 -0.4052
FREQ : 1431.245 1445.496 3048.850 3048.880 3072.083 3072.111 3148.041 3164.714
2C (b) 0.0000 0.2548 0.0000 0.0000 0.0000 0.0000 0.0524 0.0000
3H (b) -0.0126 -0.0222 -0.3583 0.4870 -0.3910 -0.4613 -0.4121 -0.4130
3H (a) -0.4017 -0.3903 0.0513 -0.0697 0.0043 0.0051 -0.0106 -0.0176
4H (b) -0.0126 -0.0222 -0.2426 -0.5536 -0.2037 0.5695 -0.4123 -0.4131
4H (a) -0.4017 -0.3903 0.0347 0.0793 0.0022 -0.0063 -0.0105 -0.0176
4H (d) 0.0001 0.0001 0.0937 0.0104 0.0474 -0.0086 0.0000 0.0000
5H (b) -0.0126 -0.0222 0.6011 0.0667 0.5949 -0.1083 -0.4121 -0.4129
5H (a) -0.4017 -0.3903 -0.0860 -0.0096 -0.0065 0.0012 -0.0106 -0.0176
5H (d) 0.0001 0.0001 0.0378 0.0863 0.0162 -0.0454 0.0000 0.0000
6H (b) 0.0126 -0.0222 -0.3582 0.4871 0.3913 0.4610 -0.4126 0.4126
6H (a) 0.4018 -0.3902 0.0513 -0.0697 -0.0043 -0.0051 -0.0106 0.0176
6H (d) -0.0001 0.0000 0.0000 0.0000 -0.0424 0.0360 0.0000 0.0000
7H (b) 0.0126 -0.0222 0.6008 0.0670 -0.5951 0.1083 -0.4124 0.4125
7H (a) 0.4018 -0.3902 -0.0860 -0.0096 0.0066 -0.0012 -0.0106 0.0176
7H (d) -0.0001 0.0000 -0.0378 -0.0863 -0.0262 -0.0094 0.0000 0.0000
8H (b) 0.0126 -0.0222 -0.2425 -0.5539 0.2036 -0.5692 -0.4126 0.4127
8H (a) 0.4018 -0.3902 0.0347 0.0793 -0.0022 0.0063 -0.0106 0.0176
8H (d) -0.0001 -0.0001 -0.0937 -0.0104 0.0050 0.0274 0.0000 0.0000
DESCRIPTION OF NORMAL MODES IN TERM OF BONDED INTERATOMIC DISTANCES
VIB. 7 ATOMS C 1 AND H 3 SHIFT 0.41 ANGSTROMS 0.0% RADIALLY
FREQ. 201.544 C 1 H 4 0.41 0.0%
C 1 H 5 0.41 0.0%
C 2 H 6 0.41 0.0%
C 2 H 7 0.41 0.0%
C 2 H 8 0.41 0.0%
VIB. 8 ATOMS C 1 AND H 3 SHIFT 0.25 ANGSTROMS 1.9% RADIALLY
FREQ. 889.431 C 1 H 4 0.52 4.9%
C 1 H 5 0.44 4.6%
C 2 H 6 0.25 1.9%
C 2 H 7 0.44 4.6%
C 2 H 8 0.52 4.9%
VIB. 9 ATOMS C 1 AND H 3 SHIFT 0.54 ANGSTROMS 4.9% RADIALLY
FREQ. 889.443 C 1 H 4 0.29 3.2%
C 1 H 5 0.39 4.4%
C 2 H 6 0.54 4.9%
C 2 H 7 0.39 4.4%
C 2 H 8 0.29 3.2%
VIB. 10 ATOMS C 1 AND C 2 SHIFT 0.23 ANGSTROMS 0.0% RADIALLY
FREQ. 1182.960 C 1 H 3 0.20 1.2%
C 1 H 4 0.47 4.8%
C 1 H 5 0.42 4.7%
C 2 H 6 0.20 1.2%
C 2 H 7 0.42 4.7%
C 2 H 8 0.47 4.8%
VIB. 11 ATOMS C 1 AND C 2 SHIFT 0.23 ANGSTROMS 0.0% RADIALLY
FREQ. 1182.972 C 1 H 3 0.50 4.9%
C 1 H 4 0.27 3.7%
C 1 H 5 0.34 4.3%
C 2 H 6 0.50 4.9%
C 2 H 7 0.34 4.3%
C 2 H 8 0.27 3.7%
VIB. 12 ATOMS C 1 AND C 2 SHIFT 0.31 ANGSTROMS 100.0% RADIALLY
FREQ. 1247.494 C 1 H 3 0.11 6.5%
C 1 H 4 0.11 6.5%
C 1 H 5 0.11 6.5%
C 2 H 6 0.11 6.5%
C 2 H 7 0.11 6.5%
C 2 H 8 0.11 6.5%
VIB. 13 ATOMS C 1 AND C 2 SHIFT 0.10 ANGSTROMS 0.0% RADIALLY
FREQ. 1393.828 C 1 H 3 0.56 1.0%
C 1 H 4 0.26 11.3%
C 1 H 5 0.39 6.1%
C 2 H 6 0.56 1.0%
C 2 H 7 0.40 6.1%
C 2 H 8 0.26 11.4%
VIB. 14 ATOMS C 1 AND C 2 SHIFT 0.10 ANGSTROMS 0.0% RADIALLY
FREQ. 1393.845 C 1 H 3 0.21 14.9%
C 1 H 4 0.54 1.9%
C 1 H 5 0.45 4.5%
C 2 H 6 0.20 15.2%
C 2 H 7 0.45 4.4%
C 2 H 8 0.54 2.0%
VIB. 15 ATOMS C 1 AND H 3 SHIFT 0.55 ANGSTROMS 1.0% RADIALLY
FREQ. 1395.150 C 1 H 4 0.26 10.0%
C 1 H 5 0.41 4.9%
C 2 H 6 0.55 1.0%
C 2 H 7 0.40 5.0%
C 2 H 8 0.26 9.8%
VIB. 16 ATOMS C 1 AND H 3 SHIFT 0.23 ANGSTROMS 11.6% RADIALLY
FREQ. 1395.164 C 1 H 4 0.54 1.6%
C 1 H 5 0.44 4.1%
C 2 H 6 0.23 11.5%
C 2 H 7 0.44 4.1%
C 2 H 8 0.54 1.5%
VIB. 17 ATOMS C 1 AND H 3 SHIFT 0.45 ANGSTROMS 2.8% RADIALLY
FREQ. 1431.245 C 1 H 4 0.45 2.8%
C 1 H 5 0.45 2.8%
C 2 H 6 0.45 2.8%
C 2 H 7 0.45 2.8%
C 2 H 8 0.45 2.8%
VIB. 18 ATOMS C 1 AND C 2 SHIFT 0.25 ANGSTROMS 100.0% RADIALLY
FREQ. 1445.496 C 1 H 3 0.44 5.1%
C 1 H 4 0.44 5.1%
C 1 H 5 0.44 5.1%
C 2 H 6 0.44 5.1%
C 2 H 7 0.44 5.1%
C 2 H 8 0.44 5.1%
VIB. 19 ATOMS C 1 AND C 2 SHIFT 0.11 ANGSTROMS 0.0% RADIALLY
FREQ. 3048.850 C 1 H 3 0.36 99.8%
C 1 H 4 0.24 99.5%
C 1 H 5 0.60 100.0%
C 2 H 6 0.36 99.8%
C 2 H 7 0.60 100.0%
C 2 H 8 0.24 99.5%
VIB. 20 ATOMS C 1 AND C 2 SHIFT 0.11 ANGSTROMS 0.0% RADIALLY
FREQ. 3048.880 C 1 H 3 0.49 99.9%
C 1 H 4 0.55 100.0%
C 2 H 6 0.49 99.9%
C 2 H 8 0.55 100.0%
VIB. 21 ATOMS C 1 AND H 3 SHIFT 0.39 ANGSTROMS 99.8% RADIALLY
FREQ. 3072.083 C 1 H 4 0.21 99.1%
C 1 H 5 0.59 100.0%
C 2 H 6 0.39 99.8%
C 2 H 7 0.60 100.0%
C 2 H 8 0.21 99.1%
VIB. 22 ATOMS C 1 AND H 3 SHIFT 0.46 ANGSTROMS 99.9% RADIALLY
FREQ. 3072.111 C 1 H 4 0.57 100.0%
C 1 H 5 0.11 96.7%
C 2 H 6 0.46 99.9%
C 2 H 7 0.11 96.7%
C 2 H 8 0.57 100.0%
VIB. 23 ATOMS C 1 AND H 3 SHIFT 0.41 ANGSTROMS 100.0% RADIALLY
FREQ. 3148.041 C 1 H 4 0.41 100.0%
C 1 H 5 0.41 100.0%
C 2 H 6 0.41 100.0%
C 2 H 7 0.41 100.0%
C 2 H 8 0.41 100.0%
VIB. 24 ATOMS C 1 AND H 3 SHIFT 0.41 ANGSTROMS 99.9% RADIALLY
FREQ. 3164.714 C 1 H 4 0.41 99.9%
C 1 H 5 0.41 99.9%
C 2 H 6 0.41 99.9%
C 2 H 7 0.41 99.9%
C 2 H 8 0.41 99.9%
MOLECULAR WEIGHT: 30.069400 AMU
MOMENTS OF INERTIA IN 10**(-40)GRAM-CM**2: 4.10998D+01 4.10996D+01 1.09627D+01
MOMENTS OF INERTIA (CM-1): 6.81105D-01 6.81108D-01 2.55351D+00
SYSTEM IS A STABLE SPECIES
CALCULATED THERMODYNAMIC PROPERTIES
ASSUMING NO INTERNAL ROTATIONS.
THERE ARE 18 GENUINE VIBRATIONS IN THIS SYSTEM
TEMP. (K) PARTITION FUNCTION ENTHALPY HEAT CAPACITY ENTROPY
CAL/MOL CAL/K/MOL CAL/K/MOL
200 VIB. 0.1312D+01 187.90579 2.07195 1.47908
ROT. 0.2669D+04 596.17800 2.98089 18.65959
INT. 0.3502D+04 784.08379 5.05284 20.13867
TRA. 0.8766D+26 993.63000 4.96815 34.13700
TOT. 1777.71379 10.02099 54.27567
220 VIB. 0.1376D+01 232.21930 2.36920 1.69003
ROT. 0.3080D+04 655.79580 2.98089 18.94370
INT. 0.4238D+04 888.01510 5.35009 20.63373
TRA. 0.1011D+27 1092.99300 4.96815 34.61029
TOT. 1981.00810 10.31824 55.24402
240 VIB. 0.1445D+01 283.07883 2.72702 1.91107
ROT. 0.3509D+04 715.41360 2.98089 19.20307
INT. 0.5071D+04 998.49243 5.70791 21.11414
TRA. 0.1152D+27 1192.35600 4.96815 35.04236
TOT. 2190.84843 10.67606 56.15650
260 VIB. 0.1519D+01 341.70541 3.14550 2.14548
ROT. 0.3957D+04 775.03140 2.98089 19.44167
INT. 0.6012D+04 1116.73681 6.12639 21.58715
TRA. 0.1299D+27 1291.71900 4.96815 35.43983
TOT. 2408.45581 11.09454 57.02698
280 VIB. 0.1600D+01 409.27530 3.62034 2.39563
ROT. 0.4422D+04 834.64920 2.98089 19.66258
INT. 0.7075D+04 1243.92450 6.60123 22.05821
TRA. 0.1452D+27 1391.08200 4.96815 35.80783
TOT. 2635.00650 11.56938 57.86604
300 VIB. 0.1688D+01 486.84716 4.14433 2.66302
ROT. 0.4904D+04 894.26700 2.98089 19.86824
INT. 0.8277D+04 1381.11416 7.12522 22.53126
TRA. 0.1610D+27 1490.44500 4.96815 36.15043
TOT. 2871.55916 12.09337 58.68169
320 VIB. 0.1784D+01 575.31823 4.70874 2.94831
ROT. 0.5402D+04 953.88480 2.98089 20.06062
INT. 0.9639D+04 1529.20303 7.68963 23.00894
TRA. 0.1774D+27 1589.80800 4.96815 36.47091
TOT. 3119.01103 12.65778 59.47985
340 VIB. 0.1890D+01 675.40498 5.30438 3.25152
ROT. 0.5917D+04 1013.50260 2.98089 20.24134
INT. 0.1118D+05 1688.90758 8.28527 23.49285
TRA. 0.1943D+27 1689.17100 4.96815 36.77196
TOT. 3378.07858 13.25342 60.26481
360 VIB. 0.2007D+01 787.64227 5.92237 3.57212
ROT. 0.6446D+04 1073.12040 2.98089 20.41172
INT. 0.1294D+05 1860.76267 8.90326 23.98383
TRA. 0.2117D+27 1788.53400 4.96815 37.05579
TOT. 3649.29667 13.87141 61.03962
380 VIB. 0.2136D+01 912.39509 6.55467 3.90921
ROT. 0.6991D+04 1132.73820 2.98089 20.57289
INT. 0.1493D+05 2045.13329 9.53556 24.48210
TRA. 0.2296D+27 1887.89700 4.96815 37.32427
TOT. 3933.03029 14.50371 61.80637
400 VIB. 0.2279D+01 1049.87779 7.19429 4.26167
ROT. 0.7550D+04 1192.35600 2.98089 20.72579
INT. 0.1721D+05 2242.23379 10.17518 24.98746
TRA. 0.2479D+27 1987.26000 4.96815 37.57898
TOT. 4229.49379 15.14333 62.56644
CODESSA AM1 PRECISE GRAD GEO-OK LICENSE SYBYL SIZES TRUSTE RHF VECTORS +
BONDS PI ENPART KPOLAR ESP FORCE THERMO
GEOMETRY OPTIMISED : ENERGY MINIMISED
SCF FIELD WAS ACHIEVED
AM1 CALCULATION
VERSION 8.16.7
Apr-04-2006
FINAL HEAT OF FORMATION = -17.414457 kcal
= -72.879503 kJ
ELECTRONIC ENERGY = -930.483617 eV
CORE-CORE REPULSION = 591.341753 eV
TOTAL ENERGY = -339.141864 eV
GRADIENT NORM = 0.011845
RMS GRADIENT NORM = 0.002792
UNSTABLE MODE(S) = 0 ( ACCURATE )
IONISATION POTENTIAL = 11.765795 eV
MOLECULAR POINT GROUP = D3D 0.100000
NO. OF FILLED LEVELS = 7 (OCC = 2)
MOLECULAR WEIGHT = 30.069
SCF CALCULATIONS = 40
COMPUTATION TIME = 0.08 seconds
FINAL POINT AND DERIVATIVES
PARAMETER ATOM TYPE VALUE GRADIENT
1 2 C BOND 1.500263 -0.006332 kcal/angstrom
2 3 H BOND 1.117085 -0.002210 kcal/angstrom
3 3 H ANGLE 110.718373 -0.000609 kcal/radian
4 4 H BOND 1.117081 -0.003771 kcal/angstrom
5 4 H ANGLE 110.719558 0.001574 kcal/radian
6 4 H DIHEDRAL 120.002713 0.002388 kcal/radian
7 5 H BOND 1.117089 -0.001545 kcal/angstrom
8 5 H ANGLE 110.717947 0.000077 kcal/radian
9 5 H DIHEDRAL -119.998113 -0.000156 kcal/radian
10 6 H BOND 1.117085 -0.001541 kcal/angstrom
11 6 H ANGLE 110.718065 -0.001551 kcal/radian
12 6 H DIHEDRAL 179.983729 -0.002585 kcal/radian
13 7 H BOND 1.117088 -0.000840 kcal/angstrom
14 7 H ANGLE 110.717510 -0.001666 kcal/radian
15 7 H DIHEDRAL -60.014993 0.003237 kcal/radian
16 8 H BOND 1.117082 -0.004949 kcal/angstrom
17 8 H ANGLE 110.720217 0.003984 kcal/radian
18 8 H DIHEDRAL 59.983285 -0.002084 kcal/radian
ATOM CHEMICAL BOND LENGTH BOND ANGLE TWIST ANGLE
NUMBER SYMBOL (ANGSTROMS) (DEGREES) (DEGREES)
(I) NA:I NB:NA:I NC:NB:NA:I NA NB NC
1 C
2 C 1.50026 * 1
3 H 1.11709 * 110.71837 * 1 2
4 H 1.11708 * 110.71956 * 120.00271 * 1 2 3
5 H 1.11709 * 110.71795 * -119.99811 * 1 2 3
6 H 1.11709 * 110.71806 * 179.98373 * 2 1 3
7 H 1.11709 * 110.71751 * -60.01499 * 2 1 3
8 H 1.11708 * 110.72022 * 59.98328 * 2 1 3
MOLECULAR POINT GROUP SYMMETRY CRITERIA
D3D 0.10000000
RHF EIGENVECTORS
ROOT NO. 1 2 3 4 5 6 7 8
-33.211 -23.594 -14.883 -14.883 -13.152 -11.766 -11.766 4.117
1 A1G 1 A2U 1 EU 1 EU 2 A1G 1 EG 1 EG 2 EU
s C 1 0.5953 -0.5046 0.0000 0.0000 0.0418 0.0000 0.0000 0.0000
Px C 1 0.1298 0.2343 0.0000 0.0000 0.6388 0.0000 0.0000 0.0000
Py C 1 0.0000 0.0000 -0.5293 0.0480 0.0000 -0.4505 0.1491 -0.0848
Pz C 1 0.0000 0.0000 -0.0480 -0.5293 0.0000 -0.1491 -0.4505 0.4586
s C 2 0.5953 0.5046 0.0000 0.0000 0.0418 0.0000 0.0000 0.0000
Px C 2 -0.1298 0.2343 0.0000 0.0000 -0.6388 0.0000 0.0000 -0.0001
Py C 2 0.0000 0.0000 -0.5293 0.0480 0.0000 0.4505 -0.1491 -0.0848
Pz C 2 0.0000 0.0000 -0.0480 -0.5293 0.0000 0.1491 0.4505 0.4586
s H 3 0.2072 -0.2520 -0.3792 0.0344 -0.1734 -0.4064 0.1345 0.0789
s H 4 0.2072 -0.2520 0.2194 0.3112 -0.1735 0.3197 0.2847 0.3301
s H 5 0.2072 -0.2520 0.1598 -0.3456 -0.1734 0.0867 -0.4192 -0.4090
s H 6 0.2072 0.2520 0.3792 -0.0345 -0.1734 -0.4063 0.1346 -0.0790
s H 7 0.2072 0.2520 -0.1597 0.3457 -0.1734 0.0866 -0.4192 0.4091
s H 8 0.2072 0.2520 -0.2195 -0.3112 -0.1735 0.3197 0.2846 -0.3300
ROOT NO. 9 10 11 12 13 14
4.117 4.668 4.944 5.039 5.039 5.246
2 EU 2 A2U 3 A2U 2 EG 2 EG 3 A1G
s C 1 0.0000 -0.0278 0.4945 -0.0001 -0.0001 -0.3793
Px C 1 0.0000 -0.6354 0.2034 0.0000 0.0000 0.2741
Py C 1 0.4586 0.0000 0.0000 0.1932 -0.4873 0.0000
Pz C 1 0.0848 -0.0001 0.0000 -0.4873 -0.1933 0.0000
s C 2 0.0000 0.0278 -0.4945 0.0000 0.0000 -0.3793
Px C 2 0.0000 -0.6354 0.2034 0.0000 0.0000 -0.2741
Py C 2 0.4586 0.0000 0.0000 -0.1933 0.4873 -0.0001
Pz C 2 0.0848 0.0000 0.0001 0.4873 0.1933 0.0000
s H 3 -0.4267 -0.1784 -0.2671 -0.1428 0.3602 0.3060
s H 4 0.2817 -0.1785 -0.2672 -0.2404 -0.3037 0.3061
s H 5 0.1450 -0.1784 -0.2671 0.3834 -0.0563 0.3061
s H 6 0.4267 0.1784 0.2671 -0.1430 0.3601 0.3060
s H 7 -0.1449 0.1784 0.2672 0.3833 -0.0563 0.3060
s H 8 -0.2818 0.1784 0.2671 -0.2404 -0.3038 0.3061
RHF EIGENVALUES
-33.21074 -23.59366 -14.88324 -14.88313 -13.15164 -11.76589 -11.76580 4.11734
4.11740 4.66793 4.94359 5.03871 5.03877 5.24629
NET ATOMIC CHARGES AND DIPOLE CONTRIBUTIONS
ATOM NO. TYPE CHARGE ATOM ELECTRON DENSITY
1 C -0.2118 4.2118
2 C -0.2118 4.2118
3 H 0.0706 0.9294
4 H 0.0706 0.9294
5 H 0.0706 0.9294
6 H 0.0706 0.9294
7 H 0.0706 0.9294
8 H 0.0706 0.9294
DIPOLE (DEBYE) X Y Z TOTAL
POINT-CHG. 0.000 0.000 0.000 0.000
HYBRID 0.000 0.000 0.000 0.000
SUM 0.000 0.000 0.000 0.000
CARTESIAN COORDINATES
NO. ATOM X Y Z
1 C 0.0000 0.0000 0.0000
2 C 1.5003 0.0000 0.0000
3 H -0.3952 1.0448 0.0000
4 H -0.3952 -0.5225 -0.9048
5 H -0.3952 -0.5224 0.9049
6 H 1.8955 -1.0448 0.0003
7 H 1.8954 0.5222 -0.9050
8 H 1.8955 0.5227 0.9047
ATOMIC ORBITAL ELECTRON POPULATIONS
1.22162 0.95953 1.01532 1.01532 1.22162 0.95953 1.01532 1.01532
0.92940 0.92940 0.92941 0.92940 0.92940 0.92940
SIGMA-PI BOND-ORDER MATRIX
S-SIGMA P-SIGMA P-PI S-SIGMA P-SIGMA P-PI
C 1 C 1 C 1 C 2 C 2 C 2
––––––––––––––––––––––––––
S-SIGMA C 1 0.950067
P-SIGMA C 1 0.000000 2.968095
P-PI C 1 0.000000 0.000000 0.028982
S-SIGMA C 2 0.041201 0.197484 0.000000 0.950067
P-SIGMA C 2 0.197484 0.547518 0.000000 0.000000 2.968095
P-PI C 2 0.000000 0.000000 0.026284 0.000000 0.000000 0.028982
S-SIGMA H 3 0.236638 0.739073 0.000382 0.000490 0.001957 0.000517
S-SIGMA H 4 0.236643 0.739067 0.000383 0.000490 0.001957 0.000517
S-SIGMA H 5 0.236631 0.739082 0.000382 0.000490 0.001957 0.000517
S-SIGMA H 6 0.000490 0.001957 0.000517 0.236640 0.739072 0.000382
S-SIGMA H 7 0.000490 0.001957 0.000517 0.236634 0.739078 0.000382
S-SIGMA H 8 0.000490 0.001957 0.000517 0.236639 0.739072 0.000383
S-SIGMA S-SIGMA S-SIGMA S-SIGMA S-SIGMA S-SIGMA
H 3 H 4 H 5 H 6 H 7 H 8
––––––––––––––––––––––––––
S-SIGMA H 3 0.995016
S-SIGMA H 4 0.003056 0.995016
S-SIGMA H 5 0.003055 0.003055 0.995017
S-SIGMA H 6 0.009111 0.000368 0.000369 0.995016
S-SIGMA H 7 0.000368 0.000369 0.009111 0.003056 0.995016
S-SIGMA H 8 0.000369 0.009111 0.000368 0.003056 0.003055 0.995016
BOND ORDERS AND VALENCIES
C 1 C 2 H 3 H 4 H 5 H 6
––––––––––––––––––––––––––
C 1 3.947145
C 2 1.009971 3.947145
H 3 0.976094 0.002964 0.995016
H 4 0.976093 0.002964 0.003056 0.995016
H 5 0.976095 0.002964 0.003055 0.003055 0.995017
H 6 0.002964 0.976094 0.009111 0.000368 0.000369 0.995016
H 7 0.002964 0.976094 0.000368 0.000369 0.009111 0.003056
H 8 0.002964 0.976094 0.000369 0.009111 0.000368 0.003056
H 7 H 8
––––––––––
H 7 0.995016
H 8 0.003055 0.995016
TOTAL ENERGY PARTITIONING IN AM1
ONE-CENTRE ENERGIES (eV)
ATOM 1 C 2 C 3 H 4 H 5 H 6 H 7 H
EA U -182.013 -182.013 -10.592 -10.592 -10.592 -10.592 -10.592
EA E 78.676 78.676 2.774 2.774 2.775 2.774 2.774
TOTAL -103.337 -103.337 -7.817 -7.817 -7.817 -7.817 -7.817
ATOM 8 H
EA U -10.592
EA E 2.774
TOTAL -7.817
TWO-CENTRE ENERGIES (eV)
E( A, B) R N V E TOTAL
1 C 2 C -13.572 126.016 -251.266 124.502 -14.320
1 C 3 H -10.574 39.682 -70.526 29.135 -12.284
1 C 4 H -10.574 39.682 -70.526 29.135 -12.284
1 C 5 H -10.574 39.681 -70.526 29.135 -12.283
1 C 6 H 0.129 23.620 -46.484 22.890 0.155
1 C 7 H 0.129 23.620 -46.484 22.890 0.155
1 C 8 H 0.129 23.620 -46.483 22.890 0.155
2 C 3 H 0.129 23.620 -46.484 22.890 0.155
2 C 4 H 0.129 23.620 -46.483 22.890 0.155
2 C 5 H 0.129 23.620 -46.484 22.890 0.155
2 C 6 H -10.574 39.682 -70.526 29.135 -12.284
2 C 7 H -10.574 39.682 -70.526 29.135 -12.283
2 C 8 H -10.574 39.682 -70.526 29.135 -12.284
3 H 4 H 0.124 6.847 -12.573 5.833 0.230
3 H 5 H 0.124 6.847 -12.574 5.833 0.230
3 H 6 H -0.027 4.367 -8.118 3.752 -0.026
3 H 7 H 0.014 5.222 -9.711 4.512 0.037
3 H 8 H 0.014 5.222 -9.712 4.512 0.037
4 H 5 H 0.124 6.847 -12.574 5.833 0.230
4 H 6 H 0.014 5.222 -9.711 4.512 0.037
4 H 7 H 0.014 5.222 -9.712 4.512 0.037
4 H 8 H -0.027 4.367 -8.118 3.752 -0.026
5 H 6 H 0.014 5.222 -9.712 4.512 0.037
5 H 7 H -0.027 4.367 -8.118 3.753 -0.026
5 H 8 H 0.014 5.222 -9.711 4.512 0.037
6 H 7 H 0.124 6.847 -12.573 5.833 0.230
6 H 8 H 0.124 6.847 -12.574 5.833 0.230
7 H 8 H 0.124 6.847 -12.574 5.833 0.230
TOTAL SUM NEIGHBORING PAIR INTERACTIONS -88.0213
TOTAL SUM NONNEIGHBOR INTERACTIONS (R>1.9 A) 2.4577
TOTAL SUM ONE-CENTRE ENERGIES -253.5783
TOTAL SUM TWO-CENTRE ENERGIES -85.5636
TOTAL SUMS OF ENERGY TERMS:
ONE-CENTRE CORE-ELECTRON ATTRACTION -427.5766
ONE-CENTRE ELECTRON-ELECTRON REPULSION 173.9984
TWO-CENTRE CORE-ELECTRON ATTRACTION -1111.3889
TWO-CENTRE CORE-ELECTRON RESONANCE -75.4935
TWO-CENTRE ELECTRON-ELECTRON REPULSION 509.9771
TWO-CENTRE CORE-CORE REPULSION 591.3418
TOTAL ENERGY = -339.1419
DATA FOR GRAPH WRITTEN TO DISK
NAICAS 12.50 PERCENT IN 0.01 SECONDS
NAICAS 25.00 PERCENT IN 0.03 SECONDS
NAICAS 37.50 PERCENT IN 0.04 SECONDS
NAICAS 50.00 PERCENT IN 0.05 SECONDS
NAICAS 62.50 PERCENT IN 0.05 SECONDS
NAICAS 75.00 PERCENT IN 0.06 SECONDS
NAICAS 87.50 PERCENT IN 0.07 SECONDS
NAICAS 100.00 PERCENT IN 0.07 SECONDS
NAICAP 20.00 PERCENT IN 0.01 SECONDS
NAICAP 40.00 PERCENT IN 0.01 SECONDS
NAICAP 60.00 PERCENT IN 0.02 SECONDS
NAICAP 80.00 PERCENT IN 0.03 SECONDS
NAICAP 100.00 PERCENT IN 0.03 SECONDS
ELECTROSTATIC POTENTIAL CHARGES
CHARGE ON SYSTEM = 0.0000
ATOM NO. TYPE CHARGE
1 C -0.1676
2 C -0.1548
3 H 0.0563
4 H 0.0547
5 H 0.0545
6 H 0.0531
7 H 0.0519
8 H 0.0518
THE NUMBER OF POINTS IS: 472
THE RMS DEVIATION IS: 0.9998
THE RRMS DEVIATION IS: 0.7847
DIPOLE MOMENT EVALUATED FROM THE POINT CHARGES
X Y Z TOTAL
-0.0020 0.0026 -0.0014 0.0036
TIME TO CALCULATE ESP: 0.12 SECONDS
DIPOLE MOMENT, POLARIZABILITY, AND 1ST AND 2ND HYPERPOLARIZABILITY
––––––––––––––––––––––
CENTER OF MASS AT ORIGIN, PRINCIPLE AXES AS:
X, MOMENT= 41.099807 10**(-40)GRAM-CM**2
Y, MOMENT= 41.099636 10**(-40)GRAM-CM**2
Z, MOMENT= 10.962683 10**(-40)GRAM-CM**2
CARTESIAN COORDINATES ARE (ANGSTROMS):
NO. ATOM X Y Z
1 C 0.0000 0.0000 -0.7501
2 C 0.0000 0.0000 0.7501
3 H 0.0290 -1.0444 -1.1453
4 H -0.9190 0.4972 -1.1453
5 H 0.8901 0.5473 -1.1453
6 H -0.0287 1.0445 1.1453
7 H -0.8902 -0.5471 1.1453
8 H 0.9188 -0.4974 1.1454
ZERO FIELD HEAT OF FORMATION (kcal)= -17.41445716379440
PERMANENT DIPOLE (DEBYE)= 0.00001 0.00000 0.00000
STANDARD DEVIATION ON ENERGY: 5.1D-10 (kcal/mol) AND DIPOLE: 9.4D-06 (Debye)
APPLIED ELECTRIC FIELD MAGNITUDE: 0.00400 (A.U.) 0.20570 (V/cm)
STANDARD DEVIATIONS "std" CALCULATED FROM THIS FIELD AND PREVIOUS STD DEVIATION,
ASSUMING TERMS OF ORDERS 5, 6 IN TAYLOR EXPANSION ACTUALLY NEGLIGIBLE.
****************************** DIPOLE ******************************
COMPONENT E4 std DIP std
X -2.255588D-06 1.3D-10 -2.257626D-06 3.6D-06
Y 4.564016D-07 1.3D-10 4.562270D-07 3.6D-06
Z 2.841695D-08 1.3D-10 3.080915D-08 3.6D-06
MAGNITUDE: 2.301475D-06 1.0D-10 2.303468D-06 5.3D-06 (A.U.)
5.849345D-06 5.854410D-06 (DEBYE)
********************** POLARIZABILITY (ALPHA) *********************
COMPONENT E4 std DIP std E4 + ATOMIC CORR.
XX 1.774789D+01 1.6D-07 1.774624D+01 8.8D-04 1.774789D+01
YY 1.774845D+01 1.6D-07 1.774680D+01 8.8D-04 1.774845D+01
ZZ 1.640425D+01 1.6D-07 1.640272D+01 8.8D-04 1.640425D+01
XY 1.367864D-04 3.4D-08 1.366797D-04 8.8D-04 1.367864D-04
XZ 9.089652D-05 3.4D-08 9.055954D-05 8.8D-04 9.089652D-05
YZ -3.067217D-04 3.4D-08 -3.043816D-04 8.8D-04 -3.067217D-04
AVERAGE:
A.U. 1.730019D+01 9.1D-08 1.729858D+01 5.1D-04 1.730019D+01
ANG.**3 2.563476D+00 1.4D-08 2.563237D+00 7.6D-05 2.563476D+00
ESU (X10-24) 5.126947D+00 2.7D-08 5.126470D+00 1.5D-04 5.126947D+00
**************************** SECOND-ORDER (BETA) ***************************
COMPONENT E4 std DIP std
XXX -1.090501D-02 2.0D-05 -1.084220D-02 1.5D-01
XYY 1.116764D-02 2.2D-05 1.113100D-02 1.5D-01
XZZ 8.453501D-04 2.2D-05 9.450376D-04 1.5D-01
YYY 9.400152D-04 2.0D-05 9.489181D-04 1.5D-01
YXX -9.312394D-04 2.2D-05 -8.218357D-04 1.5D-01
YZZ -2.842330D-04 2.2D-05 -2.938774D-04 1.5D-01
ZZZ -3.913436D-05 2.0D-05 -9.443732D-05 1.5D-01
ZXX -8.832388D-05 2.2D-05 -2.972659D-05 1.5D-01
ZYY 7.843840D-05 2.2D-05 8.955997D-05 1.5D-01
ZYZ 2.856372D-04 3.2D-05 1.070793D-04 2.5D-01
VECTOR COMPONENTS GIVEN BY: Bi=(3/5)*(Bi11+Bi22+Bi33)
BX 6.647866D-04 2.2D-05 7.403023D-04 1.6D-01
BY -1.652744D-04 2.2D-05 -1.000770D-04 1.6D-01
BZ -2.941190D-05 2.2D-05 -2.076236D-05 1.6D-01
VALUE OF BETA ALONG THE DIPOLE MOMENT:
A.U. -6.846705D-04 -7.456682D-04
ESU (X10-30) -5.927261D-06 -6.455324D-06
************************ THIRD-ORDER (GAMMA) ************************
COMPONENT E4 std DIP std
XXXX -4.407153D+01 2.6D-02 -4.409066D+01 5.8D+01
YYYY -4.408655D+01 2.6D-02 -4.415104D+01 5.8D+01
ZZZZ 1.138467D+03 2.6D-02 1.140141D+03 5.8D+01
XXYY -1.468943D+01 1.9D-02 -1.470565D+01 1.0D+02
XXZZ 2.740311D+02 1.9D-02 2.743597D+02 1.0D+02
YYZZ 2.740259D+02 1.9D-02 2.743452D+02 1.0D+02
AVERAGE GAMMA GIVEN BY: (1/5)*(GXXXX + GYYYY + GZZZZ + 2*(GXXYY + GXXZZ + GYYZZ))
A.U. 4.234087D+02 4.8D-02 4.239795D+02 1.2D+02
ESU (X10-36) 2.138705D-01 2.4D-05 2.141588D-01 6.2D-02
NOTE: for more accurate "E4" results, double the field magnitude and
extrapolate linearly at zero field vs the square root of the field.
Relevant keyword is: KPOLAR=8.00D-03
FULL COMPUTATION TIME : 0.25 SECONDS
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: . Teoria Grafurilor 2 (ID: 149016)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
