OSMJESKE

Iz Wikipedije, slobodne enciklopedije
Idi na navigaciju Idi na pretragu
Generiranje SMILES-a: prvo se kodiraju slomljeni prstenovi, zatim se opisuju grane iz glavne strukture.

SMILES (Simplified Molecular Input Line Entry System , s eng. - "sustav pojednostavljenog prikaza molekula u ulaznoj liniji") - sustav pravila (specifikacije) nedvosmislenog opisa sastava i strukture molekula kemijske tvari pomoću znaka niz ASCII . Naziv na engleskom je homonim za riječ osmjesi ( osmijesi ), ali se piše samo velikim slovima. Nema nedvosmislenog analoga na ruskom, preporuča se koristiti ga na izvornom jeziku. Izgovara se kao "smiješak".

Niz simbola, sastavljen prema pravilima SMILES-a, mnogi molekularni urednici mogu pretvoriti u dvodimenzionalnu ili trodimenzionalnu strukturnu formulu molekule .

Originalnu specifikaciju SMILES razvili su Arthur Weininger i David Weininger kasnih 1980-ih [1] . Kasnije je standard modificiran i proširen; U ovom radu najaktivnije je sudjelovao Daylight Chemical Information Systems, Inc. ...

Drugi linearni zapisi uključuju Visvesser zapis (WLN), pameti , ROSDAL, a Sybyl Line notacija ( Tripos Inc. ). IUPAC je nedavno predložio InChI kao standard za linearni prikaz formula. SMILES ima prednosti u odnosu na InChI, posebice bolju percepciju formula kod ljudi, kao i jednostavniju softversku podršku zbog prisutnosti opsežne teorijske teorije baznih grafova .

SMILES Specifikacije Opcije

U originalnoj specifikaciji SMILES ne postoje pravila koja se tiču ​​načina građenja zapisa i načina razlikovanja prostornih izomera molekula. Za rješavanje ovih problema razvijena su proširenja standarda:

  • "Canonical SMILES" (Canonical SMILES) [2] je verzija specifikacije koja uključuje pravila kanonizacije koja vam omogućuju da na nedvosmislen način zapišete formulu molekule bilo koje tvari. Ova pravila se odnose na izbor prvog atoma u zapisu, smjer prelaska petlje i izbor smjera glavnog lanca tijekom grananja. Budući da različiti paketi molekularnog modeliranja koriste različite algoritme kanonizacije SMILES-a, zbog čega se mogu dobiti različiti zapisi iste molekule, koncept kanonskih SMILES-a nije apsolutan. Ova verzija standarda obično se koristi za indeksiranje i provjeru jedinstvenosti molekula u bazama podataka.
  • "Izomerni SMILES" (Isomeric SMILES) [3] je verzija specifikacije koja omogućuje bilježenje podataka o izotopskom sastavu , konfiguraciji asimetričnih ugljikovih atoma i dvostrukim vezama . Posebnost ove verzije u usporedbi sa službenom IUPAC nomenklaturom je da izomerni SMILES omogućuje pohranjivanje informacija o molekulama za koje su poznate konfiguracije samo nekih kiralnih centara ili dvostrukih veza.

Definicija u smislu teorije grafova

U smislu teorije grafova, SMILES je niz dobiven izlazom simbola vrhova molekularnog grafa redoslijedom koji odgovara njihovom obilasku u dubinu . Početna obrada grafa uključuje uklanjanje vodikovih atoma i prekidanje ciklusa tako da je rezultirajući graf razmjenjiva šuma . Mjesta dijeljenja grafa povezana su s brojevima koji pokazuju prisutnost veze u izvornoj molekuli. Zagrade se koriste za označavanje točaka grananja molekule.

Osnovni principi izgradnje OSMEHA

atomi

Atomi su označeni simbolima kemijskih elemenata u uglastim zagradama , na primjer, zlato je označeno kao [Au] . Za organogene elemente ( B , C , N , O , P , S , F , Cl , Br , I ) zagrade se mogu izostaviti. U ovom slučaju, atomi vodika ne moraju biti eksplicitno naznačeni ako njihov broj odgovara najnižoj normalnoj valenciji u skladu s eksplicitno određenim vezama. Atomi u aromatičnim prstenovima obično se pišu malim umjesto velikim slovima, iako neki dijalekti SMILES koriste eksplicitnu izmjenu dvostrukih i jednostrukih veza (kao u strukturnoj formuli benzena koju je predložio Kekulé ). Ako je potrebno naznačiti formalni naboj čestice, atomi vodika i simbol naboja ispisuju se eksplicitno [3] . Izotopi su napisani u uglastim zagradama s atomskom težinom ispred simbola atoma, na primjer, izotop 13 C bi bio napisan kao [13C] .

Na primjer, SMILES bi bio O za vodu i CCO za etanol . Hidroksilni anion zapisuje se kao [OH-] , a željezni (II) ion kao [Fe+2] .

Veze

Pojedinačna kemijska veza može se napisati pomoću simbola - između atoma povezanih vezom, ali u praksi to ne vrijedi, simbol crtice je izostavljen. Oznaka za aromatičnu vezu ( :) također se obično izostavlja. Dvostruka veza je označena znakom jednakosti , na primjer, ugljični dioksid je napisan kao O=C=O Trostruka veza je označena sa oktotorpa , na primjer, cijanovodonična kiselina je napisana kao C#N

Granaste molekule

Strukturna formula propionske kiseline

Bočni lanci molekule su zatvoreni u zagradama . Na primjer, propionska kiselina se piše CCC(=O)O Kanonska oznaka za trifluorometan izgleda kao C(F)(F)F , ali je ova oznaka nezgodna za čitanje zbog preopterećenja zagradama, pa se ista molekula može napisati u nekanonskom obliku kao FC(F)F

Ciklične veze

Atomi koji se nalaze na krajevima veze prekinute tijekom izgradnje rasponske šume označeni su istim brojem. Na primjer, cikloheksan se piše kao C1CCCCC1 a benzen kao c1ccccc1 .

Stereokemija

Strukturna formula cis-difluoroetilena

Konfiguracija s obzirom na dvostruku vezu zapisuje se pomoću znakova / i \ . Na primjer, F/C=C/F odgovara trans - difluoroetilenu , a F/C=C\F ili F\C=C/F odgovara cis- difluoroetilenu (vidi sliku).

Ekstenzije

SMARTS je modifikacija SMILES-a koja vam omogućuje korištenje neuređene strukture atoma i veza. Široko se koristi u tražilicama u bazama podataka o tvarima. Praksa primjene izazvala je raširenu zabludu da se u računalnoj potrazi za strukturama vrši usporedba string zapisa, dok se mnogo učinkovitija usporedba grafova izgrađenih na temelju SMILES formula.

Transformacije

Formula SMILES može se pretvoriti u dvodimenzionalnu strukturnu formulu korištenjem algoritama za generiranje dijagrama strukture koje je razvio Helson [4] . Pretvorba ne daje uvijek nedvosmislen rezultat. Transformacija u trodimenzionalnu strukturnu formulu provodi se primjenom principa minimalne energije stvaranja tvari.

vidi također

Bilješke (uredi)

  1. David Weininger. SMILES, kemijski jezik i informacijski sustav. 1. Uvod u metodologiju i pravila kodiranja // J. Chem. Inf. Računalo. Sci.. - 1988. - T. 28 , br . - S. 31-36 .
  2. ^ David Weininger, Arthur Weininger, Joseph L. Weininger. OSMJESKE. 2. Algoritam za generiranje jedinstvene oznake SMILES // J. Chem. Inf. Računalo. Sci.. - 1989. - T. 29 , br . - S. 97-101 .
  3. 1 2 SMILES - A Simplified Chemical Language (eng.) (veza nedostupna) . Daylight Chemical Information Systems, Inc .. - Opis standarda SMILES na web stranici Daylight. Preuzeto 4. svibnja 2009. Arhivirano 12. veljače 2012.
  4. ^ Helson, Harold E. (1999.) Generiranje dijagrama strukture. Reviews in Computational Chemistry 13, 313-98, Eds. Lipkowitz, KB, Boyd, DB, Wiley-VCH Press.

Linkovi