CHEMAGAZÍN 5-2023

AI VE FARMACII

Obr. 3: Struktury některých z prvních látek, jejichž syntéza byla zcela autonomně naplánována pomocí umělé inteligence programu Chematica (nově SYNTHIA™) a následně úspěšně provedena v laboratoři: ( S )-4-hydroxyduloxetin (jeden z hlavních metabolitů duloxetinu, účinné látky určené k léčbě úzkosti a depresí). Před AI: pokusy o zopakování jediné publikované syntézy selhávaly. AI (SYNTHIA™): 5 kroků, výtěžek 20%.

Vše výše popsané platí až do roku 2018, kdy se v časopise Chem objevuje vůbec první článek referující o úspěšném použití počítačem podporované retrosyntézy pro návrh syntézy několika netriviálních molekul [1]. U těchto látek byla retrosyntéza plně svěřena do algorit- mů softwaru v té době v odborné literatuře známého pod označením Chematica, který byl již více než 15 let vyvíjen na akademické půdě v rámci interdisciplinárního projektu spojujícího chemiky s matematiky a informatiky [2]. Proveditelnost všech počítačem autonomně napláno- vaných syntéz byla úspěšně ověřena v laboratoři, a to byl onen zásadní průlom. V článku je vlastně vylíčen reálný experiment, během něhož byl chemikům dán jen velmi omezený čas na plánování, optimalizaci a vlastní provedení totální syntézy několika vybraných látek. Jakákoli zdlouhavá literární rešerše nepřicházela v úvahu a rychlý počítačový návrh syntetických cest sehrál zásadní úlohu. Autoři navíc poukázali na zajímavý fakt, že u všech počítačem navržených syntéz bylo prokazatelně dosaženo významného zlepšení parametrů, jako byly celkové výtěžky syntézy nebo snížení počtu nutných syntetických kroků, oproti tomu, co bylo dříve pro jednotlivé cílové molekuly publikováno. V jednom případě Chematica úspěšně navrhla postup syntézy nově izolované přírodní látky, jejíž syntéza se nikdy před tím v literatuře neobjevila, u dalších látek byl počítač využit pro nalezení alternativních cest k sloučeninám, u nichž buď předchozí pokusy o zopakování syntézy popsané v literatuře selhávaly, nebo byly tyto syntézy patentovány, případně považovány za příliš málo efektivní (obr. 3). Není divu, že takového nadějného výsledku a významného posunu si všiml komerční sektor a brzy nato byl tento první úspěšně otestovaný retrosyntetický software licencován globální vědecko-technologickou firmou Merck. Pod křídly společnosti Merck dostala původní Chematica nový, uživatelsky přívětivější facelift a je dále rozvíjena a nabízena pod novým označením SYNTHIA™ Retrosynthesis Software jako unikátní inovativní nástroj, který skvěle zapadá do dlouhodobé firemní strategie podpory digitálních a zelených řešení a tvoří logický doplněk k legen- dárnímu portfoliu chemikálií pro organickou syntézu Sigma-Aldrich ® . Tímto synergistickým spojením získává zároveň program SYNTHIA™ přístup do jedné z největších e-commerce platforem s organickými látkami a stavebními bloky na www.sigmaaldrich.com a může tak dy- namicky informace o tom, co a za jakou cenu je komerčně dostupné, v reálném čase zahrnout do retrosyntetického plánování. Krom toho má uživatel možnost do systému nahrát svůj vlastní inventář chemikálií, které budou programu nabídnuty jako další výchozí látky pro navrhované syntézy, případně tyto chemikálie prioritizovat a maximálně tak využít například chemii, kterou má již reálně v laboratoři k dispozici, nebo zahrnout unikátní, dříve nasyntetizované nebo jinak získané látky, ke kterým má přístup. SYNTHIA™ – konec začátku a začátek nové éry Počítačem podporovaná retrosyntéza pomocí programu SYNTHIA™ za- číná zadáním cílové molekuly a parametrů hledání. Chemická struktura cílové molekuly je převedena na řetezec SMILES, který se ukázal jako nejvhodnější pro použití společně s teorií grafů, na které jsou algoritmy a umělá inteligence programu postaveny. Základem softwaru je databáze organických reakcí, několik stovek tisíc ručně nakódovaných pravidel chemických přeměn známých z učebnic organické chemie a odborné literatury, které byly naprogramovány zkušenými organickými chemiky, a která nemá v této oblasti obdoby. Zcela zásadní je, že takto ručně vložená pravidla mohou zohlednit a reálně i obsahují důležité doplňující informace a nedívají se jen na místo, kde v retrosyntetickém kroku dochá- zí ke konkrétnímu rozpojování vazeb mezi jednotlivými atomy, ale berou v potaz celý kontext molekuly, jako je přítomnost jiných, potenciálně nekompatibilních funkčních skupin, nutnost chránění, stereochemie, regiochemie apod. Tím se významně zvyšuje pravděpodobnost, že počítač teoreticky nalezne a nabídne chemikovi k posouzení jen pro- věřené a robustní syntetické cesty, které budou prakticky proveditelné, a to i pro cíle, které dosud nebyly publikovány. Pouze jako doplněk pro rychlejší rozšíření databáze a pro specifické skupiny transformací je aktivně využívána technika strojového učení a automatická extrakce reakčních pravidel z publikovaných článků, případně převod reakcí z jiných zdrojů, jako například nedávno vložený soubor patentovaných

Dronedaron (účinná látka pro léčbu srdeční arytmie). Před AI: známé syntézy pod patenty. AI (SYNTHIA™): 5 kroků, obejití patentu, výtěžek 40%.

Nově studovaný inhibitor proliferace leukemických buněk. Před AI: výtěžek 1%. AI (SYNTHIA™): 6 kroků, výtěžek 60%.

Engelheptanoxid (nedávno – z pohledu roku 2018 – izolovaná nová látka z rostliny Engelhardia roxburghiana ). Před AI: nikdy nesyntetizováno. AI (SYNTHIA™): výtěžek 30% (88% e.e.)

9

CHEMAGAZÍN • 5 / XXXIII (2023)

Made with FlippingBook - professional solution for displaying marketing and sales documents online