CHEMAGAZÍN 5-2023

AI VE FARMACII

Již dnes můžeme říci, že umělá inteligence ve službách retrosyntézy, reprezentovaná v tomto pojednání pokročilým softwarem SYNTHIA™, otevírá dveře pro rychlejší a levnější design syntézy molekul, tolik po- třebný například při vývoji, výrobě a pro zajištění dostatku léčiv nejen v době pandemií, pomáhá nalézat nové, často přehlédnuté, překvapivě elegantní a efektivnější cesty v řadě retrosyntetických projektů, ale má i potenciál přispět fundamentálním způsobem ke změně chápání některých souvisejících oblastí, jak si ukážeme na příkladu faktoru syntetické dostupnosti, jehož stoupající význam byl krátce zmíněn v úvodu k tomuto článku. Skóre syntetické dostupnosti Vypořádat se s popisem parametru syntetické dostupnosti je úkol zapek- litý. V klasickém chápání nejde o exaktně měřitelnou veličinu vyjádřitel- nou dokonce nějakou číselnou hodnotou, spíše o subjektivní posouzení složitosti přípravy produktu, kde může hrát roli vše od dostupnosti výchozích látek, přes počet potřebných reakčních kroků, jejich složitost, proveditelnost, výtěžnost až po stabilitu finální molekuly. Vzhledem k dynamice vývoje znalostí v celé oblasti organické chemie i jednotlivých chemiků, vzhledem k stále nově publikovaným reakcím a nově komerčně dostupným stavebním blokům je jasné, že parametr syntetizovatelnosti nebude invariantní, ale s časem i při posuzování různými experty se bude a musí měnit. Látka, kterou nelze současně známými postupy připravit v požadovaném množství či kvalitě či vůbec, může být naopak v budouc- nu syntetizována zcela rutinně a současně i ekonomicky. Naskýtá se tedy zajímavá otázka, jak využít výsledky počítačově podporované retrosyntetické analýzy pro exaktnější a konzistentnější odhad nebo dokonce výpočet faktoru syntetické dostupnosti. Kombinací moderního modelu hlubokého strojového učení, konvoluční neuronové sítě a dat shromážděných pomocí programu SYNTHIA™ Retrosynthesis Software jsme dospěli k parametru SYNTHIA™ Synthetic Accessibi- lity Score (SAS). Jde o číslo v intervalu 0–10, přiřazené každé zadané molekule. Nejnižší čísla (hodnoty blízké 0) jsou vráceny chemikáliím, u kterých počítač předpokládá, že budou snadno vyrobitelné (nebo mohou být dokonce již komerčně dostupné). Skóre blízko maximální hodnoty (10) značí, že syntéza bude buď extrémně složitá (mnoho reakčních kroků), nebo zhola neproveditelná, např. kvůli exotickým strukturním motivům v molekule. Obecně platí, že čím nižší skóre, tím snazší a prakticky proveditelnější by měla být syntéza dané molekuly. V případě, že některé ze zadaných molekul jsou chemicky nesmyslné (např. hypervalentní, obsahující neúplné kruhy, mající nesprávnou protonaci aromatických atomů, atp.), bude i tak požadavek na výpočet

reakcí z USPTO databáze z let 1976 až 2016 nebo nově zařazená velmi žádaná poddatabáze enzymaticky katalyzovaných organických reakcí. Nahlédnutím do informací o poslední verzi programu SYNTHIA™ zjistíme, že kromě popsané unikátní reakční databáze software pracuje i s knihovnou molekul, která aktuálně čítá 20 199 288 publikovaných struktur, z toho 9 936 589 komerčně dostupných přes www.sigmaaldrich. com a od dalších smluvních partnerů Merck v rámci služeb známých jako Building Block Explorer nebo Aldrich Market Select. Umělá inteligence programu SYNTHIA™ vlastně retrosyntetickou analýzu provádí podobně, jako tradičně postupuje organický chemik při manuální retrosyntéze. Krok po kroku aplikuje vložená pravidla, hledá přítomné retrony, zkouší, co je možné, a vyřazuje ze hry, co se zdá jako nevýhodné nebo prostě chemicky nemožné. Zajímavým zjištěním byla skutečnost, že umělá inteligence softwaru SYNTHIA™ začala prakticky intuitivně do retrosyntetického plánování vkládat strategicky výhodné kombinace sousledných tandemových reakcí, které často vedou ke značnému zjednodušení celkového postupu retrosyntézy (obr. 4). To je možné díky použitým pokročilým algoritmům, které neanalyzují jen proveditelnost jednotlivých transformací samostatně, ale hodnotí a porovnávají parametry výhodnosti celkové navržené retrosyntézy [3,4]. Výsledkem analýzy je retrosyntetický strom (obr. 5), jednotlivé navržené syntetické cesty lze dále zkoumat a filtrovat podle různých kriterií a zohlednit tak požadavky konkrétního projektu i chemikův vlastní syntetický styl. Obr. 5: Interface programu SYNTHIA™ s vyobrazením retrosynteti- ckého stromu, typického výsledku retrosyntetické analýzy

Obr. 4: Příklad strategického plánování: krátká elegantní syntéza ramelteonu navržená s použitím pokročilých algoritmů programu SYNTHIA™ (zelené šipky). Klíčovým prvkem je zde strategie založená na Robinsonově annulaci následované dehydrogenací vzniklého cyklického enonu (v retrosyntetickém směru, při plánování cesty, program strategizuje a nejprve provádí zdánlivě nevýkonnou dearomatizaci fenolu, což pak ale umožňuje Robinsonovu annulaci a syntézu pro ni potřebných stavebních bloků přímo z komerčně dostupných látek). Na vloženém obrázku je ukázka MOL.STRAIN/3D modelování jednoho z meziproduktů pomocí SYNTHIA™ kvantově chemického modulu.

10

CHEMAGAZÍN • 5 / XXXIII (2023)

Made with FlippingBook - professional solution for displaying marketing and sales documents online