Menu

Umíme dát NGS datům smysl se softwarem GENOVESA

Přečtěte si o technologii NGS, sekvenování dat, bioinformatice a softwaru GENOVESA v zajímavém rozhovoru s Petrem Brožem, generálním ředitelem Bioxsys.
V kostce
Molekulární diagnostika je nejrychleji rostoucím segmentem in vitro diagnostického trhu a sekvenování nové generace (NGS) poskytuje hlavní technologickou platformu pro nejmodernější screening genomů pacientů. Analýza genetických dat NGS může být náročným úkolem, který často vyžaduje specializované počítačové dovednosti uživatele. Vyvinuli jsme náš vlastní webový software pro bioinformatickou analýzu - GENOVESA jako řešení, které je bez námahy dostupné pro každého. V následujícím rozhovoru s Petrem Brožem, generálním ředitelem Bioxsys, se dočtete o tom, kdo stojí za projektem GENOVESA, co software již umí a co bude umět v budoucnu i o úplných počátcích bioinformatiky v Česká republika.
Umíme dát NGS datům smysl se softwarem GENOVESA

Petře, mohl byste nám nejprve představit Vaši společnost Bioxsys, která, jak uvádíte na webu, „Dává vašim datům smysl“?  

Bioxsys vznikl původně s cílem vytvořit bioinformatický software s důrazem na robustní databázové řešení pro NGS data, protože jsme viděli, jaké velké množství dat začaly laboratoře v rámci NGS sekvenací generovat. Díky relativně dobré dostupnosti sekvenátorů se jich v praxi objevovalo stále více a i množství dat ke zpracování rostlo exponenciálně. Nicméně v laboratořích si ale s těmito daty nevěděli rady, měli je stále uložené v Excelu.  

A my jsme nastoupili právě v tento moment a pomohli jsme je správně utřídit, uložit a ve finále také interpretovat, dát jim smysl.  

Naším posláním je tedy správně a rychle interpretovat genetická data, která ve výsledku pomohou určit, jestli má pacient patogenní variantu, nebo nemá, potažmo, jaký způsob léčby je vhodné zvolit.  

Zároveň vedle toho stavíme výpočetní infrastruktury, protože bioinformatika je velmi náročná na výpočty a na velká data, takže nabízíme vlastní cloudová úložiště včetně výpočetních serverů.  

A do toho děláme ještě bioinformatická školení, protože se snažíme edukovat uživatele o tom, co vlastně NGS data znamenají, jak s těmi daty dále pracovat a jestli vůbec splňují základní metriky kvality.

 

Takže Vaše aktivity zaměřujete primárně do zdravotnictví a ti, koho školíte, to jsou všeobecně zdravotníci?  

Přesně tak. Většinou jsou to kliničtí genetici, molekulární biologové a lékaři.

Nakonec jsme na základě těchto zkušeností začali tvořit i laboratorní informační systémy, což umožňuje laboratořím efektivně pracovat v rámci jednoho softwaru. Nebyl to původně náš cíl, ale zavedlo nás to sem, protože před samotnou sekvenací  DNA je důležité mít pacientská data strukturovaně uložená v databázi.  

S pilotním softwarem GENOVESA jsme řešili pouze analýzu sekvenačních dat, ale časem jsme zjistili, že je potřeba se napojit o něco dříve a utřídit vstupy o pacientovi a celý tento proces včetně dat efektivně propojit. Takže hlavním cílem bylo vytvořit robustní unikátní řešení, které to celé – zjednodušeně řečeno – propojí od pacientských dat přes sekvenační data až po finální report zahrnující přesnou diagnostiku a návrh léčby.

 

Petr Brož, CEO firmy Bioxsys

 

Každopádně za každou úspěšnou společností stojí talentovaní jedinci, tak se vraťme ještě zpátky k Bioxsysu. Kdo je „zodpovědný“ za dosavadní úspěch? Představíte nám Váš tým?  

Za dosavadními úspěchy firmy stojí dnes už týmová práce mnoha lidí, ale hlavní zodpovědnost mám já společně s kolegou Josefem Steigerem, který je velmi talentovaný programátor zastávající funkci technického ředitele.  

Společně tvoříme unikátní propojení, protože Josef je velmi zkušený vývojář s opravdu hlubokým přesahem od programování databází až po vývoj komplikovaných aplikací. A pokud se to spojí se zkušeným bioinformatikem, který velmi dobře zná trh a potřeby diagnostických pracovišť, tak vznikne Bioxsys, což je vlastně jediná bioinformatická firma v České republice.

 

Vyplnili jste neuvěřitelnou díru na trhu a přicházíte s řešením, které dnes už potřebují všechna zdravotnická zařízení. Jak jste ale přemluvil kolegu, aby s Vámi do tohoto projektu šel?  

Musím říct, že to byla trnitá cesta. Moje vize byla jednoznačná i díky tomu, že jsem byl u vzniku NGS v České republice a podílel jsem se na tom, když na trh přišly první sekvenátory.  

Musel jsem být perzistentní, abych našel zkušeného vývojáře, který bude schopný naprogramovat to, co jsem si představoval a zároveň pochopí rychle obrovský potenciál celého projektu. Tím člověkem byl nakonec Josef. Zároveň jsme si sedli jako lidi, což je vlastně hlavní kritérium pro úspěšný chod celé firmy.

 

Petr přednáší na workshopu BioVendor Group
 

Pojďme se nyní přesunout k tomu, proč tady na Karásku dnes vlastně jste. V BioVendor Group totiž věříme, že spolupráce je motorem inovací, a tak bych se Vás chtěla zeptat, jak se společnost Bioxsys stala naším strategickým partnerem, a to právě v kontextu našeho klíčového projektu NGS?  

V BioVendoru je hodně lidí, co vidí do budoucnosti, dokážete tady dobře predikovat, co trh chce a kde vzniká obchodní potenciál.  

Naše původní spolupráce vznikla v rámci dodávky softwarového řešení k sekvenčním kitům, které BioVendor jako distributor začal dodávat na český trh. Šlo o all-in-one řešení, které se daleko jednodušeji prodává než jen samostatný sekvenační kit, u kterého musí zákazník složitě řešit bioinformatickou analýzu.  

Navíc spoustu zákazníků jsem již znal – minimálně v České republice – ti věděli, že nám mohou důvěřovat. Věděli, kdo za řešením stojí. A tím vše začalo, stali jsme se partnery, kdy jsme byli schopni náš software GENOVESA poprvé prodat se sekvenačním kitem jako balíček all-in-one.  

BioVendor ale sám vycítil, že pouhá distribuce sekvenačních kitů nemá takový potenciál jako samotný vývoj bioinformatického software a práce s genetickými daty.

Proto naše společná cesta nyní vede tím směrem, že BioVendor chce ne jenom vyvíjet vlastní kity, ale zároveň se podílet i na vývoji samotného software GENOVESA.

A my v Bioxsysu vzhledem k tomu, že nemáme ambice být obchodní firma, protože je pro nás zásadní vývoj softwaru a chceme se zabývat hlavně bioinformatikou a dodávat co nejpřesnější výsledky zákazníkovi v nemocnici, tak pro nás je partnerství s BioVendorem v současné chvíli ideální stav, protože ty nápady, které máme – ať už se bavíme o interpretaci variant, filtraci, napojení na AI – ty lze realizovat jen s velkým obchodním partnerem, jako je BioVendor Group.  

Tím to ale určitě nekončí, posuneme-li se dále, máme potenciál rozšiřovat tým, zvětšit se a mít pozitivní dopad nejenom v České republice a v EU, ale v podstatě v celém světě.  

 

Jak GENOVESA funguje a jak ovlivňuje každodenní život a zdraví pacienta?  

Cílem GENOVESA je pomoci převážně klinickým genetikům interpretovat složitý komplex textových sekvenačních dat a určit, jestli má daný pacient potencionálně patogenní variantu anebo nemá – jestli „je zdravý“ a to říkám v uvozovkách, protože geneticky zdravý jedinec de facto neexistuje.  

V GENOVESA to funguje tak, že jednotlivé analýzy jedou paralelně a s takzvanou předpřipravenou neboli personalizovanou workflow. To znamená, že existuje personalizovaná analýza pro konkrétní sekvenační kit a laboratoř. GENOVESA je momentálně jednoduchým a přehledným softwarem, který funguje přesně a na pár „kliknutí“ zvládne vyhodnotit v rutinní diagnostické laboratoři řádově desítky či stovky pacientů.

 

A jaká je hlavní přidaná hodnota naší spolupráce právě ve vztahu dalšího rozvoje GENOVESA?  

Původně šlo pouze o tu obchodní část, kterou měl na bedrech nést BioVendor. Momentálně se začíná podílet i na vývojové části, kdy jsou tady vize jak na straně BioVendoru – ta se tvoří v souladu se zpětnou vazbou od zákazníků – tak na naší straně. Propojení obojího nám pomáhá tvořit solidní produkt.

GENOVESA software

 

Pokud byste mohl GENOVESA personifikovat a přiřknout vlastnost nějakého superhrdiny, jak by vypadaly tyto superschopnosti a charakterové vlastnosti?  

Můj oblíbený superhrdina je Superman, a to proto, že je v podstatě nejsilnější.

Nicméně to nejsilnější, co nás dělí od konkurence, kde vidím to superhrdinství, je opravdu přesnost, rychlost, jednoduchost a celé to flow zpracování dat.  

Vytvoření jednotlivým genetickým laboratořím, potažmo nemocnicím, jejich lokální databázi genetických variant velmi urychluje interpretaci nových pacientů. Když přijde nový pacient a je v databázi nalezen průnik s historickým záznamem, tak je interpretace dané varianty nesrovnatelně rychlejší. A naší velkou vizí je, aby si kliniky navzájem svoje data v databázi sdílely na principu reciprocity a jednaly tak vlastně ve prospěch pacienta, který nebude muset tak dlouho čekat na svůj výsledek.  

Takže bychom to celé mohli shrnout do čtyř hesel – pacientská databáze variant, přesnost, rychlost výsledku a sdílení interpretací variant.

Ale zároveň velká síla, kterou GENOVESA má, je v tom, jak máme data strukturovaně uložená a normalizovaná. Díky tomu máme kvalitní základ pro další velké projekty, jako jsou například národní genomické studie, celogenomové sekvenace a další…

 

Reciproční sdílení dat mezi klinikami – to zní jako ambiciózní plán. Jak je ale reálně toto sdílení dat mezi klinikami řešeno?  

Pokud se kliniky rozhodnou využít možnosti sdílení interpretovaných variant, uzavřou vzájemnou dohodu.  

My poté na základě této dohody umožníme nasdílení jejich interpretací v rámci GENOVESA. Data jsou pseudo-anonymizovaná, jedná se pouze o klasifikaci varianty v genomu bez dalších identifikačních údajů o pacientovi. V praxi toto již funguje u několika soukromých klinik, které používají GENOVESA.

 

Bavili jsme se o superhrdinech a ti mají rádi velké výzvy. Jakým výzvám aktuálně čelíte v oblasti NGS? A jak je plánujete překonat?  

Jedna z velkých výzev je vysvětlit zákazníkům (resp. koncovým uživatelům) velké plus řešení GENOVESA, a tím je naše databáze s možností sdílení interpretací. To nás odlišuje od standardních NGS softwarů, které vyhodnocují data a analýzy pouze terciárně.

Další výzvou je expanze do světa. S tím souvisí i potřeba rozšířit tým, který se o projekt GENOVESA stará. I proto, že trendy v bioinformatice a celkově IT jsou neskutečně proměnlivé a každý rok vznikají nějaké nové typy algoritmů.  

A co bychom dále rádi zrealizovali je využití AI technologií pro predikci patogenních či benigních variant, čímž bychom uživatelům usnadnili jejich hodnocení.

NGS sekvenování

 

Pro srovnání – to zrychlení, o jak velkém zrychlení se při zapojení AI bavíme oproti současnému stavu?

Hodnocení celo-exomových dat jednoho pacienta dnes může trvat i několik dní. Díky automatické predikci a při využití sdílené databáze jsme schopni to zrychlit na hodiny.

A nejde pouze o zrychlení, ale samozřejmě i o zpřesnění samotné analýzy. Mnoho anotačních databází, které se dnes běžně používají bohužel nejsou vhodně normalizované, takže ne všechny výstupy, které z těchto anotačních databází získáváme, jsou validní.  

 

Což je ale docela rizikové ve chvíli, kdy se rozhoduje o diagnóze či terapii pro pacienta…

Ano, je to opravdu velké riziko. Ve zkratce je to tak, že genom dělíme na germinální a somatický. Germinální genom je to, s čím se narodíme a nemůžeme změnit, určuje to naše predispozice. U somatiky sekvenujeme konkrétní nádory například po biopsii a pozorujeme, jakou má DNA strukturu. A podle typu záměny jsme schopni určit, jaké léčivo bude pro ten konkrétní nádor efektivní. Takže interpretace varianty má velký význam, ať už v té somatické nebo v germinální molekulární diagnostice…

 

A na to, že byla v anotační databázi chyba se teoreticky přijde až v momentě, kdy pacient například nereaguje správně na léčbu?  

Může být problém s kvalitou vstupního materiálu, v kvalitě sekvenačních dat, možná také chyba v interpretaci. Samozřejmě nestojí to vše jen na samotné sekvenaci. Důležitou roli hrají onkologové, kliničtí genetici, histolog a další specialisté pro daný typ nádoru.

Dnes ale už roli histologa může zastat ve velké míře NGS a bioinformatika, protože jsme schopní pomocí tzv. metylačních profilů klasifikovat daný nádor mnohdy lépe než klasická mikroskopická metoda.  

 

 

Než se posuneme pryč od GENOVESA, tak ještě jedna zvídavá otázka – proč vlastně název? Jak to vzniklo?

To jsme vymysleli u nás v Bioxsysu, chtěli jsme něco, co bude deklarovat slovo gen, aby bylo jasné, že je to software pro zpracování bioinformatických dat. Mělo to být unikátní, jednoduché a uživatelsky příjemné.

A Genovesa je krásný pacifický ostrov, kde jsou korálové útesy. A vzhledem k tomu, že já mám rád potápění a kolega Josef rád cestuje, tak jsme měli jasno. Slovo gen tam zaznívá a co se týče ostrova Genovesa, máme tam i tu unikátnost a krásu. Takže GENOVESA.

 

A už jste tam byl na tom ostrově?  

Nebyl, zatím jenom prstem na mapě, ale snad se to někdy povede…  

 

Zmiňovali jsme bioinformatiku jako Vaši hlavní specializaci – můžete s námi sdílet, jaký objev v bioinformatice Vás kdy nejvíc ohromil?

Pro mě je bioinformatika spojená hlavně s NGS technologíí, která vznikla díky objevu SBS – Sequencing by Synthesis, se kterou poprvé přišla Illumina kolem roku 2000. Jde o schopnost číst mnoho fragmentů DNA paralelně a vygenerovat tak velké množství tzv. sekvenačních dat, které se skládají z kombinace čtyř písmen ACGT. Tyto data jsou dále bioinformaticky zpracovávaná až dostaneme jednotlivé varianty, nebo-li záměny, které mohou být jednoduše řečeno benigní nebo patogenní.

Šlo o skvělé načasování objevu SBS technologie a vývoje nových algoritmů, které umožnily sekvenační data efektivně zpracovávat a to dalo možnost vzniku modernímu oboru bioinformatika.

 

To znamená, že se to časově sešlo s tím, že jsme s molekulární diagnostikou začínali i tady u nás na BioVendoru?

Já jsem u vás byl tehdy dávat jednodenní kurz o NGS a zpracování dat a na základě toho se pak zrodila naše spolupráce.  

Prvním společným komerčním projektem byla spolupráce během pandemie COVID-19, kdy jsme využili základů GENOVESA. Díky její modularitě jsme byli schopni velmi rychle vytvořit software s komerčním názvem COVID a tím jsme se stali nejúspěšnější na českém trhu. Tři čtvrtiny sekvenačních dat, které se v České republice analyzovaly, šly přes náš software. Byly to de facto vaše kity a naše bioiformatické analýzy.

Více o tomto úspěchu najdete v našem článku na biovendor.group.  

 

Pojďme se ale ještě vrátit k bioinformatice, jaké tři hlavní trendy v bioinformatice aktuálně vnímáte jako zásadní?

Jako první bych uvedl NGS sekvenování a hlavně v poslední době velmi populární tzv. sekvenování dlouhými ready, sekvenace RNA a analýza expresí jednotlivých genů a v neposlední řadě AI, které může velmi efektivně pomoci v predikci patogenních variant.

 

Když jsem podobně zeptala umělé inteligence, uvedla mimo jiné také bioetiku a zabezpečení dat. U toho bych se ráda zastavila s další otázkou…
Jak je u vás řešeno zabezpečení dat? Mohl byste to softwarovým laikům vysvětlit tak, aby se nebáli svěřit nám svoje data při analýze DNA od Genetify?

Velký problém spousty komerčních společností, které NGS data zpracovávají v cloudu je to, že pro analýzu a zálohu dat využívají infrastrukturu například od Googlu nebo Amazonu, což u nás nepřipadá v úvahu.

To je podle mě extrémně nebezpečné, protože posílat data třetí straně pro nás znamená, že nad nimi v ten moment ztrácíme kontrolu a nevíme, kde přesně mohou být uložená.  

U nás disponujeme vlastní výpočetní infrastrukturou a přesně víme, kam ta data putují a kde jsou uložená.

Další věcí je zabezpečení samotného datacentra, které splňuje všechna certifikace pro zabezpečení a ochranu dat.  

Poslední bezpečnostní vrstvou je šifrovaný přístup do GENOVESA včetně využití tzv. bezpečnostních tokenů, což je unikátní dlouhý kód, pomocí kterého se každý uživatel přihlašuje.  

 

A na závěr si povězme, co bude do budoucna klíčové, čím nás může Bioxsys překvapit v příštím roce, v následujících letech?

Náš plán je začít programovat neuronové sítě, které nám pomůžou efektivně interpretovat varianty a propojit s tzv. multi-omics daty. To znamená využití nejenom dat ze sekvenace, ale i proteomická data, metylomová data, RNA-seq data, mikrobiom, integrace dalších sekvenačních technologií jako jsou například long-ready a další…

Propojení takových dat s laboratorním informačním systémem a AI může mít v době personalizované medicíny obrovský benefit nejenom pro pacienta, ale i pro vyšetřujícího lékaře.

 

To zní jak úkol pro Supermana…  

To je, ale je to reálné. To není sci-fi. Možnosti k tomu jsou, víme jak na to, jen se do toho pustit…  

 

Budeme se těšit a držet palce.  

Děkujeme za rozhovor.

 

Buďte v obraze

Pro aktuální informace sledujte naše profily na sociálních sítích.
Nahoru