Obrana će se održati:
PONEDJELJAK, 30. rujna 2024. godine u 10.15 sati
u dvorani P1 Kemijski odsjek, PMF, Horvatovac 102 a, Zagreb
Disertacija nosi naslov:
Influence of genomic characteristics on the optimization of models for tumor cell-of-origin prediction
Utjecaj genomskih karakteristika na optimizaciju modela za predviđanje ishodišne stanice tumora
Povjerenstvo za obranu rada:
prof. dr. sc. Kristian Vlahoviček, red. prof. u trajnom izboru, Prirodoslovno-matematički fakultet, Zagreb
prof. dr. sc. Inga Urlić, Prirodoslovno-matematički fakultet, Zagreb
nasl. doc. dr. sc. Petar Ozretić, viši znan. suradnik, Institut Ruđer Bošković, Zagreb
Zamjena: dr. sc. Goran Gajski, viši znan. suradnik, Institut za medicinska istraživanja i medicinu rada Zagreb
Mentor: izv. prof. dr. sc. Rosa Karlić, Prirodoslovno-matematički fakultet, Zagreb
Summary:
Identifying the cell-of-origin (COO) for tumors of unknown primary site is crucial for selecting effective therapies, but the heterogeneity and unique genomic profiles of these cancers make accurate prediction by machine learning models challenging. In this study, I analyzed how various genomic features influence COO prediction by using different machine learning models based on the mutational landscapes and epigenetic characteristics of normal tissues in distinct genomic features. The analysis of breast, liver, and skin melanoma cancers revealed significant differences of their mutational landscapes, and their influence on COO model accuracy. APOBEC mutations in early-replicating regions associated with kataegis were linked to poorer COO predictions in breast cancer. Including protein-coding genes and topologically associated domains can also be used for reliable COO predictions and identification of under-predicted genes with potential roles in tumorigenesis. While whole-exome sequencing and RNA-seq mutations aid COO identification, they are less accurate than whole-genome sequencing. Overall, the tumor's complex genomic landscape significantly affects COO prediction accuracy.
Sažetak:
Određivanje ishodišne stanice tumora (engl. cell-of-origin, COO) ključno je za odabir učinkovitih terapija. Međutim, heterogenost i jedinstveni genomski profili ovih tumora čine njihovu preciznu identifikaciju pomoću modela strojnog učenja izazovnom. U ovom radu analizirala sam kako različite genomske značajke utječu na predviđanje COO koristeći različite modele strojnog učenja temeljene na mutacijskim krajolicima i epigenetskim karakteristikama normalnih tkiva. Analizom tumora dojke, jetre i melanoma kože otkrivene su značajne razlike u njihovim mutacijskim krajolicima te njihov utjecaj na točnost modela za predviđanje COO. APOBEC mutacije koje se pojavljuju u rano replicirajućim regijama i povezane sa žarištima mutacija, pokazale su lošiju točnost predviđanja COO kod tumora dojke. Geni za kodiranje proteina i topološki povezane domene također se mogu koristiti za pouzdana predviđanja COO, kao i za identifikaciju gena s premalim brojem predviđenih mutacija, koji imaju potencijalnu ulogu u tumorigenezi. Iako mutacije dobivene sekvenciranjem cijelog egzoma i transkriptoma pomažu u identifikaciji COO, one su manje točne od mutacija dobivenih sekvenciranjem cijelog genoma. Sveukupni rezultati ukazuju na to da kompleksni genomski krajolik tumora značajno utječe na točnost predviđanja COO.