W kierunku wspólnej wizji danych genetycznych raka

W ciągu ostatnich 2 lat National Cancer Institute (NCI), University of Chicago, Ontario Institute for Cancer Research oraz Leidos Biomedical Research opracowywały system informacyjny o nazwie NCI Genomic Data Commons (GDC) (patrz rysunek). GDC będzie początkowo zawierał surowe dane genomiczne, a także dane diagnostyczne, histologiczne i kliniczne z projektów finansowanych przez NCI, takich jak Atlas Genomu Raka (TCGA) i Terapeutycznie Stosowane Badania w celu Generowania Skutecznych Traktowań (TARGET). W przeciwieństwie do poprzednich wersji tych zestawów danych, dane genomowe będą zharmonizowane przy użyciu jednolitych rurociągów analitycznych w celu dopasowania surowych danych sekwencjonowania do genomu i identyfikacji mutacji, zmian liczby kopii i zmian ekspresji genów. Społeczność badawcza może uzyskać dostęp do GDC za pośrednictwem interaktywnego portalu (https://gdc-portal.nci.nih.gov), systemy komputerowe mogą wchodzić w interakcje za pośrednictwem interfejsu programowania aplikacji GDC, a programiści mogą sugerować nowe funkcje oparte na otwartym kodzie GDC kod.

Niezwykłą i potężną cechą GDC jest to, że wszyscy naukowcy będą mogli przesłać swoje dane genomiczne na temat raka i korzystać z systemowych potoków obliczeniowych systemu, o ile wyrażą zgodę na szerokie udostępnianie swoich danych. GDC doda wartość do własnego projektu naukowca, zapewniając dostęp do najnowocześniejszych narzędzi bioinformatycznych, a dane badacza będą stopniowo zwiększać moc interpretacyjną GDC. System umożliwia badaczom spełnienie standardów dostępu do danych do publikacji w czasopismach naukowych oraz wymagań polityki Genomic Data Sharing Narodowego Instytutu Zdrowia (NIH) i wykorzystuje bazę danych systemu genotypów i fenotypów (dbGaP) w celu zapewnienia odpowiednich danych używać zgodnie z określonymi w dokumentach świadomej zgody.

Oczywiście, udostępnianie danych będzie miało decydującą rolę w precyzyjnej onkologii. Godnym celem wyznaczonym przez Instytut Medycyny jest opracowanie nowej taksonomii choroby opartej na patogenezie molekularnej. Ułatwiając dzielenie się danymi genomicznymi i klinicznymi dotyczącymi raka, GDC zbierze informacje potrzebne społeczności badawczej i medycznej, aby zbudować nową taksonomię molekularną nowotworów o przydatności klinicznej. Analiza aktualnych zestawów danych genomicznych raka sugeruje, że wciąż jesteśmy dalecy od odkrycia wszystkich zmian genetycznych, które promują złośliwe fenotypy, które są znane jako sterowniki raka. Te obliczenia sugerują, że w celu odkrycia genów, które nabywają mutacje kierowcy w 2% lub więcej pacjentów z nowotworem należy poddać analizie ponad 100 000 nowotworów.1 Występowanie czynników rakotwórczych następuje po dystrybucji długiego ogona, co oznacza, że ​​zdarzenia powodujące choroby u wielu pacjentów z rakiem nie są powszechnymi allelami, takimi jak BRAF V600E we krwi. czerniaka, ale są raczej rzadkimi allelami, z których wiele nie zostało jeszcze opisanych.

Potrzeba zidentyfikowania takich rzadkich czynników rakotwórczych jest oczywista: dla każdego pacjenta z rakiem wykrycie rzadkiego genetycznego kierowcy może być kluczem do pomyślnej terapii. Na przykład, translokacja i nadekspresja genu ROS1 występuje w około 1% gruczolakoraków płucnych, a drobnocząsteczkowe inhibitory ROS1 mogą indukować całkowitą lub częściową odpowiedź u wielu pacjentów dotkniętych chorobą.2 Współwystępowanie mutacji w rzadkich podgrupach raka może ograniczać skuteczność pojedynczych celowanych leków, takich jak wemurafenib, ale w niektórych przypadkach problem można przezwyciężyć za pomocą kombinacji leków.3. Heterogeniczność kliniczna ludzkich nowotworów zależy również od różnorodności epigenetycznej. Na przykład, odpowiedź rozlanych dużych chłoniaków z limfocytów B na czynniki celowane można przewidzieć za pomocą profili ekspresji genów.4 Dlatego też, aby uzyskać molekularny opis raka, który ma maksymalny kliniczny wpływ, wymagane są liczne metody genomowe.

Od początku genomiki nowotworowej widoczna jest wartość udostępniania danych. Po pierwsze, złożoność danych genomicznych nieuchronnie oznacza, że ​​tylko niewielka część danych zawartych w danych może zostać zgłoszona w jednej publikacji. Po drugie, naukowcy nie mogą realistycznie wygenerować w ramach jednego projektu wszystkich danych genomicznych niezbędnych do wyciągnięcia ważnych wniosków, ale mogą wzbogacić swoje badania poprzez ponowne wykorzystanie danych genomicznych z innych projektów.

Jednak głównym wyzwaniem dla naukowców pracujących z zestawami danych genomicznych raka jest ich sama wielkość. Sam zestaw danych TCGA ma ponad petabajt wielkości i składa się z ponad 575 000 plików. Samo pobranie danych za pomocą połączenia 10 Gb / s zajęłoby ponad 3 tygodnie. Stworzenie bezpiecznej, zgodnej infrastruktury o wystarczającej skali do przechowywania i analizy danych jest nie tylko technicznie trudne, ale także kosztowne. W 2016 r. Sprzęt komputerowy wymagany do analizy nieprzetworzonych danych sekwencjonowania TCGA kosztował ponad 1 milion USD, nie uwzględniając kosztów utrzymania systemów, bezpieczeństwa i zgodności, które są konieczne przy pracy z ludzkimi danymi genomicznymi i klinicznymi. GDC rozwiązuje te bariery logistyczne i ekonomiczne poprzez demokratyzację dostępu do danych dotyczących genomiki raka , umożliwiając naukowcom wprowadzanie ich hipotez do danych. Niedawna eksplozja analizy genomu raka pozostawiła po sobie ślad niejednoznaczności danych, którą należy rozwiązać i poprawić. Często badania genomu są publikowane bez podawania przez autorów surowych danych z sekwencjonowania w publicznym repozytorium, co uniemożliwia ocenę ważności zgłoszonych aberracji genetycznych. Identyfikacja somatycznych zmian genetycznych w próbkach raka jest wyzwaniem ze względu na zmienny udział niezłośliwych komórek, zmiany liczby kopii genu i obecność subklonów nowotworowych. Podobnie, opis zmian liczby kopii i kwantyfikacja ekspresji genów nie zostały ujednolicone, co stanowi problem dla naukowców próbujących porównać dane z różnych badań. GDC rozwiązuje te problemy, stosując proces harmonizacji, w którym surowe odczyty sekwencyjne są przetwarzane przez jednorodne rurociągi analityczne i zapewnia wyniki z wielu metod analitycznych, gdy nie ma jednego standardu. Ponieważ sekwencja ludzkiego genomu jest dalej dopracowywana i opisywana, a wraz z rozwojem lepszych rurociągów analitycznych, GDC będzie reharmonizować całą zawartość genomu. GDC jest podstawą wieloletniego wysiłku NCI w celu stworzenia nowej taksonomii molekularnej raka, która dostarcza informacji prognostycznych. i przewiduje reakcję lub oporność na określone terapie. Projekt ten będzie wymagał analizy danych pochodzących z badań klinicznych z wbudowaną genomiką oraz z eksperymentów laboratoryjnych, które przypisują fenotypy biologiczne poszczególnym wariantom raka, a także opracowaniu nowych metod integracji wielu klinicznych i molekularnych typów danych. Osiągnięcie tego celu zostanie znacznie ułatwione dzięki genomowemu udostępnianiu danych za pośrednictwem GDC, który będzie wymagany dla wszystkich naukowców wspieranych przez NCI i powinien okazać się atrakcyjny dla każdego badacza, którego badania mogłyby skorzystać z narzędzi GDC. Dane genomowe i kliniczne z badań precyzyjnych leków sponsorowanych przez NCI, takich jak badanie NCI Molecular Analysis for Therapy Choice (MATCH), zostaną udostępnione za pośrednictwem GDC, dzięki czemu naukowcy będą mogli poznać molekularne podstawy odpowiedzi i oporności na wiele ukierunkowanych agentów. badane. NCI oczekuje, że badacze podzielą się danymi z badań klinicznych, jak opisano w ostatnim artykule5 i sądzi, że GDC będzie odpowiednim miejscem do wymiany danych z badań klinicznych wspieranych przez NCI. Wraz ze wzrostem liczby przypadków w GDC dane z GDC mogą dostarczyć dowodów na to, że leki działają w podtypach raka, które są zbyt rzadkie, aby można je było rozpoznać w mniejszych kohortach badań klinicznych. GDC może szybko się rozwinąć, ponieważ nabycie danych genomowych staje się rutynowe w trakcie leczenia. opieki nad rakiem. Z czasem możliwe będzie, że poszczególni pacjenci staną się dawcami informacji o nowotworach i pozwolą na dzielenie się ich danymi genomicznymi za pośrednictwem GDC. Mechanizmy umożliwiające takie dawstwo opracowywane są w ramach programu kohorty Inicjatywy NIH Precision Medicine Initiative. Biorąc pod uwagę odpowiednie systemy świadomej zgody, GDC może identyfikować pacjentów z rzadkimi podtypami molekularnymi nowotworów, z którymi można się skontaktować w celu potencjalnego udziału w badaniach klinicznych odpowiednich dla ich konkretnego raka. Po tym czasie zasady i praktyka precyzyjnej onkologii zostaną przyspieszone poprzez dzielenie się danymi z tysiące pacjentów z rakiem. Mamy nadzieję, że GDC zostanie wykorzystany przez naukowców, klinicystów, agencje regulacyjne, pacjentów i inne zainteresowane strony jako środek do osiągnięcia tego celu.
[podobne: anastrozol, flexagen, oprogramowanie stomatologiczne ]
[więcej w: złamanie kompresyjne kręgosłupa, skala depresji hamiltona pdf, hiv telefon zaufania ]