KidneyNetwork: Wykorzystanie danych dotyczących ekspresji genów pochodzących z nerek do przewidywania i ustalania priorytetów nowych genów zaangażowanych w chorobę nerek Ⅰ

Aug 07, 2023

Badania genetyczne u pacjentów z podejrzeniem dziedzicznościchoroba nerekmoże nie ujawnić genetycznej przyczyny zaburzenia, ponieważ potencjalnie patogenne warianty mogą znajdować się w genach, o których jeszcze nie wiadomo, czy są zaangażowane wchoroba nerek. Opracowaliśmy Kidney Network, która wykorzystuje ekspresję specyficzną dla tkanki, aby informować o priorytetyzacji genów kandydujących, szczególnie w przypadku chorób nerek. KidneyNetwork to nowatorska metoda skonstruowana przez integrację sieci koekspresji sekwencjonowania RNA nerki składającej się z 878 próbek z wielotkankową siecią obejmującą 31 499 próbek. Wykorzystuje wzorce ekspresji i ustalone powiązania gen-fenotyp, aby przewidzieć, które geny mogą być powiązane z fenotypami (choroby) w obiektywny sposób. Zastosowaliśmy KidneyNetwork do rzadkich wariantów w danych sekwencjonowania egzomu od 13 pacjentów z chorobą nerek bez diagnozy genetycznej, aby nadać priorytet genom kandydującym. KidneyNetwork może dokładnie przewidywać funkcje genów specyficznych dla nerek i fenotypy (choroby nerek) dla genów związanych z chorobą. Przecięcie priorytetowych genów z genami niosącymi rzadkie warianty u pacjenta z torbielami nerek i wątroby zidentyfikowało ALG6 jako prawdopodobny gen kandydujący. Wzmacniamy to prawdopodobieństwo, identyfikując warianty ALG6 w kilku przypadkach torbielowatych nerek i wątroby bez alternatywnych wyjaśnień genetycznych. Przedstawiamy KidneyNetwork, publicznie dostępną sieć koekspresji specyficzną dla nerek ze zoptymalizowanymi przewidywaniami genów i fenotypów dla fenotypów chorób nerek.

kidney disease

Zaprojektowaliśmy łatwy w użyciu interfejs online, który umożliwia klinicystom i badaczom korzystanie z danych dotyczących ekspresji genów i współregulacji orazpowiązań gen-fenotyp w celu przyspieszenia postępów w diagnostyce i badaniach dziedzicznej choroby nerek.

OŚWIADCZENIE TRANSLACYJNE:Badania genetyczne u pacjentów z podejrzeniem dziedzicznościchoroba nerekmoże nie ujawnić genetycznej przyczyny zaburzenia pacjenta. Potencjalnie patogenne warianty mogą znajdować się w genach, o których jeszcze nie wiadomo, że są zaangażowane w chorobę nerek, co utrudnia interpretację znaczenia tych wariantów. Ujawnia to wyraźne zapotrzebowanie na metody przewidywania fenotypowych konsekwencji zmienności genetycznej w sposób bezstronny. Tutaj opisujemy KidneyNetwork, narzędzie, które wykorzystuje ekspresję specyficzną dla tkanki do przewidywania funkcji genów specyficznych dla nerek. Zastosowanie KidneyNetwork do grupy niezdiagnozowanych przypadków zidentyfikowało ALG6 jako gen kandydujący w torbielowatej nerce ichoroba wątroby. Podsumowując, KidneyNetwork może pomóc w interpretacji wariantów genetycznych, a zatem może być wartościowy w nefrogenezie translacyjnej i pomóc w poprawie wydajności diagnostycznej u pacjentów z chorobami nerek.

kidney disease

KLIKNIJ TUTAJ, ABY KUPIĆ CISTANCHE NA NERKICHOROBA


WSTĘP

Testy genetyczne u pacjentów z podejrzeniem dziedzicznej choroby nerek mogą ujawnić patogenne warianty przyczynowegeny związane z nerkami. Jednak w wielu przypadkach nie można jeszcze wykryć przyczyny genetycznej. Warianty patogenne w znanych genach związanych z nerkami są wykrywane u około 10–30 procent przebadanych genetycznie pacjentów z przewlekłą chorobą nerek z dowolnej przyczyny [1–3]. Jednak te wartości procentowe są prawdopodobnie niedoszacowaniem liczby pacjentów z przyczyną monogenową, ponieważ warianty genów, które nie są jeszcze zaangażowane w chorobę nerek, pozostaną niezauważone. Potencjalnie szkodliwe warianty mogą znajdować się w tych genach, co utrudnia ustalenie priorytetów i interpretację znaczenia tych wariantów. Dlatego w obecnej erze medycyny genomowej jednym z głównych wyzwań po negatywnym wyniku diagnostycznym w znanych genach jest wykrycie i priorytetyzacja nowych genów kandydujących z potencjalnie patogennymi wariantami, które mogą wyjaśnić chorobę pacjenta [4].

Dane z sekwencjonowania RNA można wykorzystać do przewidywania kandydatageny choroby[5]. Niedawno opracowaliśmy metodę GeneNetwork i GeneNetwork-Assisted Diagnostic Optimization (GADO) w celu nadania priorytetu nowym kandydującym genom chorobowym na podstawie danych z sekwencjonowania RNA [6]. Ideą tej metody jest to, że pewne rzadkie zaburzenia mogą być spowodowane przez warianty kilku genów. Chociaż te geny są różne, zwykle mają podobne funkcje biologiczne. Podczas badania danych dotyczących ekspresji genów z dużej liczby próbek te geny chorobowe zwykle wykazują silną koekspresję [6]. Tak więc, jeśli istnieją inne geny, które ulegają silnej koekspresji ze znanymi genami rzadkich chorób, możliwe jest, że warianty tych innych genów mogą również powodować tę samą chorobę.


Aby tego rodzaju narzędzie działało optymalnie, informacje o koekspresji powinny być jak najdokładniejsze. W przypadku GADO zbudowaliśmy sieć koekspresji genów w oparciu o publicznie dostępne zbiory danych sekwencjonowania RNA z wielu różnych tkanek i wykorzystaliśmy tę sieć do przewidywania, które geny mogą powodować rzadkie choroby. Przewidywania te zostały przeszkolone przy użyciu bazy danych ontologii fenotypów człowieka (HPO) [7]. W bazie danych HPO geny są przypisywane do fenotypów – zwanych terminami HPO – które są oparte na adnotacjach gen-choroba i objawach chorobowych obecnych w bazach danych OMIM [8] i Orphanet [9]. Integrując informacje z bazy danych HPO z siecią koekspresji genów, mogliśmy obliczyć wyniki prognoz dla każdego genu na termin HPO. Razem te wyniki tworzą GeneNetwork. Następnie GADO nadaje priorytet genom, łącząc listę wejściową terminów HPO, które opisują fenotyp pacjenta, z listą genów z możliwymi szkodliwymi wariantami tego pacjenta. Priorytetyzacja listy genów opiera się na połączonych wynikach przewidywania genów dla wejściowych terminów HPO [6].


Ponieważ zauważyliśmy, że wydajność przewidywania GeneNetwork dla fenotypów HPO związanych z nerkami była ograniczona, staraliśmy się poprawić przewidywanie, opracowując sieć specyficzną dla nerek. Zrobiliśmy to, używając 878 próbek sekwencjonowania RNA nerki, które wzbogaciliśmy o istniejący zestaw danych 31 499 próbek z innych tkanek [6]. Opracowując nowy algorytm przewidywania, który może ważyć informacje obecne w obu zestawach danych, poprawiliśmy wydajność ścieżek związanych z nerkami. W tym artykule przedstawiamy powstałą KidneyNetwork, sieć koekspresyjną, której można użyć do dokładnego przewidywania powiązań gen-fenotyp genów nieznanych dla terminów HPO związanych z nerkami. Jako dowód zasady zastosowaliśmy KidneyNetwork do danych sekwencjonowania egzomu od grupy pacjentów z wcześniej nierozwiązanymi chorobami nerek.


METODY

Aby poprawić przewidywanie fenotypów związanych z nerkami, zebraliśmy dane sekwencjonowania RNA pochodzące z nerek, zaktualizowaliśmy GeneNetwork o nowsze referencyjne bazy danych i ulepszone analizy statystyczne, a następnie zintegrowaliśmy informacje specyficzne dla tkanki.


Zestawy danych w KidneyNetwork

Dane dotyczące sekwencjonowania RNA z wybranych próbek nerki różnego pochodzenia, w tym tkanek pierwotnych, nowotworowych i płodowych, połączono z istniejącym zestawem danych wielotkankowego sekwencjonowania RNA, który posłużył jako podstawa dla naszej wcześniej opisanej sieci GeneNetwork [6] (tabela S1, S2) . Zdecydowaliśmy się na włączenie zestawu danych wielu tkanek z dwóch powodów. Po pierwsze, potrzebowaliśmy wystarczającej liczby próbek do zbudowania sieci bazowej. Po drugie, chcieliśmy zachować ekspresję specyficzną dla kilku lub wszystkich typów komórek nerki, ale nie dla innych tkanek. Zrobiliśmy to, ponieważ wyniki fenotypu genu opierają się na różnicach w ekspresji między próbkami; jeśli wszystkie geny mają wysoką (lub niską) ekspresję we wszystkich próbkach objętych analizą, nie dodadzą wystarczających informacji do algorytmu przewidywania. Wielotkankowy zestaw danych próbek do sekwencjonowania ludzkiego RNA użyty do opracowania GeneNetwork został ponownie wykorzystany i przetworzony zgodnie z wcześniejszym opisem [6]. Po wstępnym przetworzeniu ten zestaw danych zawierał 31 499 próbek i 56 435 genów.

3194 próbek zsekwencjonowanych RNA pochodzących z nerek pobrano z Europejskiego Archiwum Nukleotydów (ENA) i Projektu Genotype-Tissue Expression (GTEx) (Uwaga S1). Wstępne przetwarzanie zestawu danych nerki przeprowadzono podobnie do zestawu danych wielotkankowych [6] (Uwaga S2, Uwaga S3). Po selekcji próbek i genów pozostało 58 283 genów i 878 próbek nerek. Zbadaliśmy pozostałe 878 próbek do sekwencjonowania RNA przy użyciu algorytmu grupowania UMAP (uwaga S4).


Filtrowanie HPO. Do budowy KidneyNetwork wykorzystaliśmy asocjacje gen-fenotyp z bazy danych HPO [7] wersja 1268. W bazie danych HPO adnotacja genów do fenotypów zdefiniowanych przez HPO jest oparta na adnotacjach gen-choroba w OMIM [8] map (pobrano 26 marca 2018 r.) oraz plik Orphanet [9] „en_product6.xml” w wersji 1.3.1. Adnotacje gen-choroba w tych bazach danych mogą opierać się na kilku czynnikach, w tym powiązaniach statystycznych i zmianach liczby kopii na dużą skalę. Chcieliśmy wyszkolić KidneyNetwork przy użyciu tylko genów, dla których związek między genem a rzadką chorobą jest dobrze ugruntowany. Dlatego wykluczyliśmy zespoły wielogenowe, ponieważ często nie jest jasne, który z genów w wariantach liczby kopii przyczynia się do fenotypów. Wykluczyliśmy również zwykłe geny podatności (Uwaga S5).


Normalizacja wyrażeń. Po kontroli jakości próbek i genów (QC), macierz ekspresyjną pozostałych próbek i genów transformowano log 2- i normalizowano zliczenia genów przy użyciu DESeq zgodnie z metodą mediany stosunków. Następnie poprawiliśmy dane dotyczące ekspresji genów dla współzmiennych (Uwaga S6).

BEST HERBS FOR kidney disease

Rozkład

Po przefiltrowaniu i kontroli jakości całego zbioru danych kolejnym krokiem było wykonanie dekompozycji w celu obliczenia wektorów własnych zbioru danych (Uwaga S7). Zarówno dla GeneNetwork, jak i sieci regulacyjnej genów opartej na danych pochodzących z nerek, zdefiniowaliśmy optymalną liczbę składników (Uwaga S8). Zidentyfikowano pierwsze 165 wektorów własnych dla GeneNetwork i pierwszych 170 wektorów własnych dla danych pochodzących z nerek i połączono je w większą macierz zawierającą wszystkie 335 wektorów własnych.


Obliczenie wyniku gen-HPO-termin Obliczenie wyniku fenotypu genu przeprowadzono w kilku krokach (ryc. S5). Najpierw przeprowadziliśmy regresję logistyczną, używając połączonych wektorów własnych i pliku adnotacji gen-fenotyp jako danych wejściowych. Wykorzystaliśmy otrzymane wartości i wyniki wektorów własnych do obliczenia wyniku logarytmu genów dla każdego genu w każdym wektorze własnym (Uwaga S9).


image


Aby uniknąć nadmiernego dopasowania wyników logarytmu genów już przypisanych genów, zastosowaliśmy podejście do walidacji krzyżowej typu „pomiń jeden” (Uwaga S10). Logarytmiczne szanse zostały następnie przetłumaczone na wyniki z genów przy użyciu permutowanego rozkładu zerowego dla każdego fenotypu (Uwaga S11).

Aby określić dokładność przewidywania, obliczyliśmy pole pod krzywą ROC (AUC). AUC obliczono dla terminu HPO, stosując przewidywane wyniki z genów i znane adnotacje. Istotność przewidywań obliczono za pomocą dwustronnego testu rang Manna-Whitneya. Po korekcie Bonferroniego predykcję uznano za istotną przy p < 0,05.


Porównanie wydajności predykcji

Porównaliśmy wydajność przewidywania czterech różnych sieci: (1) oryginalna GeneNetwork, (2) zaktualizowana GeneNetwork, (3) specyficzna dla nerek sieć regulacyjna genów oparta wyłącznie na próbkach pochodzących z nerek i wreszcie (4) KidneyNetwork, która łączy dwa ostatnie. Jakość prognoz HPO dokonanych przez te sieci została oceniona na podstawie AUC dla każdego fenotypu związanego z nerkami (tabela S3). Poprawiona jakość sieci została zdefiniowana jako poprawiona dokładność przewidywania terminów związanych z nerkami, które zostały istotnie przewidziane w każdym porównaniu dwóch sieci i przez zwiększoną liczbę istotnie przewidywanych terminów związanych z nerkami. Istotność poprawy dokładności predykcji jednej sieci względem drugiej oceniono za pomocą testu DeLonga [10] zintegrowanego z pakietem pROC R [11].


Zastosowanie KidneyNetwork u 13 pacjentów z podejrzeniem dziedzicznej choroby nerek Jednym z zastosowań KidneyNetwork jest ustalenie priorytetów genów kandydujących u pacjentów z nierozwiązaną chorobą nerek. Aby ocenić to zastosowanie kliniczne, wykorzystaliśmy KidneyNetwork do nadania priorytetu genom kandydującym dla pacjentów z różnymi chorobami nerek przy użyciu metody GADO [6]. GADO łączy prognozy z-score genów renderowane przez KidneyNetwork dla danego zestawu terminów HPO. Geny o połączonym wyniku z Większym lub równym 5 dla unikalnego zestawu terminów HPO związanych z każdym pacjentem uznano za potencjalne geny kandydujące dla tego pacjenta.


BEST HERBS FOR kidney disease

Ryc. 1 Wizualizacja UMAP danych ekspresji pochodzących z nerek. 878 próbek pogrupowano w trzy główne grupy: zdrową tkankę pierwotną (środkową i dolną), próbki rozwojowe (po lewej) i próbki raka nerkowokomórkowego (RCC) (po prawej). Po lewej stronie figury widać skupienie podocytów pochodzących z pluripotencjalnych komórek macierzystych (PSC) i organoidów pochodzących z PSC z pierwotnymi próbkami płodu i komórkami progenitorowymi nefronu. Po prawej stronie skupiska próbek RCC blisko próbek kanalików proksymalnych, a skupisko RCC najbliżej zdrowych próbek tkanek pierwotnych składa się z próbek RCC z niejasnymi komórkami (nccRCC). W środku i na dole próbki zdrowej pierwotnej nerki skupiają się w oparciu o ich tkankę pochodzenia.


U wszystkich 13 pacjentów włączonych do badania podejrzewano monogenową chorobę nerek, ale nie mieli oni diagnozy genetycznej (Uwaga S12). Terminy HPO zostały przypisane do tych przypadków na podstawie ich fenotypu. Dla każdego pacjenta przeanalizowano pełne dane sekwencjonowania egzomu przy użyciu CAPICE [12] w celu zidentyfikowania potencjalnie patogennych wariantów. Geny zawierające warianty z AF filtrującym gnomAD Popmax [13]<0.005 and a recall ≥99%, corresponding with a mild CAPICE cut-off of ≥0.0027, were considered interesting candidates.


Nakładanie się genów zidentyfikowanych przez integrację KidneyNetwork w GADO z genami zidentyfikowanymi przez CAPICE dało listę genów dla każdego pacjenta. Te geny i warianty tych genów zostały ręcznie sprawdzone przez panel ekspertów ds. nefrogenezy (AMvE, LRC, NVAMK) pod kątem ich potencjału patogenetycznego w oparciu o wskaźniki populacji, narzędzia prognostyczne, dostępną literaturę i segregację (Uwaga S13). W przypadku powstałego genu kandydującego zidentyfikowano dodatkowych pacjentów niosących warianty tego samego genu za pośrednictwem współpracowników i projektu 100,{2}} genomów [14]. Zastosowano również narzędzie GeneMatcher [15], które nie przyniosło żadnych dodatkowych pacjentów do 15 lutego 2023 r.


Identyfikacja dodatkowych pacjentów Do oceny rzadkich wariantów wykorzystano wcześniej opisaną kohortę z nierozwiązanymi wielotorbielowatymi chorobami nerek i wątroby [16] (Uwaga S14). Zastosowaliśmy dokładny test Fishera, aby porównać częstość zidentyfikowanych wariantów z europejskim podzbiorem Europejczyków niebędących Finami w bazie danych gnomAD [17]. Ponadto wykorzystaliśmy projekt 100,{5}} genomów [14] do identyfikacji dodatkowych pacjentów na podstawie zidentyfikowanych wariantów (uwaga S15).

28

WYNIKI

Pobieranie danych i grupowanie próbek Wybraliśmy 878 próbek nerek (ryc. S2), które pogrupowaliśmy i wykreśliliśmy za pomocą algorytmu UMAP (ryc. 1). Ogólnie rzecz biorąc, dane gromadzą się w trzech głównych grupach: pierwotne dane dotyczące nerek nienowotworowych, próbki rozwojowe nerek oraz próbki kanalików proksymalnych, kłębuszków nerkowych i próbek raka nerkowokomórkowego (RCC).


KidneyNetwork poprawia przewidywania fenotypów genów Najpierw zaktualizowaliśmy GeneNetwork o zaktualizowaną bazę danych HPO (ryc. S6) i zoptymalizowaliśmy potok budowania sieci genów (ryc. S7). Zmiany te przyniosły poprawę ogólnej sieci GeneNetwork w porównaniu z poprzednią wersją (ryc. S8). Następnie wykorzystaliśmy ulepszony rurociąg do zbudowania sieci regulacyjnej genów specyficznej dla nerek. Zgodnie z oczekiwaniami, biorąc pod uwagę mały rozmiar próbki, ta wersja sieci specyficznej dla nerek działała gorzej niż GeneNetwork (ryc. S9). Następnie połączenie GeneNetwork i sieci koekspresji genów specyficznych dla nerek w KidneyNetwork dało nasze najlepsze wyniki dla terminów HPO związanych z nerkami (ryc. 2A; tabela S5). Przedstawiono wartości AUC predykcji, precyzji, czułości i f{11}}dla każdej przewidywanej ścieżki (tabela S6)


Dwa przykłady ulepszonych terminów HPO związanych z nerkami to hipomagnezemia i nieprawidłowość kanalikowo-śródmiąższowa (ryc. 2B). Wizualizacja tych fenotypów na wykresach gęstości pokazuje wyższy priorytet z-score dla znanych genów związanych z chorobą w porównaniu z genami bez adnotacji. W przypadku nieznanych genów, im wyższy wskaźnik z-score prognozy, tym bardziej prawdopodobne jest, że będą one kandydatem na gen chorobowy. Wizualizacja sieci interakcji genów znanych genów chorobowych w oparciu o wyniki przewidywania ponownie pokazuje wzrost liczby i siły interakcji uzyskanych przy użyciu KidneyNetwork w porównaniu z GeneNetwork.


BEST HERBS FOR kidney disease

Ryc. 2 KidneyNetwork działa lepiej dla terminów HPO związanych z nerkami niż zaktualizowana GeneNetwork. 27 procent fenotypów związanych z nerkami można przewidzieć znacznie lepiej przy użyciu KidneyNetwork w porównaniu z GeneNetwork. B Wykresy gęstości wyników przewidywania genów w ramach dwóch najbardziej ulepszonych fenotypów, hipomagnezemii i nieprawidłowości kanalikowo-śródmiąższowej, pokazują wyższe wartości przewidywania dla genów opisanych dla fenotypu, a także przewidują potencjalne nieznane geny kandydujące. Sieci przewidywane za pomocą KidneyNetwork wykazują więcej i silniejszych korelacji między genami z adnotacjami niż sieci przewidywane za pomocą GeneNetwork.


Zaobserwowaliśmy również wzrost liczby znaczących przewidywanych terminów HPO związanych z nerkami dla KidneyNetwork (n=71) w porównaniu z GeneNetwork (n=63). Doprowadziło nas to do postawienia hipotezy, że KidneyNetwork przewiduje ogólne terminy związane z nerkami z większą dokładnością i dlatego jest w stanie przewidzieć więcej fenotypów związanych z nerkami o wyższym znaczeniu. Sparowany test t pokazuje, że ogólnie wynik HPO AUC był znacznie lepszy dla KidneyNetwork w porównaniu z GeneNetwork (średnia AUC: 0, 76 w porównaniu z 0, 74; wartość p w teście t: 4,5 × 10 −8 ). Wynik ten sugeruje, że KidneyNetwork przewiduje więcej terminów HPO specyficznych dla nerek z wyższą dokładnością przewidywania niż GeneNetwork.


KidneyNetwork nadaje priorytet ALG6 jako genowi kandydata na chorobę u pacjentów z torbielami nerek i torbielami wątroby Aby zbadać użyteczność kliniczną KidneyNetwork, nadaliśmy priorytet genom dla 13 pacjentów z podejrzeniem dziedzicznej choroby nerek, ale bez diagnozy genetycznej i skrzyżowaliśmy je z genami zawierającymi potencjalnie patogenne warianty. Powstałe listy genów zawierały geny kandydujące 1-4 dla 9 z 13 pacjentów (tabela S7). U jednego pacjenta (SAMPLE6) ręczna selekcja tej listy zidentyfikowała ALG6 (ALG6 alfa-1,3-glukozylotransferaza) jako potencjalny gen kandydujący do wyjaśnienia torbieli nerek i wątroby pacjenta (ryc. 3). Łączny wynik z dla ALG6 dla przypisanych terminów HPO był znaczący w KidneyNetwork po wielu korektach testowych (z=5,43). Ten gen zostałby pominięty, gdybyśmy użyli GeneNetwork: tam ALG6 nie osiągnął progu istotności z-score Większy lub równy 5.

BEST HERBS FOR kidney disease

ALG6 jako gen kandydujący dla pacjentów z torbielami nerek i wątroby Wariant ALG6 c.680 plus 2 T > G przenoszony przez SAMPLE6 jest heterozygotyczny. Jest to znany patogenny wariant miejsca składania, który powoduje wrodzone zaburzenie glikozylacji (CDG) typu Ic, gdy patogenne warianty są obecne na obu allelach [18, 19]. ALG6 bardzo przypomina ALG8, który jest zaangażowany w fenotypy torbieli nerek i wątroby [20], a według KidneyNetwork, ALG6 i ALG8 są silnie współregulowane (z-score=8,59).


Biorąc pod uwagę to biologiczne prawdopodobieństwo, przebadaliśmy kohortę 120 niepowiązanych przypadków policystycznych chorób nerek i wątroby pod kątem rzadkich wariantów, MAF <{27}},001, w ALG6. Ta kohorta jest nieznacznie zaktualizowana, ponieważ została wcześniej opisana i została wykluczona przez analizę sekwencjonowania egzomu pod kątem mutacji utraty funkcji lub zgłoszonych patogennych nieobcinanych wariantów w PKD1, PKD2, PRKCSH, SEC63, GANAB, ALG8, ALG9, SEC61B, PKHD1 lub DNAJB11 [16]. Trzy niepowiązane przypadki (YU372, YU378, YU481) zawierały rzadkie warianty ALG6; każdy miał ten sam ALG6 c.257 plus 5 G > Niekanoniczny wariant składania, o którym wiadomo, że jest patogenny dla ALG{21}}CDG i zmieniający splicing in vitro [19, 21]. Pomimo wspólnej mutacji, w każdym z tych trzech przypadków żaden znany członek rodziny dotknięty chorobą nie był zarejestrowany z różnych stanów w Stanach Zjednoczonych i nie są one powiązane z najlepszą granicą wykrywalności przy użyciu algorytmu pokrewieństwa VCFtools2 z _PHI pokrewieństwa < 0,005.


Biorąc pod uwagę reprezentację tego wariantu w trzech przypadkach pochodzenia europejskiego w tej zdefiniowanej fenotypowo kohorcie, porównaliśmy jego częstość w europejskim podzbiorze przypadków (n=105) z niefińskimi Europejczykami w gnomAD [17] z pokryciem w ta pozycja (n=64,466) [17]. W kohorcie pacjentów 3 z 210 alleli zawierało ten wariant, podczas gdy w kohorcie gnomAD, niewyselekcjonowanej pod względem obciążenia torbielami nerek lub wątroby, stwierdzono go w 121 ze 128 932 alleli. To około 10-krotne wzbogacenie jest statystycznie istotne według dokładnego testu Fishera, p=0,0011. Mutacja ta powtarzała się również w przypadkach ALG6-CDG [19].


Zbadaliśmy również zestaw danych 100,{1}} Genomes Project [14] i skontaktowaliśmy się ze współpracownikami, którzy zidentyfikowali trzy dodatkowe dane do zastosowania w chorobach nerek. Znaczny odsetek pacjentów z podejrzeniem genetycznej choroby nerek pozostaje bez diagnozy genetycznej, ponieważ listy genów chorób dla wielu schorzeń są niekompletne. Identyfikacja genów zaangażowanych w chorobę nerek jest niezbędna do poprawy wydajności diagnostycznej u pacjentów z chorobą nerek oraz do badania patogenezy choroby w celu podejścia do możliwości leczenia. Ustalenie nowych genów chorobowych wymaga starannej walidacji biologicznej. Implikowanie genów godnych takich badań ma kluczowe znaczenie. Zastosowanie KidneyNetwork w połączeniu z danymi WES lub GWAS przez nefrologów, genetyków klinicznych lub badaczy pomoże każdej z tych grup uczestniczyć w implikacji genów. KidneyNetwork łączy sieć koekspresji opartą na zbiorze danych próbki nerki z wcześniej opublikowanym zbiorem danych wielotkankowych wykorzystywanym do tworzenia prac GeneNet. Połączenie zestawów danych w KidneyNetwork poprawiło przewidywania fenotypów związanych z chorobą nerek w porównaniu z sieciami opartymi na dwóch zestawach danych oddzielnie. Jako dowód na zasadę, pokazujemy, że lista genów kandydujących dla połączonego fenotypu torbieli nerek i wątroby wygenerowana przez KidneyNetwork nadała priorytet możliwej do zarządzania liście genów kandydujących z długiej listy genów zawierających rzadkie warianty u naszego pacjenta z tym fenotypem.

Zbadaliśmy również zestaw danych 100,000 Genomes Project [14] i skontaktowaliśmy się ze współpracownikami, którzy zidentyfikowali trzech dodatkowych pacjentów z torbielami nerek i/lub wątroby niosącymi heterozygotyczny potencjalnie szkodliwy wariant w ALG6, bez alternatywnego wyjaśnienia genetycznego.

image

Ryc. 3 Sieć nerek włączona do metody GADO u SAMPLE6, pacjenta z torbielami nerek i wątroby. 89 genów kandydujących ze wszystkich genów zostało nadanych priorytetowo przez KidneyNetwork przy użyciu GADO, w oparciu o terminy HPO „torbiele nerek” (HP:0000107) i „torbiele wątroby” (HP:0001407). Metoda interpretacji danych sekwencjonowania egzomu CAPICE dostarczyła 322 genów zawierających potencjalnie patogenne warianty w danych sekwencjonowania egzomu pacjenta. Podczas nakładania się tych list genów zidentyfikowano trzy geny, które spełniały kryteria selekcji, z których jeden to ALG6.


W sumie zidentyfikowaliśmy siedmiu pacjentów ze znanymi wariantami miejsca splicingu, o których zgłoszono, że powodują choroby u ciężko dotkniętych pacjentów CDG po homozygotyczności lub złożonej heterozygotyczności oraz jednego pacjenta z prawdopodobnym patogennym wariantem miejsca splicingu (Tabela 1). W przeciwieństwie do poważnie dotkniętych pacjentów z ALG6-CDG (z zajęciem wielu narządów, w tym opóźnieniem rozwoju i licznymi objawami neurologicznymi), nasi pacjenci prezentowali fenotyp licznych torbieli nerek i/lub torbieli wątroby (ryc. 4). . Chociaż PCLD może być rozległa, fenotyp nerek wydaje się łagodny i nie odnotowano spadku eGFR pomimo zaawansowanego wieku (tj. jedna pacjentka ma trzydzieści kilka lat, pozostali mają od 45 do 80 lat). Ponadto odkryliśmy, że wariant ALG6 segregował u kilku członków rodziny, którzy również byli dotknięci (tabela 1; ryc. 4).


Usługa pomocnicza:

E-mail:wallence.suen@wecistanche.com

Whatsapp/Tel: plus 86 15292862950


Sklep:

https://www.xjcistanche.com/cistanche-shop












Może ci się spodobać również