Opracowanie i weryfikacja indeksu ryzyka w celu przewidywania przeżycia przeszczepu nerki: indeks ryzyka przeszczepu nerki

Mar 04, 2022

edmund.chen@wecistanche.com

Wstęp

Przeszczep nerkioferuje lepszą jakość życia i lepsze przeżycie w porównaniu do innychnerkametody terapii zastępczej [1]. Jednak systemy opieki zdrowotnej na całym świecie walczą o wypełnienie rosnącej przepaści między wysokim popytem naprzeszczepy nerkii ograniczona podaż. Jedna strategia to kierowanienerkaprzeszczepów do biorców o największej długości życia, zmniejszając tym samym zarówno liczbę niepowodzeń przeszczepu, jak i liczbę pacjentów umierających z funkcjonującym przeszczepem [2]. Modele przewidywania ryzyka, przewidujące niepowodzenie przeszczepu przed przeszczepem, stanowią wsparcie kliniczne w złożonym podejmowaniu decyzji dotyczących dopasowywania biorców o największej długości życia i przeszczepów allogenicznych o niskim ryzyku niepowodzenia. Istnieje kilkanerkadostępne w literaturze modele przewidywania ryzyka przeszczepu, które wspomagały podejmowanie decyzji medycznych w oparciu o dowody w praktyce klinicznej [3, 4]. TheNerkaWskaźnik ryzyka dawcy (KDRI) opracowany przez Rao i in. w 2009 r. ma szerokie zastosowanie w podejmowaniu decyzji klinicznych [3] i jest stosowany w USANerkaSystem alokacji [5]. Wskaźnik C, który wskazuje zdolność modelu predykcyjnego do odróżniania przeszczepów przetrwałych dłużej od przeszczepów przetrwających krócej, jest jednak 0.62, wartością oznaczającą jedynie rozsądne rozróżnianie. Nowatorskie podejścia oparte na statystyce lub metodach uczenia maszynowego mogą potencjalnie dostarczać dokładniejszych prognoz [6].

Uczenie maszynowe szybko ewoluowało w ostatnich dziesięcioleciach i jest już stosowane w niektórych obszarach diagnostyki medycznej [7]. Niedawny przegląd systematyczny przeprowadzony przez naszą grupę podkreślił rolę modeli przewidywania ryzyka opartych na uczeniu maszynowym w podejmowaniu decyzji medycznych, co prowadzi do dokładniejszegoprzeszczep nerkiprzewidywania wyników [8]. W naszym przeglądzie stwierdzono jednak, że modele, inne niż te opracowane w Stanach Zjednoczonych, były powszechnie uzyskiwane z próbek o wielkości mniejszej niż 1 000 pacjentów. Ponadto żaden z opracowanych do tej pory modeli uczenia maszynowego nie modelował czasu do zdarzenia (przeżycia) [8]. Zamiast tego większość używała binarnego wyniku niepowodzenia lub nie. Jednak podejście binarne traktuje przeszczep, który przetrwa jeden rok, jest równy przeszczepowi, który nie powiódł się po dwóch latach, co znacznie różni wyniki dla pacjenta i systemu opieki zdrowotnej. Modele te nie uwzględniają strat związanych z kontynuacją. Dlatego włączenie dynamiki czasu do zdarzenia w modelu predykcyjnym daje dodatkowe informacje istotne z klinicznego i ekonomicznego punktu widzenia [9]. Naszym celem było opracowanie i walidacja modeli predykcyjnych statystycznych i uczenia maszynowego do przewidywania niepowodzenia przeszczepu po zmarłym dawcyprzeszczep nerki,przy użyciu danych czasu do zdarzenia w dużym krajowym zbiorze danych z Australii.

Słowa kluczowe:Przewidywanie ryzyka, uczenie maszynowe, niepowodzenie przeszczepu, przeszczep nerki, nerka 

MetodyProtokół tego badania został zrecenzowany i opublikowany [10]. W skrócie, trzy modele uczenia maszynowego (drzewo przetrwania[11], losowy las przetrwania[12] i maszyna wektorów nośnych przetrwania[13]) oraz jeden tradycyjny model regresji (regresja Coxa[14]) czasu do zdarzenia (czasu przeżycia) zostały wygenerowane. Niniejsze badanie zostało opisane przy użyciu metodologii Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis (TRIPOD)[15]. Źródłem danych kohorty badawczej Te były Australia i Nowa Zelandia Dialysis and Transplant Registry (ANZDATA)[16]. Gromadzi i raportuje częstość występowania, częstość występowania i wyniki dializy orazprzeszczep nerkipacjentów w całej Australii. Zbiór danych zawierał cechy dawcy i biorcy 7,365nerkatylko przeszczepy od zmarłych dawców od 1 stycznia 2007 r. do 31 grudnia 2017 r. przeprowadzone w Australii.

cistanche-kidney disease-5(53)

CISTANCHE POPRAWI CHOROBY NEREK/NEREK

WynikPierwszorzędowym wynikiem był czas do niepowodzenia przeszczepu, począwszy od daty przeszczepienia. Pacjenci, którzy zmarli z funkcjonującym przeszczepem, zostali uwzględnieni i zostali ocenzurowani w momencie śmierci. Pacjenci z funkcjonującym przeszczepem pod koniec okresu badania zostali poddani cenzurze prawostronnej 31 grudnia 2017. Sześćdziesięciu pięciu pacjentów (0,9 procent) zostało utraconych z obserwacji i zostały ocenzurowane z prawej strony w ostatnim znanym terminie obserwacji. Zmienne niezależne Naszym celem było opracowanie wskaźnika ryzyka do wykorzystania w podejmowaniu decyzji przed przeszczepem, dlatego wykorzystaliśmy tylko zmienne dostępne przed przeszczepem oraz zmienne raportowane w ANZDATA we wszystkich grupach pacjentów. W sumie zidentyfikowano 67 możliwych zmiennych niezależnych, zarówno cech biorcy, jak i dawcy[17].

Rozwój modelubył procesem sekwencyjnym z następującymi pięcioma etapami: przygotowanie danych, podzielenie zbioru danych na zestawy danych uczących i walidacyjnych, wybór zmiennych, uczenie modelu i ocena modelu (rys. 1).

Krok 1: Przygotowanie danych Przed opracowaniem modelu dane były przetwarzane poprzez: traktowanie brakujących wartości, fikcyjne kodowanie zmiennych kategorialnych oraz skalowanie zmiennych ciągłych. Zbiór danych zawierał prawie 500000 punktów danych (7365 pacjentów × 67 zmiennych niezależnych) i brakowało 2,5 procent punktów danych. W większości zmiennych (64 proc.) brakowało mniej niż 1 proc. W przypadku zmiennych z brakami danych zastosowano wielokrotne imputacje dla 14 zmiennych kategorycznych i 17 zmiennych ciągłych z losowym hot deckiem i drzewami klasyfikacji i regresji (CART) przy użyciu pakietu R „simputacja”[18] z pełnym zbiorem danych 7365 pacjentów. Na podstawie opinii eksperta brakom wartości 13 zmiennych kategorycznych przypisano osobną kategorię „braków”, aby uniknąć utraty danych. Numeryczne zmienne niezależne znormalizowano za pomocą skalowania min-maks, przekształcając je na podobną skalę w celu uproszczenia porównań między zmiennymi[19]. Zmienne kategorialne zostały zakodowane fikcyjnie w kategorie nominalne. Po kodowaniu pozornym łączna liczba zmiennych niezależnych wynosiła 98.

Krok 2: Dane dotyczące szkolenia i walidacjiZbiór danych został losowo podzielony na dwie części: zbiór danych uczących i zbiór danych walidacyjnych. Zestaw uczący, używany do uczenia czterech modeli predykcyjnych, zawierał 70 procent danych (n=5,156). Zestaw walidacyjny (n=2,209) został wykorzystany do solidnego przetestowania mocy predykcyjnej każdego modelu. Posiadanie oddzielnego zestawu do walidacji zapewniło bardziej realistyczne szacunki dokładności prognozowania modeli i pomogło uniknąć nadmiernego dopasowania.

image

Krok 3: Wybór zmiennychWażnym krokiem w procesie budowania modelu jest wybór oszczędnego zestawu zmiennych predykcyjnych z dużego zestawu dostępnych zmiennych niezależnych (n=98). Zbyt wiele niezależnych zmiennych w modelu grozi nadmiernym dopasowaniem, co z kolei zmniejsza moc predykcyjną[20]. Do wyboru zmiennych niezależnych użyto metod drzewa: 1. Opinia eksperta: Doświadczeni nefrolodzy w drzewie dokonali przeglądu potencjalnego zestawu zmiennych niezależnych i wskazali, czy zmienna ma znaczenie kliniczne. Uznano, że porozumienie co najmniej dwóch ekspertów jest wystarczające do włączenia zmiennej do modelu. 2. Analiza głównych składowych [21] zmniejsza wymiarowość zbioru danych poprzez przekształcenie go na mniejszą liczbę głównych składowych w oparciu o korelacje między zmiennymi. Ten zestaw komponentów idealnie zachowuje większość wariancji, dzięki czemu nie traci informacji, ale robi to przy użyciu mniejszej liczby zmiennych. Wykorzystaliśmy liczbę głównych składników, które zachowały 90 procent pierwotnej wariancji. 3. Elastyczne transakcje netto modelu ft i złożoności w celu znalezienia oszczędnego modelu. Analizuje szereg modeli wykorzystujących kary, aby uniknąć nadmiernego dopasowania, od braku kary (regresja Ridge'a - L2) do skrajnej kary (regresja Lasso - L1), aby znaleźć idealny punkt kompromisu kar za pomocą walidacji krzyżowej[22]. . Wartości L1 i L2, które dawały najmniejszy błąd średniokwadratowy podczas walidacji krzyżowej, wykorzystano do dopasowania modelu sieci elastycznej. Te metody doboru zmiennych indywidualnych stosowano samodzielnie, a także we wszystkich możliwych kombinacjach, np. ekspertyzę, a następnie elastyczną siatkę. Dlatego do wygenerowania siedmiu różnych zestawów zmiennych niezależnych wykorzystano łącznie siedem metod selekcji zmiennych.

Krok 4: Szkolenie modeloweZastosowaliśmy cztery podejścia do modelowania czasu do zdarzenia podstawowego, tj. wyniku przeżycia. Regresja proporcjonalna Coxa[14]. Ten półparametryczny model jest szeroko stosowany do badania relacji między wynikami, takimi jak dane dotyczące przeżycia i zmiennymi niezależnymi. Po modelowaniu wybranych zmiennych niezależnych zmniejszono liczbę zmiennych poprzez uwzględnienie tylko tych, które były istotne statystycznie (p<0.05).  this="" made="" the="" model="" more="" parsimonious="" and="" also="" improved="" predictive="" power.="" survival="" tree[11].="" a="" survival="" tree="" is="" a="" tree-like="" structure,="" where="" leaves="" represent="" outcome="" variables,="" i.e.="" graft="" failure="" (1)="" or="" no="" graft="" failure="" (0),="" and="" branches="" are="" independent="" variables="" that="" influence="" the="" timing="" of="" the="" outcome.="" the="" complexity="" parameter="" was="" set="" to="" 0.00001="" and="" the="" following="" two="" hyper-parameters="" were="" regularized="" until="" the="" optimal="" tree="" was="" created:="" the="" minimum="" number="" of="" samples="" that="" must="" exist="" in="" a="" node="" in="" order="" for="" a="" split="" to="" be="" attempted,="" and="" the="" number="" of="" competitors="" splits="" retained="" in="" the="" output.="" random="" survival="" forest="" (rsf)="" [12].="" rsf="" is="" an="" ensemble="" method="" where="" numerous="" unpruned="" survival="" trees="" are="" developed="" via="" bootstrap="" aggregation[23,="" 24].="" te=""  'variable="" importance'="" was="" set="" to="" "permutation"="" and="" the="" splitting="" rule="" to="" "log-rank".="" te="" hyper-parameters,="" a="" number="" of="" variables="" to="" possibly="" split="" at="" each="" node,="" a="" number="" of="" trees="" and="" a="" minimum="" number="" of="" nodes="" were="" regularised="" to="" achieve="" the="" lowest="" out-of-bag="" prediction="" error.="" 'variable="" importance',="" a="" variable="" selection="" algorithm="" widely="" used="" in=""  rsf,="" was="" used="" to="" avoid="" overfitting="" and="" to="" reduce="" the="" prediction="">

Maszyna wektorów nośnych przetrwania[13]. Wykorzystuje hiperpłaszczyzny do tworzenia klas zmiennych niezależnych z liniowo (np. funkcja jądra liniowego) lub nieliniowo separowalnymi danymi (np. jądro wielomianowe) [26, 27]. W oparciu o wydajność modelu wszystkie modele maszyn wektorów nośnych zostały dopasowane przy użyciu liniowej funkcji jądra z modelem wektorów nośnych przetrwania typu „regresja”. Do trenowania i walidacji czterech modeli predykcyjnych wykorzystano siedem zestawów zmiennych niezależnych, które dały 28 wyników: siedem metod selekcji zmiennych × cztery modele predykcyjne. Przewidywanym wynikiem dla każdego z czterech modeli był wskaźnik na skali interwałowej, który nazywamyPrzeszczep nerkiIndeks ryzyka.

cistanche-kidney failure-5(47)

CISTANCHE POPRAWI NIEWYDOLNOŚĆ NEREK/NEREK

Krok 5: Ocena modeliOceniliśmy modele za pomocą metod zaproponowanych przez Roystona i Altmana[28]. Wydajność modelu została oceniona za pomocą dwóch metryk: dyskryminacji i kalibracji. Indeks z dobrą dyskryminacją powinien mieć wyższe oceny ryzyka dla pacjentów z wyższym ryzykiem i odwrotnie. Kalibracja mierzy dokładność przewidywania, porównując dokładność przewidywanego przeżycia ze wskaźnika z przeżyciem w obserwowanych danych [29]. W naszym badaniu dyskryminacja celów jest ważniejsza niż kalibracja, ponieważ naszym celem jest dostarczenie wskazówek dotyczących podejmowania decyzji, które identyfikują pacjentów o stosunkowo wysokim i niskim ryzyku [28]. Dlatego też najlepszy model został wybrany przy użyciu wskaźnika zgodności (C-index)[30], wskaźnika oceniającego zdolność dyskryminacyjną modelu. Te C-index definiuje się jako ułamek par pacjentów, u których pacjent, który ma dłuższy czas przeżycia, ma również niższy przewidywany wynik ryzyka. Zakres zgodności wynosi od zera do jednego, przy czym wyższa wartość wskazuje na lepszą wydajność, a 0,5 wskazuje na przypadkową dyskryminację.

Stosując metody oceny Roystona i Altmana, wskaźniki najlepiej dopasowanych modeli podzielono na cztery grupy w 16., 50. i 84. centylu, aby opracować cztery grupy prognostyczne: dobre, dość dobre, dość słabe i słabe. Zastosowanie grup o nierównej wielkości poprawiło rozróżnienie pacjentów między czterema grupami i grupowanych pacjentów o podobnym ryzyku [28]. Przeżycie tych czterech grup porównano za pomocą wykresów Kaplana-Meiera, które w idealnym przypadku powinny wykazywać dużą różnicę w przeżyciu między czterema grupami.

Kalibrację oceniono wizualnie przy użyciu najlepiej dopasowanego modelu Coxa. Do oszacowania przewidywanego i obserwowanego średniego przeżycia po 3 i 5 latach od przeszczepu zastosowano próbki z użyciem bootstrap [31]. Doskonała zgodność między przewidywaną i obserwowaną średnią przeżywalnością wskazuje na doskonale skalibrowany model predykcyjny. Najlepszy model predykcyjny porównano ze zdolnością predykcyjną KDRI, która jest obecnie modelem używanym przez wielu decydentów klinicznych. Test KDRI ma 14 zmiennych związanych z dawcą i przeszczepem i został opracowany przy użyciu regresji Coxa do przewidywania całkowitej niepowodzenia przeszczepu. Zmienne zostały wybrane przez stopniowe usuwanie zmiennych nieistotnych[3], a ta metoda wyboru modelu ma wiele ograniczeń udokumentowanych w literaturze, w tym kolinearność, zbyt małe wartości p i zbyt wąskie przedziały ufności[32]. Do opracowania modeli predykcyjnych wykorzystano język programowania Te R (wersja 3.6.0), z bibliotekami 'survivalism', 'ranger', survival' i 'LTRCtrees'[33].

EtykaDziałalność rejestru ANZDATA uzyskała pełną akceptację etyczną Komisji Etyki Badań nad Ludźmi Szpitala Królewskiego w Adelajdzie. Badanie to uzyskało aprobatę etyczną Queensland University of Technology.

Wyniki

Charakterystyki poziomu bazowegoCharakterystykę biorców i dawców przedstawiono w tabeli 1. Całkowita próba badawcza liczyła 7365 zmarłych dawcówprzeszczepy nerkiw okresie od 1 stycznia 2007 r. do 31 grudnia 2017 r. Mediana wieku dawców wyniosła 52 lata (zakres międzykwartylowy 41–60), a biorców 47 lat (zakres międzykwartylowy 32–58). Większość stanowili mężczyźni (63 proc.). Około 87 procent przeszczepów stanowiły przeszczepy pierwotne.

image

Wybór zmiennych Było 98 potencjalnych zmiennych niezależnych. Tabela 2 podsumowuje wyniki trzech podejść w celu wybrania podzbioru zmiennych niezależnych, które nie uległy nadmiernemu dopasowaniu, co daje siedem zestawów zmiennych niezależnych. Opinia eksperta sprowadziła zmienne niezależne do 40 zmiennych, a elastyczna sieć do 46 zmiennych. Zastosowanie wszystkich trzech metod doboru zmiennych zredukowało 98 potencjalnych zmiennych do 23 głównych składowych. Każdy z tych siedmiu zestawów zmiennych niezależnych został wykorzystany do trenowania i testowania modeli. Podczas budowania modelu zmienne niezależne zostały dodatkowo zredukowane u Coxa i RSF poprzez uwzględnienie tylko tych, które były istotne statystycznie (p<0.05) and="" including="" only="" those="" with="" positive="" 'variable="" importance'="" (a="" variable="" selection="" algorithm="" used="" in="" rsf),=""  respectively.="" model="" development="" and validation="" te="" predictive="" performance="" of="" the="" models="" is="" compared="" in="" table 3.="" cox="" proportional="" regression="" and="" rsf="" outperformed="" the="" other="" two="" models="" (i.e.="" survival="" tree="" and="" support="" vector="" machine).="" the="" highest="" c-index="" (0.67)="" was="" from="" a="" cox="" proportional="" regression="" model="" which="" used="" expert="" opinion="" as="" the="" variable="" selection="" method="" and="" rsf=""  which="" used="" the="" elastic="" net="" as="" the="" variable="" selection="" method.="" a=""  c-index="" of="" 0.67="" indicates="" the="" moderate="" discriminative="" ability="" of="" death-censored="" graft="" failure.="" the="" discriminative="" ability="" of="" kdri="" in="" discriminating="" death-censored="" graft="" failure="" was="" 0.53,="" a="" lower="" prediction="" ability="" than="" our="" two="" best="" models.="" the="" cox="" model="" used="" 7="" independent="" variables="" while="" the="" rsf="" used="" 20="" variables="" (table 4).="" since="" the="" cox="" model="" was="" able="" to="" produce="" the="" same="" discriminatory="" power="" with="" a="" lower="" number="" of="" variables,="" it="" was="" considered="" as="" the="" best="" fitting="">

image

image

Najlepiej dopasowany model CoxPonieważ wiek dawcy był silnym predyktorem przeżycia przeszczepu, do modelu dodano nieliniową transformację wieku (podstawa logarytmiczna 2). Zwiększyło to indeks C tylko o 0.003. Przeskalowaliśmy indeks do mediany wieku dawcy (45 lat) i biorcy (50 lat). Wskaźnik modelu Coxa oblicza się tak, jak pokazano na rys. 2. Jako alternatywę zastosowano również model Weibulla, który zakłada, że ​​zagrożenie jest zależne od czasu[34]. Jednak wskaźnik C został zmniejszony o 0,0014, nie zwiększając dyskryminacji, więc zachowaliśmy model Coxa. Nadciśnienie tętnicze u dawcy (HR 1,43; 95 procent CI 1,16 do 1,76) zwiększało ryzyko wystąpienia policystycznychchoroba nerekponieważ pierwotna choroba nerek zmniejszyła ryzyko (HR {{0}},66; 95% CI 0,48 do 0,91) (Tabela 5) niepowodzenia.

Rozkład wskaźnika ogółem pacjentów pokazuje, że wyniki grup ryzyka są „dobre” (< 16th="" centile)="" and="" "fairly="" good"="" (16th–50th="" centile),="" have="" a="" narrow="" separation,="" whereas="" the="" other="" two="" categories="" ("fairly="" poor"="" and=""  "poor")="" are="" clearly="" separated="" (supplementary="" figure ="" 1).=""  this="" indicates="" that="" the="" cox="" model="" does="" better="" at="" separating="" the="" higher="" risk="" groups.="" the="" cox="" model="" was="" able="" to="" discriminate="" the="" extreme="" categories="" of="" graft="" failure="" risk="" (good="" vs="" poor)="" with="" good="" discriminative="" power="" (c-index="0.73)." discrimination="" between="" other="" groups="" was="" moderate="" (c-index="">0.6) (Tabela 6). Krzywe przeżycia Kaplana-Meiera przedstawiające cenzurę śmiercinerkaniepowodzenie przeszczepu dla czterech grup ryzyka przedstawiono na Ryc. 3. W miarę jak grupy ryzyka zmieniają się od „Dobrego” do „Zła”, krzywe przeżycia wykazują wyraźnie zwiększone ryzyko niepowodzenia przeszczepu. Co więcej, w porównaniu z grupą „Dobra”, gdy grupy przechodzą od „Dość dobrze” do „Zła”, współczynniki ryzyka zwiększają się zarówno w zestawach danych treningowych, jak i walidacyjnych (Tabela 7). Wyniki te pokazują, że indeks ma dobrą moc dyskryminacyjną[28].

Średnie szacowane przeżycie w porównaniu ze średnim rzeczywistym przeżyciem w 3-latach i 5-latach przedstawiono na ryc. 4. W doskonale skalibrowanym modelu punkty danych leżałyby wzdłuż linii przerywanej (idealna linia predykcji). , wskazując doskonałą dokładność przewidywania. Średnie rzeczywiste przeżycie jest konsekwentnie niższe niż przewidywane przeżycie zarówno po 3, jak i po 5 latach. Jednak różnica między idealną linią przewidywania a linią przewidywania w obu okresach zmniejsza się wraz ze wzrostem przewidywanego przeżycia. Ogólnie rzecz biorąc, model Coxa wykazuje umiarkowany poziom dokładności przewidywania.

Dyskusja

W naszym badaniu opracowano model przewidywania ryzyka do przewidywania niepowodzenia przeszczepu a priori na dużej próbie pacjentów. Przeanalizowaliśmy cztery możliwe modele predykcyjne przy użyciu metod statystycznych i uczenia maszynowego. Najlepszym modelem był model przewidywania ryzyka regresji Coxa, który mógł przewidywać niewydolność przeszczepu z oceną śmierci z umiarkowanym poziomem dyskryminacji i dokładnością przewidywania przy użyciu tylko siedmiu zmiennych niezależnych. Moc dyskryminacyjna obecnego indeksu przewyższa większość obecnie dostępnych modeli przewidywania ryzyka przeszczepu.

image

image

Model przewidywania ryzyka został opracowany do wykorzystania w podejmowaniu decyzji przed przeszczepem (np.nerkaalokacji), stąd tylko zmienne dostępne przed przeszczepem zostały uznane za zmienne niezależne. Zastosowaliśmy walidację wewnętrzną, aby stworzyć oszczędny model, ponieważ przy użyciu dużej liczby zmiennych niezależnych można łatwo stworzyć modele o słabych wynikach, których nie można uogólnić z powodu nadmiernego dopasowania [35]. Krokowa selekcja zmiennych, powszechnie stosowana metoda selekcji zmiennych, która została wykorzystana do opracowania KDRI, jest niestabilną metodą, która może tworzyć modele, które słabo sprawdzają się w walidacji zewnętrznej [28]. Wykorzystanie siedmiu różnych kombinacji selekcji zmiennych w niniejszym badaniu, zidentyfikowanych przez połączenie opinii ekspertów i statystyk, pomogło w identyfikacji

image

najważniejsze zmienne, które wyjaśniały większość wariancji danych. Skromny model daje w wyniku wskaźnik, który jest łatwiejszy do zastosowania w warunkach klinicznych. Ostateczny najlepszy model Coxa ma siedem zmiennych, mniej niż liczba zmiennych stosowanych w najpowszechniej stosowanych modelach przewidywania ryzyka niepowodzenia przeszczepu [3, 36].

Model Coxa przewyższał trzy metody uczenia maszynowego zastosowane w badaniu. Przegląd literatury wskazuje, że dokładność przewidywania dawała mieszane wyniki, gdy porównuje się uczenie maszynowe z tradycyjnymi metodami predykcyjnymi [8]. W obecnym badaniu wykorzystano dwie metody uczenia maszynowego oparte na drzewie, a słabsza wydajność tych metod w naszych danych może wskazywać, że dane nie mają podstawowej struktury drzewiastej, w której wyniki są określane przez podziały binarne. Raczej ryzyko przeżycia przeszczepu może bardziej zależeć od ciągłych czynników prognostycznych, takich jak wiek.

Nasz model został opracowany w celu przewidywania niepowodzenia przeszczepu z oceną śmierci, podczas gdy ogólna niewydolność przeszczepu obejmuje kombinację niepowodzenia przeszczepu oraz zgonu z funkcjonującym przeszczepem. Wiedza o przetrwaniu danego dawcynerkajest ważniejsza niż całkowita niepowodzenie przeszczepu w procesie podejmowania decyzji przed przeszczepem [2]. W naszym badaniu C-indeks niepowodzenia przeszczepu z oceną śmierci wyniósł 0.67. Clayton i in. zwalidował amerykańską KDRI, wykorzystując dane australijskie [2], oraz C-indeks w dyskryminowaniu cenzury śmierci

image

niepowodzenie przeszczepu wyniosło {{0}}.63, co oznacza niższą dyskryminację niż wyniki uzyskane tutaj. Jednak uwzględnienie zarówno cech przeszczepu, jak i biorcy (całkowite zmienne niezależne 24) w KDRI zwiększyło wskaźnik C niepowodzenia przeszczepu z oceną śmierci do 0.70 w Clayton et al. nauka. Autorzy ci nie ocenili kalibracji (dokładności predykcji), co utrudnia kompleksowe porównanie z wynikami naszego badania. Nasz najlepszy model ma wskaźnik C wynoszący 0,67 dla zaledwie siedmiu zmiennych w porównaniu z indeksem C wynoszącym 0,70 dla 24 zmiennych w przypadku tych ostatnich, a klinicyści mogą uznać ten niewielki wzrost dokładności za niewart wzrostu złożoności. Modele predykcyjne z wieloma zmiennymi są również trudniejsze logistycznie, ponieważ wymagają zebrania większej ilości danych, a tylko jedna brakująca zmienna oznacza, że ​​predykcji nie można oszacować.

Co więcej, moc dyskryminacyjna obecnego indeksu przewyższyła kilka innych obecnie dostępnych indeksów, w tym KDRI, jak opisano wcześniej. Kasiske i in. (2010), opracowali indeks z 11 zmiennymi dawcy i biorcy, dostępnymi przed przeszczepem, i miał C-indeks 0,649 [37]. Nowszy wskaźnik opracowany przez Molnara i wsp. z 2018 r. miał wskaźnik C 0,63 w rozróżnianiu pacjentów wysokiego ryzyka niepowodzenia przeszczepu. W indeksie tym wykorzystano 10 cech dawców i biorców [38]. Dlatego też indeks opisany w tym artykule był w stanie osiągnąć wyższą moc dyskryminacyjną przy mniejszej liczbie zmiennych. Musimy jednak wziąć pod uwagę, czy predykcja wykorzystująca wskaźnik o umiarkowanej zdolności dyskryminacyjnej (wskaźnik C 0,67) jest akceptowalna dla celów alokacjinerki, ponieważ model jest daleki od idealnego wskaźnika C wynoszącego 1, co oznacza, że ​​my

image

image

nie ma pewności, że przewidywane alokacje przyniosą najlepsze rezultaty. Fałszywie wysoki odczyt wskaźnika w modelu predykcyjnym w momencie przeszczepu może zniechęcić klinicystę i pacjenta do przyjęcia dawcynerka. Ten stygmatyzujący efekt błędnego oznakowania dawcynerkaponieważ „marginalna/niska jakość została już udokumentowana [39].

Przewidywanie niepowodzenia przeszczepu jest złożonym zjawiskiem, które obejmuje cechy dawcy, cechy związane z pobraniem narządu dawcy, cechy biorcy, cechy związane z przeszczepem oraz czynniki potransplantacyjne, takie jak stosowanie leków immunosupresyjnych. Decyzje związane znerkaprzydział musi być oczywiście dokonany przed przesadzeniem; w związku z tym w momencie podejmowania tej wstępnej decyzji czynniki proceduralne i po transplantacji nie są dostępne. Dlatego źródłem zmienności, która nie jest uwzględniana w większości obecnie dostępnych modeli predykcyjnych (co pokazuje ich jedynie umiarkowany poziom zdolności dyskryminacyjnej), mogą być przeszczepione czynniki proceduralne lub poprzeszczepowe. Mogą to być również czynniki będące dawcami lub biorcami, które nie są rutynowo rejestrowane w bazach danych, a także nieprzewidywalne zdarzenia stochastyczne, prowadzące do niedoskonałych przewidywań. Oznacza to, że idealny wskaźnik C równy 1 jest prawdopodobnie niemożliwy dla modelu wykorzystującego czynniki przedtransplantacyjne. Trudno jest określić, jaki jest najwyższy osiągalny wskaźnik C, a to wymagałoby osobnego ćwiczenia modelowania, które zawiera nieweryfikowalne założenia dotyczące znaczenia 1) zdarzeń stochastycznych i 2) niezmierzonych predyktorów.

Cistanche-kidney infection-4(16)

CISTANCHE POPRAWI INFEKCJE NEREK/NEREK

Model Te Coxa był w stanie odróżnić skrajne kategorie ryzyka niepowodzenia przeszczepu (dobre vs słabe) o dobrej sile dyskryminacyjnej (wskaźnik C=0,73), tym samym użyteczność narzędzia wśród skrajnych kategorii ryzyka niepowodzenia przeszczepu jest lepszy w porównaniu z innymi kategoriami ryzyka. W związku z tym ograniczenie stosowania instrumentu tylko wśród tych kategorii ryzyka może przynieść lepsze wyniki w:przeszczep nerkipodejmowanie decyzji. Wykorzystaliśmy solidną walidację wewnętrzną, ale walidacja zewnętrzna jest ważnym krokiem w kierunku akceptacji wskaźnika ryzyka w podejmowaniu decyzji klinicznych, ponieważ ocena działania modelu opartego wyłącznie na walidacji wewnętrznej może prowadzić do zbyt optymistycznej oceny skuteczności [28]. Co więcej, większość klinicystów może nie chcieć korzystać z narzędzia, które nie zostało przetestowane na innychnerkapopulacje. Dlatego proponujemy, aby ten wskaźnik został poddany zewnętrznej walidacji w celu oceny możliwości uogólnienia przed zastosowaniem w praktyce klinicznej. Jeśli indeks wykazuje dobrą trafność zewnętrzną, indeks ma potencjał do lepszego odnalezienia dawcy dla biorców, poprawiając prądnerkaprzydział. Ponieważ ten wskaźnik ma cechy zarówno dawcy, jak i biorcy, może on przewidzieć, które dopasowanie dawcy i biorcy ma największe przeżycie po przeszczepie spośród dostępnych opcji.

To badanie ma kilka ograniczeń. Model predykcyjny wykorzystywał tylko zmienne zebrane przez ANZDATA, stąd być może nie uwzględniliśmy pełnego profilu ryzyka pacjentów. Wykorzystaliśmy tylko cztery metody, a inne metody uczenia maszynowego, które mogłyby modelować informacje o czasie do zdarzenia, mogły przynieść lepsze wyniki. Jednak modele uczenia maszynowego dla danych o przeżyciu nie są dobrze rozwinięte, co ogranicza nasz wybór typów modeli najlepszych aplikacji [35].

WniosekPodsumowując, nowy wskaźnik umiarkowanie dobrze rozróżnia pacjentów z wyższym ryzykiem niepowodzenia przeszczepu i umożliwia przewidywanie niepowodzenia przeszczepu z umiarkowanym poziomem dokładności. Ten obiecujący nowy indeks jest wart kolejnego etapu zewnętrznej walidacji, aby udowodnić jego zastosowanie w warunkach klinicznych.

cistanche-kidney function-5(59)

CISTANCHE POPRAWI FUNKCJĘ NEREK/NEREK

 

Może ci się spodobać również