+A A A-
Menu

HIV Estimates

Projekt Europejskiego Centrum ds Zapobiegania i Zwalczania Chorób
(European Centre for Disease Control and Prevention, ECDC)

HIV ESTIMATES: Opracowanie metod poprawy dokładności oszacowań dotyczących epidemii HIV w krajach UE/EEA

Wprowadzenie

Koncepcja projektu wynika z coraz wyraźniejszej potrzeby poprawy wykorzystania dostępnych, rutynowo zbieranych danych epidemiologicznych dotyczących HIV/AIDS w celu zapobiegania i zwalczania epidemii tego wirusa. Odpowiednio szczegółowa charakteryzacja epidemii na poziomie Unii Europejskiej, a także na poziomie poszczególnych krajów członkowskich, przyczynia się do ustalenia priorytetów zdrowia publicznego w tym zakresie.
Kluczowe z punktu widzenia decydentów informacje dotyczą dwóch obszarów: (1) dynamiki rozwoju epidemii HIV w różnych subpopulacjach (2) zdolności systemu ochrony zdrowia do sprawnego objęcia opieką osób zakażonych HIV. Pierwszy z tych obszarów wymaga pomiaru zapadalności, a do opisu drugiego wykorzystuje się koncept kontinuum opieki – szacując w populacji proporcję osób żyjących z HIV, osób z rozpoznanym zakażeniem HIV, objętych leczeniem i w końcu – skutecznie leczonych. Oszacowanie zapadalności bazuje na odpowiednich modelach matematycznych skalibrowanych w oparciu o dostępne dane, w tym dane pochodzące z nadzoru epidemiologicznego. Modele, które zostały zaadoptowane do typu danych dostępnych w ramach nadzoru epidemiologicznego w Europie zostały zaimplementowane w gotowym narzędziu ECDC (ECDC modelling tool).
Narzędzie to może być również pomocne do oszacowania parametrów niezbędnych do konstrukcji kontinuum opieki, w tym częstości występowania zakażeń HIV. W tym celu jednak konieczne są wiarygodne dane dotyczące umieralności i migracji osób zakażonych.
Jakość danych, kluczowa w celu pozyskania wiarygodnych oszacowań, może być trudna do uzyskania w danych z nadzoru, a szczególnie na poziomie bazy danych Europejskiego sytemu nadzoru (The European Surveillance System database, TESSy). Ograniczenia danych pochodzących z tego źródło obejmują niekompletną zgłaszalność lub duplikację przypadków, opóźnienia w zgłaszalności, braki danych w podstawowych zmiennych, a także błędną klasyfikację w zakresie podstawowych zmiennych. Dla niektórych z tych problemów istnieją metody statystyczne pozwalające na korektę wynikającej z nich stronniczości oszacowań. W obecnym projekcie – wykorzystując wcześniejsze prace zainicjowane przez ECDC dotyczące braków danych i opóźnień w zgłaszalności – prowadzone będą badania dotyczące kalibracji modeli matematycznych w oparciu o dane niepełne lub błędnie klasyfikowane, a także w odniesieniu do poszerzenia modelowania umieralności i migracji.

Cele projektu

Celem głównym projektu jest opracowanie wiarygodnych oszacowań dla kluczowych parametrów rozwoju epidemii HIV na poziomie Unii Europejskiej i w krajach członkowskich. Zostanie to osiągnięte poprzez prace metodologiczne oraz wsparcie dla krajów w aplikacji opracowanych metod.

W szczególności na projekt składają się dwa obszary działania:

  1. Stworzenie narzędzia informatycznego wykonującego w sposób automatyczny korekty statystyczne
    Wśród tych korekt znajdą się metody pracy z brakami danych oraz opóźnieniami w zgłaszaniu. Wybrane, najbardziej pasujące dla danych z nadzoru metody, zostaną wdrożone w formie w pełni udokumentowanego narzędzia informatycznego, łatwego do zastosowania dla danych ze zgłoszeń przypadków na poziomie krajowym i europejskim.
  1. Badania metodologiczne i oszacowania
    Badania będą dotyczyły dodatkowych tematów, w tym metod dla błędnej klasyfikacji i określenia niepewności oszacowań. W ramach tego ostatniego ocenimy wpływ jakości danych na niepewność oszacowań związaną z kalibracją modeli. Zaproponujemy również możliwe udoskonalenia w stosowanych technikach modelowania, które pozwolą na dokładniejsze zrozumienie epidemii HIV występującej w poszczególnych subpopulacjach, biorąc pod uwagę również strukturę wiekową populacji.

Główne zadania w projekcie

Wybrane korekty statystyczne i narzędzie informatyczne:

  1. Przegląd istniejących metod badanych lub wdrożonych przez ECDC
    Wśród obecnie istniejących metod korekty braków danych, imputacja wielokrotna metodą modelowania łącznego rozkładu normalnego lub metodą pełnej specyfikacji warunkowej (full conditional specification) zostały wybrane jako najodpowiedniejsze. Adekwatne sformułowanie modeli imputacyjnych, które pozwalałoby wziąć pod uwagę założenia modelu docelowego (substantial model); wrażliwość oszacowań na sytuacje, w których założenie, o powstawaniu braków danych w sposób losowy (missing-at-random, MAR) nie jest spełnione a także modelowanie wielopoziomowe (multilevel modelling) to przykłady zagadnień, które będą jeszcze rozwiązane przed wdrożeniem planowanego narzędzia.
    Regresja liniowa dla danych lewostronnie uciętych (left truncated) z wykorzystaniem transformacji odwrócenia czasu w celu estymacji rozkładu opóźnień zgłoszeń oraz imputowanie liczby jeszcze nie zaobserwowanych przypadków technikami imputacji wielokrotnej to dwa często stosowane podejścia do korekty opóźnień zgłoszeń. Problem z odbieganiem opóźnień od typowego wzorca (np. związanym ze zgłaszaniem starych przypadków w wyniku kontroli), adekwatne modelowanie trendu w opóźnieniach oraz inkorporacja imputacji braków danych w zmiennych wyjaśniających wymaga dalszej pracy w ramach obecnego projektu.
  1. Testy zaproponowanych metod na danych symulowanych i danych z wybranych krajów
    Bazując na wynikach poprzednich badań ankietowych oraz konsultacjach z krajami członkowskimi zostaną zidentyfikowane typowe sposoby prowadzenia nadzoru epidemiologicznego funkcjonujące w Europie, z którymi mogą wiązać się pewne typowe problemy z danymi (profile zgłaszalności). Proponujemy utworzenie sztucznego zbioru danych poprzez aplikację takich scenariuszy do danych symulowanych (w miarę możliwości we współpracy z zespołem projektu HIV Synthesis Project). Pozwoli to na testowanie metodologii korekt statystycznych zastosowanych w połączeniu z kalibracją modeli matematycznych szacujących np. zapadalność HIV. Ponadto, jeśli zostaną zidentyfikowane kraje, w których istnieją zwalidowane procedury, zostaną one zaproszone do współpracy przy badaniach weryfikujących nasze metody.
  1. Opracowanie narzędzia informatycznego do korekt braków danych i opóźnień w zgłaszalności
    Narzędzie to umożliwi praktyczne wdrożenie metod i procedur opracowanych w toku projektu. Będzie zaprojektowane w sposób umożliwiający intuicyjne zastosowanie w połączeniu z narzędziem ECDC Modelling Tool, a także wspomagający użytkownika poprzez wbudowane interaktywne drzewo decyzyjne. Jednocześnie planowane narzędzie powinno pozwalać na wykonanie złożonych obliczeń (tj. imputacji i analizy pseudo-kompletnych zbiorów danych) i dostosowanie metod do konkretnych wymagań użytkownika. Niektóre aspekty przekształcania i analizy danych będą wykonywane w środowisku R.
  1. Pilotaż narzędzia i pomoc dla krajów (szkolenia i „help desk”)
    Narzędzie będzie pilotowane podczas szkoleń stacjonarnych w kilku krajach i poprawione zgodnie z wynikami pilotaży. Dalsza pomoc dla użytkowników będzie dostępna w postaci szkoleń stacjonarnych bądź online w zależności od zapotrzebowania. Kompletna dokumentacja narzędzia i instrukcja dla użytkownika będzie umieszczona na stornie internetowej. Dodatkowo podczas trwania projektu będzie dostępna pomoc online przez skype lub email (help desk).

Badania metodologiczne i oszacowania – proponowana tematyka

  1. Istotne subpopulacje: klasyfikacja i błędna klasyfikacja
    Chociaż błędna klasyfikacja jest zjawiskiem dobrze znanym i często opisywanym jako możliwe źródło błędu systematycznego, jej efekty są najczęściej oceniane jakościowo, a przykłady, w których zastosowano konkretną metodologię korekty wyników uwzględniającej ten problem są dość rzadkie. Metody, które można rozważać w tym kontekście, obejmują prostą lub probabilistyczną analizę stronniczości, Bayesowską analizę stronniczości, zmodyfikowaną metodę najwyższej wiarygodności oraz metodę imputacji wielokrotnych błędu pomiaru. Wartości parametru błędu dla większości tych metod pochodzą albo z wewnętrznej próbki walidacyjnej, niezależnego badania walidacyjnego, opublikowanych wcześniej wyników lub opinii eksperckiej. Mogą one również bazować na idei „użyczenia informacji” w podejściu meta-analitycznym używając danych zgromadzonych w TESSy z innych krajów z podobną epidemią i bardziej wiarygodnymi danymi. Ta analiza będzie dotyczyła głównie kategorii transmisji wirusa i statusu imigracyjnego. Ostatnio również prowadzone są prace nad poprawą precyzji klasyfikacji kraju, w którym mogło dojść do zakażenia. Kluczowe będzie również modelowanie występowania zgonów i AIDS, biorąc pod uwagę, jak często podlegają one brakom danych lub błędnej klasyfikacji.
  1. Kalibracja modelu i analiza niepewności
    Prace będą dotyczyły modelu stosowanego obecnie przez ECDC (model kompartmentowy opisany układem równań różniczkowych zwyczajnych). Kalibracja tego modelu opiera się o obserwowany rozkład liczby komórek CD4 w momencie rozpoznania, według roku rozpoznania. Jednakże, liczba komórek CD4 w momencie rozpoznania jest zmienną o najniższym poziomie kompletności w bazie danych z nadzoru. Z punktu widzenia imputacji wielokrotnej tej zmiennej model imputacyjny powinien być zgodny z modelem docelowym opisującym relacje pomiędzy zmiennymi (w tym przypadku układem równań różniczkowych zwyczajnych). Sfomułowanie explicite modelu łącznego (imputacyjnego i docelowego) nie jest w tym przypadku oczywiste, stąd wskazanie modelu imputacyjnego zgodnego z modelem docelowym może nastręczać pewnych trudności. W celu lepszego zrozumienia ich wpływu będziemy porównywać wyniki symultanicznej korekty braków danych i estymacji modelu w podejściu Bayesowskim do klasycznej imputacji przy pomocy uproszczonego modelu imputacyjnego, kalibrując następnie model w oparciu o pseudo-kompletne zbiory danych przy użyciu istniejącego narzędzia ECDC i uzyskując ostateczne oszacowania używając reguł Rubina. Dalsze badania będą dotyczyły wprowadzenia niepewności wokół parametrów przejścia w modelu a także wprowadzenie wpływu zakażonych osób do populacji. Będzie to wymagało wdrożenia wyników dotyczących klasyfikacji statusu imigracyjnego, oraz ewentualnie kraju, w którym mogło dość do zakażenia.
  1. Możliwe kierunki rozwoju modelowania matematycznego
    Jednym z naturalnych kierunków udoskonalenia modelu bazującego na danych jednostkowych byłoby wprowadzenie struktury wiekowej do modelu, jak również rozważenie innych parametrów strukturalnych dla populacji, zwłaszcza poziomu komórek CD4 jako zmiennej ciągłej. Wprowadzenie takich parametrów prowadzi niewątpliwie do wzrostu skomplikowania modelu (równania różniczkowe cząstkowe zamiast zwyczajnych). Możliwa do zastosowania tu metoda znajdowania rozwiązań takich równań, która umożliwi również asymilację do nich danych, opiera się na aproksymacji kohortami (metody cząstek). Kohorty definiowane są poprzez parametr strukturalny. Aproksymacja ta umożliwia zastosowanie metod dla równań zwyczajnych. Dalszych badań teoretycznych wymaga zagadnienie, czy kalibracja takiego przybliżonego układu w efekcie przełoży się na uzyskanie dobrego przybliżenia rozwiązania wyjściowego układu, optymalnego w sensie zadanej funkcji kosztu. Asymilacja danych może być również rozpatrywana w podejściu Bayesowskim, w którym otrzymuje się pełen rozkład a posteriori interesujących parametrów. Wdrożenie metod Bayesowskich do równań cząstkowych jest obecnie intensywnie badanym obszarem.

W razie dodatkowych pytań prosimy o kontakt: Magdalena Rosińska, e-mail: mrosinska@pzh.gov.pl