CIEKAWOSTKI
Autor: Agnieszka Kaleta | dodano: 2017-05-14
Polska Referencyjna Baza Genomowa

Pod koniec kwietnia w Instytucie Biocybernetyki i Inżynierii Biomedycznej PAN w Warszawie odbyła się konferencja prezentująca wyniki i podsumowująca ponad trzyletni projekt „Polski genom referencyjny dla diagnostyki genomowej i medycyny spersonalizowanej" współfinansowany przez Narodowe Centrum Badań i Rozwoju w ramach projektu INNOTECH, w ścieżce programowej IN-TECH. Projekt zakładał uzyskanie genetycznego wzorca osoby długowiecznej (powyżej 90 roku życia) w dobrej kondycji, w formie bazy danych, do którego można odnosić dane genetyczne każdego Polaka zarówno w precyzyjnej diagnostyce genomowej, jak również w ocenie ryzyka m.in. wystąpienia chorób genetycznych czy chorób cywilizacyjnych.

Na konferencji przedstawiono proces uzyskania pełnych genomów 126 osób długowiecznych i wnioski z analizy tych danych - statystyki i prognozy dotyczące długości życia dla populacji Polski i Europy oraz analiza statystyczna dla wskazanej grupy długowiecznych zakwalifikowanych do projektu, analiza wyników badań biochemicznych jak również proces obróbki danych bioinformatycznych, użyte programy i technologie, pozwalające na szeroki zakres wyszukiwania i porównywania danych genomowych. Dzięki wspólnej pracy czterech konsorcjantów uzyskano referencyjny - uśredniony genom „zdrowego Polaka" jako punkt odniesienia dla analizy danych genomowych należących do populacji kaukaskiej, powstała referencyjna genomowa baza wariantów sekwencyjnych polskiej subpopulacji kaukaskiej do wykorzystania w celach diagnostycznych i projektach naukowych oraz stworzono narzędzia do weryfikacji patogenności wariantów wykrywanych u pacjentów.

Jak wiadomo, sekwencjonowanie genomów, jak prawie każda dziedzina nauki, miało trudne początki, manualna – izotopowa metoda sekwencjonowania dawała dość skromne rezultaty (Metoda Sangera 1 próbka = 1 odczyt), prace nad pełną sekwencją genomu ludzkiego, którą opublikowano w 2003 roku trwały 13 lat, a ich koszt zamknął się kwotą 3 mld dolarów. Pięć lat później sekwencjonowanie genomu Metodą Następnej Generacji to już miliony odczytów na jedną próbkę, 4 miesiące prac eksperymentalnych i koszt 1 mln dolarów. Obecnie do sekwencjonowania genomów stosuje się metodę automatyczną III generacji, a zastosowanie najnowszych technologii powoduje znaczące obniżenie kosztów.

Danych genomowych jest coraz więcej, jednak problemem staje się racjonalne wykorzystanie tych danych oraz ich analiza, ponieważ diagnostyka oparta na NGS (Next Generation Sequencing) zawiera nieścisłości. Spowodowało to wiele czynników. Sam tzw. ludzki genom referencyjny, który powstał z mieszanki genomów kilku osób reprezentujących różne grupy etniczne, zawiera wciąż poprawiane błędy, jest wiele różnych baz danych specyficznych dla konkretnych jednostek chorobowych, dostępne obecnie bazy nie są wolne od pomyłek, a wiele równolegle prowadzonych projektów genomowych na świecie oparte jest na mieszanych populacjach, bez dokładnej charakterystyki badanych grup. W takiej grupie danych trudno jest odróżnić istotne zmiany od mutacji patogennych. Tak zrodził się cel projektu – potrzeba stworzenia wzorca dla naszej populacji, uzyskanie polskiej referencyjnej bazy genomowej, która będzie się odnosiła do polskiej subpopulacji – unikalnego połączenia danych całogenomowych z danymi klinicznymi, biochemicznymi oraz pochodzących z wywiadów. Wprowadzenie w tematykę projektu i koncepcję Polskiej Referencyjnej Bazy Genomowej przedstawiła zebranym dr hab. Anna Boguszewska-Chachulska (Genomed SA), kierownik projektu.

Dr hab. Małgorzata Mossakowska (Międzynarodowy Instytut Biologii Molekularnej i Komórkowej) zreferowała dane polskich długowiecznych od strony statystycznej. Niezaprzeczalny jest fakt, iż mężczyźni żyją krócej niż kobiety. Jeszcze w latach 90-tych ubiegłego wieku długość życia kobiet wynosiła średnio 75, a mężczyzn 65 lat. Ciągły rozwój medycyny, dostęp do leków nowej generacji, nowoczesne metody leczenia przekładają się na lepszą jakość życia, powodując, że ono się wydłuża. Prognozowane dane przeciętnego trwania życia w roku 2050 to średnio 89 lat dla kobiet i prawie 85 dla mężczyzn. Cały czas rośnie liczba osób powyżej 90 roku życia.

Już wcześniej realizowane były projekty dotyczące osób długowiecznych. W latach 2001-2004 był to projekt PolStu 2001 – Badanie Polskich Stulatków, gdzie celem była próba określenia niektórych czynników zarówno środowiskowych, jak i genetycznych, które mogą mieć wpływ na długie życie i pomyślne starzenie pozbawione typowych dla podeszłego wieku patologii, a w latach 2007-2012 badanie PolSenior, w którym szeroko ujęte zostały aspekty medyczne, psychologiczne, socjologiczne i ekonomiczne starzenia się ludzi w Polsce.

PolGenom to kolejny projekt obejmujący tę właśnie grupę. Badane w nim osoby długowieczne zostały zakwalifikowane według następujących kryteriów: brak w wywiadzie zachorowania lub zachorowanie nie wcześniej niż po 80 roku życia na nowotwory, cukrzycę typu 2, udar mózgu, zawał mięśnia serca, test MMSE oceniający funkcje poznawcze na poziomie minimum 20 punktów (na 30 możliwych), test ADL oceniający podstawowe funkcje fizykalne na poziomie minimum 4 punkty (na 6 możliwych) oraz prawidłowe lub prawie prawidłowe wyniki badań biochemicznych krwi.

Z analizy tych ostatnich, które zaprezentowała prof. dr hab. Monika Puzianowska-Kuźnicka (Instytut Medycyny Doświadczalnej i Klinicznej PAN) wynika, iż zdrowi długowieczni mają gorsze parametry morfologii krwi i gospodarki wapniowej niż osoby w przedziale wiekowym 65-74 lata, jak również nieco gorsze parametry funkcji wątroby i nerek oraz niższe stężenie lipidów. Wiek badanych nie wpłynął istotnie na stężenie sodu i potasu, natomiast stężenie wskaźników zapalnych jest dwukrotnie większe niż u osób młodych, co potwierdza teorię, iż starzeniu towarzyszy przewlekły stan zapalny, zwiększający ryzyko różnych chorób takich jak chorób układu krążenia czy demencji.

Uzyskane dane genomowe od 126 długowiecznych to 22 miliony wariantów i 70 GB danych. Przetworzenie tak dużej ilości danych na wysokowydajnych zespołach obliczeniowych, przy zachowaniu elastycznej struktury bazy wraz z wielojęzycznym menu, stworzenie przejrzystego interfejsu i wydajnego wyszukiwania było zadaniem dla doświadczonych informatyków. – Użyte zostały programy i technologie, które pozwalają w szerokim zakresie przeszukiwać dane genomowe, porównywać i w zależności od potrzeb użytkowników prezentować je za pomocą wykresów lub tabel, mówił Przemysław Łyszkiewicz (24 Godziny Sp. z o.o.). Bioinformatyczną analizę danych genomowych – genotypy polskich długowiecznych zaprezentowała mgr Ewa Matczyńska, a dr Mariusz Krawczyk opowiedział o zintegrowanym interfejsie do genomowej analizy diagnostycznej.

W projekcie PolGenom uzyskano materiał do analiz długowieczności, odkryto ok. 4 mln wariantów, które nie były znane wcześniej, tak powstała referencyjna baza genetyczna Polaków, na dzień dzisiejszy pierwsza i prawdopodobnie jedyna, do zastosowania w przyszłości w medycynie spersonalizowanej. Już dziś planowane jest rozszerzanie bazy o dane pochodzące z innych projektów.

 

Liderem projektu PolGenom była firma specjalizująca się w sekwencjonowaniu i syntezie DNA – Genomed SA we współpracy z Instytutem Medycyny Doświadczalnej i Klinicznej PAN im. Mirosława Mossakowskiego PAN, Międzynarodowym Instytutem Biologii Molekularnej i Komórkowej oraz programistyczną firmą 24 Godziny Sp. z o.o. analizującą i przetwarzającą dane uzyskane w projekcie.

 

Drukuj »
Ten artykuł nie został jeszcze skomentowany.
Aktualne numery
07/2018
06/2018
Kalendarium
Czerwiec
22
W 1633 r. przed sądem Świętego Oficjum Galileusz wyparł się teorii kopernikańskiej.
Warto przeczytać
Grafika komputerowa zazwyczaj kojarzy się z wyretuszowanymi zdjęciami modeli i modelek. W rzeczywistości daje nam o wiele większe możliwości.
Piksele, wektory i inne stwory to wprowadzenie do grafiki komputerowej dla dzieci i nie tylko.

WSPÓŁPRACUJEMY
Logowanie

Nazwa użytkownika

Hasło

Autor: Agnieszka Kaleta | dodano: 2017-05-14
Polska Referencyjna Baza Genomowa

Pod koniec kwietnia w Instytucie Biocybernetyki i Inżynierii Biomedycznej PAN w Warszawie odbyła się konferencja prezentująca wyniki i podsumowująca ponad trzyletni projekt „Polski genom referencyjny dla diagnostyki genomowej i medycyny spersonalizowanej" współfinansowany przez Narodowe Centrum Badań i Rozwoju w ramach projektu INNOTECH, w ścieżce programowej IN-TECH. Projekt zakładał uzyskanie genetycznego wzorca osoby długowiecznej (powyżej 90 roku życia) w dobrej kondycji, w formie bazy danych, do którego można odnosić dane genetyczne każdego Polaka zarówno w precyzyjnej diagnostyce genomowej, jak również w ocenie ryzyka m.in. wystąpienia chorób genetycznych czy chorób cywilizacyjnych.

Na konferencji przedstawiono proces uzyskania pełnych genomów 126 osób długowiecznych i wnioski z analizy tych danych - statystyki i prognozy dotyczące długości życia dla populacji Polski i Europy oraz analiza statystyczna dla wskazanej grupy długowiecznych zakwalifikowanych do projektu, analiza wyników badań biochemicznych jak również proces obróbki danych bioinformatycznych, użyte programy i technologie, pozwalające na szeroki zakres wyszukiwania i porównywania danych genomowych. Dzięki wspólnej pracy czterech konsorcjantów uzyskano referencyjny - uśredniony genom „zdrowego Polaka" jako punkt odniesienia dla analizy danych genomowych należących do populacji kaukaskiej, powstała referencyjna genomowa baza wariantów sekwencyjnych polskiej subpopulacji kaukaskiej do wykorzystania w celach diagnostycznych i projektach naukowych oraz stworzono narzędzia do weryfikacji patogenności wariantów wykrywanych u pacjentów.

Jak wiadomo, sekwencjonowanie genomów, jak prawie każda dziedzina nauki, miało trudne początki, manualna – izotopowa metoda sekwencjonowania dawała dość skromne rezultaty (Metoda Sangera 1 próbka = 1 odczyt), prace nad pełną sekwencją genomu ludzkiego, którą opublikowano w 2003 roku trwały 13 lat, a ich koszt zamknął się kwotą 3 mld dolarów. Pięć lat później sekwencjonowanie genomu Metodą Następnej Generacji to już miliony odczytów na jedną próbkę, 4 miesiące prac eksperymentalnych i koszt 1 mln dolarów. Obecnie do sekwencjonowania genomów stosuje się metodę automatyczną III generacji, a zastosowanie najnowszych technologii powoduje znaczące obniżenie kosztów.

Danych genomowych jest coraz więcej, jednak problemem staje się racjonalne wykorzystanie tych danych oraz ich analiza, ponieważ diagnostyka oparta na NGS (Next Generation Sequencing) zawiera nieścisłości. Spowodowało to wiele czynników. Sam tzw. ludzki genom referencyjny, który powstał z mieszanki genomów kilku osób reprezentujących różne grupy etniczne, zawiera wciąż poprawiane błędy, jest wiele różnych baz danych specyficznych dla konkretnych jednostek chorobowych, dostępne obecnie bazy nie są wolne od pomyłek, a wiele równolegle prowadzonych projektów genomowych na świecie oparte jest na mieszanych populacjach, bez dokładnej charakterystyki badanych grup. W takiej grupie danych trudno jest odróżnić istotne zmiany od mutacji patogennych. Tak zrodził się cel projektu – potrzeba stworzenia wzorca dla naszej populacji, uzyskanie polskiej referencyjnej bazy genomowej, która będzie się odnosiła do polskiej subpopulacji – unikalnego połączenia danych całogenomowych z danymi klinicznymi, biochemicznymi oraz pochodzących z wywiadów. Wprowadzenie w tematykę projektu i koncepcję Polskiej Referencyjnej Bazy Genomowej przedstawiła zebranym dr hab. Anna Boguszewska-Chachulska (Genomed SA), kierownik projektu.

Dr hab. Małgorzata Mossakowska (Międzynarodowy Instytut Biologii Molekularnej i Komórkowej) zreferowała dane polskich długowiecznych od strony statystycznej. Niezaprzeczalny jest fakt, iż mężczyźni żyją krócej niż kobiety. Jeszcze w latach 90-tych ubiegłego wieku długość życia kobiet wynosiła średnio 75, a mężczyzn 65 lat. Ciągły rozwój medycyny, dostęp do leków nowej generacji, nowoczesne metody leczenia przekładają się na lepszą jakość życia, powodując, że ono się wydłuża. Prognozowane dane przeciętnego trwania życia w roku 2050 to średnio 89 lat dla kobiet i prawie 85 dla mężczyzn. Cały czas rośnie liczba osób powyżej 90 roku życia.

Już wcześniej realizowane były projekty dotyczące osób długowiecznych. W latach 2001-2004 był to projekt PolStu 2001 – Badanie Polskich Stulatków, gdzie celem była próba określenia niektórych czynników zarówno środowiskowych, jak i genetycznych, które mogą mieć wpływ na długie życie i pomyślne starzenie pozbawione typowych dla podeszłego wieku patologii, a w latach 2007-2012 badanie PolSenior, w którym szeroko ujęte zostały aspekty medyczne, psychologiczne, socjologiczne i ekonomiczne starzenia się ludzi w Polsce.

PolGenom to kolejny projekt obejmujący tę właśnie grupę. Badane w nim osoby długowieczne zostały zakwalifikowane według następujących kryteriów: brak w wywiadzie zachorowania lub zachorowanie nie wcześniej niż po 80 roku życia na nowotwory, cukrzycę typu 2, udar mózgu, zawał mięśnia serca, test MMSE oceniający funkcje poznawcze na poziomie minimum 20 punktów (na 30 możliwych), test ADL oceniający podstawowe funkcje fizykalne na poziomie minimum 4 punkty (na 6 możliwych) oraz prawidłowe lub prawie prawidłowe wyniki badań biochemicznych krwi.

Z analizy tych ostatnich, które zaprezentowała prof. dr hab. Monika Puzianowska-Kuźnicka (Instytut Medycyny Doświadczalnej i Klinicznej PAN) wynika, iż zdrowi długowieczni mają gorsze parametry morfologii krwi i gospodarki wapniowej niż osoby w przedziale wiekowym 65-74 lata, jak również nieco gorsze parametry funkcji wątroby i nerek oraz niższe stężenie lipidów. Wiek badanych nie wpłynął istotnie na stężenie sodu i potasu, natomiast stężenie wskaźników zapalnych jest dwukrotnie większe niż u osób młodych, co potwierdza teorię, iż starzeniu towarzyszy przewlekły stan zapalny, zwiększający ryzyko różnych chorób takich jak chorób układu krążenia czy demencji.

Uzyskane dane genomowe od 126 długowiecznych to 22 miliony wariantów i 70 GB danych. Przetworzenie tak dużej ilości danych na wysokowydajnych zespołach obliczeniowych, przy zachowaniu elastycznej struktury bazy wraz z wielojęzycznym menu, stworzenie przejrzystego interfejsu i wydajnego wyszukiwania było zadaniem dla doświadczonych informatyków. – Użyte zostały programy i technologie, które pozwalają w szerokim zakresie przeszukiwać dane genomowe, porównywać i w zależności od potrzeb użytkowników prezentować je za pomocą wykresów lub tabel, mówił Przemysław Łyszkiewicz (24 Godziny Sp. z o.o.). Bioinformatyczną analizę danych genomowych – genotypy polskich długowiecznych zaprezentowała mgr Ewa Matczyńska, a dr Mariusz Krawczyk opowiedział o zintegrowanym interfejsie do genomowej analizy diagnostycznej.

W projekcie PolGenom uzyskano materiał do analiz długowieczności, odkryto ok. 4 mln wariantów, które nie były znane wcześniej, tak powstała referencyjna baza genetyczna Polaków, na dzień dzisiejszy pierwsza i prawdopodobnie jedyna, do zastosowania w przyszłości w medycynie spersonalizowanej. Już dziś planowane jest rozszerzanie bazy o dane pochodzące z innych projektów.

 

Liderem projektu PolGenom była firma specjalizująca się w sekwencjonowaniu i syntezie DNA – Genomed SA we współpracy z Instytutem Medycyny Doświadczalnej i Klinicznej PAN im. Mirosława Mossakowskiego PAN, Międzynarodowym Instytutem Biologii Molekularnej i Komórkowej oraz programistyczną firmą 24 Godziny Sp. z o.o. analizującą i przetwarzającą dane uzyskane w projekcie.