IT Industrija

🔥 Najčitanije
🔥 Najčitanije
Razmere podataka koje se koriste u otkrićima vezanim za tumore, podrazumevaju da računarske nauke imaju ogromnu ulogu potpore tog istraživanja.
Vrhunski istraživači su nedavno objavili svoje zaključke i preporuke predsedniku Obami i operativnoj grupi inicijative potpredsednika Bajdena u borbi protiv raka, Moonshot.
Na moje iznenađenje, svih 10 preporuka su se u izveštajima Panela Plave vrpce, snažno fokusirale na razvijanje informacione infrastrukture. Svaka preporuka je uključivala sledeće ključne reči: deljenje podataka, uključivanje pacijenata, precizna medicina, razumevanje genetike, interdisciplinarnost, ekosistem i genomika.
Bolesti raka su najveći zdravstveni izazov našeg vremena. Prouzrokovan abnormalnim ćelijskim deobama na nekontrolisan način, rak je vodeći uzročnik smrti širom sveta, sa više od 14 miliona novih slučajeva i 8 miliona smrtnih slučajeva godišnje.
Većina nas je bila pod uticajem direktne ili indirektne dijagnoze raka. Okončavanje emotivnog ili ekonomskog tereta ovog oboljenja je bilo podložno tokom godina mnogim pogrešnim počecima.
Ali ja, sa stanovišta nekoga ko se bavi računarskom biologijom, i ko je na raskršću biologije i “velikih podataka”, sa sigurnošću može reći da je informaciona infrastruktura vitalni sastojak koji će pomoći da preporuke postanu stvarnost. Ispod su navedena četiri ključna faktora pomoću kojih računarska infrastruktura može postati deo recepta za uspeh.
Rak je kao prvo i osnovno genetičko oboljenje, prouzrokovano mutacijama, ili greškama, u našoj DNK. Identifikovanje i karakterisanje tih grešaka zahteva specijalizovane instrumente, obučeno osoblje i kompleksnu analizu podataka.
Čak i danas, precizni molekularni uzročnici raka ostaju nepoznati. Kao rezultat toga, mnogi pacijenti sa rakom, su lečeni bez precizne genetičke dijagnoze. Za istinsku spoznaju, dijagnozu i lečenje raka, potrebni su bolji uvidi u genetiku raka. Ovo je u skladu sa preporukama Panela za sprovođenje retroaktivne analize bioloških uzoraka pacijenata lečenih standardnim metodama, radi boljeg razumevanja heterogenosti tumora kao i za formiranje atlasa ljudskih tumora.
Razmere podataka koje se koriste u otkrićima vezanim za tumore, podrazumevaju da računarske nauke imaju ogromnu ulogu potpore tog istraživanja.
Vlada i privatna industrija prepoznaju značaj istraživanja kao i zdravstvene prednosti sekvenciranja genoma čitave populacije. Višestruki projekti sekvenciranja velikih razmera su započeti širom sveta; na primer, Program Milion Veterana američke vlade, Projekat 100,000 genoma britanske vlade i predvođen Astra Zenekom – Integrisana genomska inicijativa za otkrivanje i razvoj lekova.
Zahvaljujući ovom i drugim projektima, genomi miliona sekvenciranih tumora će postati stvarnost. Procenjenih 100 miliona do 2 milijarde ljudskih genoma će biti sekvencirano do 2025. Kako brojevi sekvenciranih genoma rastu, ovaj rastući set podataka će biti rastući bogat izvor za tumorsku istraživačku zajednicu, omogućavajući preciznu karakterizaciju molekularnih promena koje karakterišu tumorkse ćelije.
Dve od 10 preporuka specifično pozivaju na direktno umrežavanje pacijenata i na formiranje mreža imunoterapijskih kliničkih studija za odrasle kao i za pedijatrijske pacijente. Međutim, saradnja je u srži svih 10 preporuka, jer panel Plave vrpce nedvosmisleno poziva na bolju razmenu podataka.
Svaki sekvencirani genom zahteva 300-400 GB prostora na hard disku samo za skladištenje sirovih i obrađenih arhiva. Do 2025, količina ljudskih podataka ljudskih genoma je predviđena da bude 2-40 egzabajta, prevazilazeći potrebe skladištenja astronomije i YouTube-a (druga dva značajna izvorišta podataka). Preuzimanje i deljenje ovih podataka će biti teško, vremenski zahtevno i skupo. Radeći u realnom vremenu, paralelno na kolaborativnoj analizi sa kolegom sa drugog kontinenta biće skoro nemoguće.
Kako bi se prevazišli ovi izazovi, istraživačka zajednica za tumore se sve višeokreće cloudu za skladištenje i analizu genomskih podataka tumora. Američki nacionalni institut tumora (National Cancer Institute – NCI) je pokrenuo Cancer Genomics Cloud Pilots kako bi omogućio istraživačima pristup Cancer Genome Atlasu (TCGA) – najvećem, svetskom, javnom genomskom setu podataka – koji sadrži preko 2 petabajta sekvenciranih i drugih podataka od više od 11,000 pacijenata.
Radije nego da se nedeljama čeka preuzimanje podataka, istraživači mogu da se uloguju na cloud radi istraživanja kao i analiziranja podataka velikih razmera. Ključna vrednost clouda je saradnja koja je uobičajena; istraživači mogu da se uloguju u NCI pilote iz bilo kog dela sveta i da zajedno rade na projektu.
Preporuka broj 10 poziva na razvoj novih, moćnih tehnologija za tumor i eksplicitno ukazuje na potrebu za kompjuterskim platformama koje povezuju nekoliko nivoa biomedicinskih podataka.
Kako broj i kompleksnost podataka u istraživanju tumora raste, biće potrebno da se razviju nove strukture podataka radi prezentovanja i potražnju miliona tumorskih genoma. Jedna od mogućnosti ovde je da se koriste usmerene grafičke strukture, koje predstavljaju sve genetičke varijacije populacije u lakoj kategoriji podataka. Ovaj pristup redukuje zahteve skladištenja i memorije u radu sa velikim genomskim setovima podataka, omogućavajući istraživačima bolji rad sa podacima.
Masivni genomski setovi podataka moraju biti analizirani uz druge molekularne, kliničke podatke (uključujući elektronske zdravstvene kartone) i podatke ponašanja pacijenata (na primer, merenja ponašanja pacijenata i izloženost rizicima). Idealno, ovi setovi podataka moraju da žive jedno pored drugog radi njihovog poređenja – napredak u komjuterskom uslojavanju i cloud mogu da pomognu u tome.
Tekst je za TechCrunch originalno napisala Džulija Fen Li, potpredsednica komercijalnih operacija u Seven Bridgesu i direktorka njihove londonske kancelarije. U celosti ga možete pročitati ovde.
Objavio/la članak.
utorak, 25. Oktobar, 2016.