A nagy adatok forrása az orvostudományban

A nagy adatok forrása az orvostudományban

A nagy adatok egyszerű meghatározása az orvostudományban: "a betegek egészségi állapotára és jólétére vonatkozó adatok összessége" (Raghupathi 2014). De pontosan ezek az adatok, és honnan származnak?

Az alábbiakban áttekintjük az egészségügyi szolgáltatók, a kutatók, a fizetők, a döntéshozók és az ipar érdeklődésére számot tartó nagy adatok típusát és forrásait.

Ezek a kategóriák nem kölcsönösen kizárják egymást, mert ugyanazok az adatok különböző forrásokból származhatnak.

Ez a lista sem kimerítő, mert a nagy adatelemzések gyakorlati alkalmazása biztosan tovább fog bővülni.

Klinikai információs rendszerek

Ezek a klinikai adatok hagyományos forrásai, amelyeket az egészségügyi szolgáltatók megszokták a megtekintéshez.

Kifizetési adatok a fizetőktől

A köztulajdonosok (pl. Medicare) és a magánfizetők nagy mennyiségű adattárral rendelkeznek a követelésekről a kedvezményezettjeikről. Néhány egészségbiztosító most is ösztönzést nyújt az egészségügyi adatok megosztására.

Kutatási tanulmányok

A kutatási adatbázisok információkat tartalmaznak a résztvevőkről, a kísérleti kezelésekről és a klinikai eredményekről. A nagy tanulmányokat általában gyógyszeripari vállalatok vagy kormányzati szervek szponzorálják. A személyre szabott gyógyszer alkalmazásának célja az egyéni betegek hatékony kezelése, a klinikai vizsgálatok adatai alapján.

Ez a megközelítés túlmutat a bizonyítékokon alapuló orvosi alapelvek alkalmazásán, amellyel az egészségügyi szolgáltató meghatározza, hogy a páciens széles körű jellemzőkkel (pl. Életkor, nem, faj, klinikai állapot) osztozik-e a kísérleti résztvevőkkel. Nagy adatanalitika mellett lehetőség nyílik a szemcsésebb információk, például a páciens rák genetikai profilja alapján történő kezelés kiválasztására (lásd alább).

A klinikai döntéstámogató rendszerek (CDSS) is gyorsan fejlődnek, és most a mesterséges intelligencia (AI) jelentős részét képviselik az orvostudományban.

A betegadatokat felhasználják az orvosok döntéshozatalhoz való segítésére, és gyakran az EHR-kkel kombinálva.

Genetikai adatbázisok

Az emberi genetikai információ tárolója gyors ütemben felhalmozódik. Mivel az emberi genomprojekt 2003-ban fejeződött be, az emberi DNS-szekvenálás költségei egymilliószor csökkentek. A Harvard Medical School által 2005-ben elindított Personal Genome Project (PGP) arra törekszik, hogy 100.000 önkéntes teljes genomját sorrendben és nyilvánosságra hozza a világ minden tájáról. A PGP maga a nagy adatprojekt egyik legfontosabb példája a puszta adatmennyiségnek és változatosságnak köszönhetően.

A személyes genom körülbelül 100 gigabájt adatot tartalmaz. A genomok szekvenálásán túl a PGP szintén gyűjt adatokat az EHR-ekről, felmérésekről és mikrobiológiai profilokról.

Számos vállalat kínál közvetlen fogyasztói genetikai szekvenciát az egészség, a személyes tulajdonságok és a farmakogenetika számára kereskedelmi alapon.

Ezt a személyes adatot nagy adatelemzésnek vethetjük alá. Például: 23. és a 22. év november 22-én leállította az egészségügyi vonatkozású genetikai jelentéseket új ügyfeleknek, hogy megfeleljen az Egyesült Államok Élelmiszer- és Gyógyszerügyi Hatóságának. 2015-ben azonban a vállalat újra megindította a genetikai nyálvizsgálat egyes egészségügyi összetevőit, ezúttal az FDA jóváhagyásával.

Nyilvános adatok

A kormány részletes nyilvántartást vezet az egészséggel kapcsolatos eseményekről, például bevándorlásról, házasságról, születésről és halálról. Az Egyesült Államok népszámlálása 1790 óta 10 évente hatalmas mennyiségű információt gyűjtött össze. A népszámlálás statisztikai honlapja 2013-ban 370 milliárd sejt volt, évente hozzávetőleg 11 milliárdot.

Webes keresések

A Google és más internetes keresési szolgáltatók által gyűjtött webes keresési információk valós idejű betekintést nyújthatnak a lakosság egészségével kapcsolatban. Ugyanakkor a webes keresési mintákból származó nagy adatok értéke javítható a hagyományos egészségügyi adatokkal való kombinálásával.

Közösségi média

A Facebook, a Twitter és más közösségi média platformok gazdag adathalmazt generálnak éjjel-nappal, így megtekinthetik a felhasználók helyszíneit, egészségügyi viselkedéseit, érzelmeit és társadalmi kapcsolatait. A közösségi média nagy adatainak közegészségügyi alkalmazását digitális betegség-kimutatásnak vagy digitális epidemiológiának nevezik. A Twitter például az influenzajárványok elemzésére szolgál az általános lakosság körében.

A Pennsylvani Egyetemen elindított Világkielégítő projekt egy másik példa a szociális média tanulmányozására, hogy jobban megértse az emberek tapasztalatait és egészségét. A projekt összefogja a pszichológusokat, a statisztikusokat és a számítógépes tudósokat, akik az online interakció során használt nyelveket elemzik például például a Facebookon és a Twitteren. A tudósok megfigyelik, hogy a felhasználók nyelvének hogyan viszonyul az egészségéhez és boldogságához. A természetes nyelvfeldolgozás és a gépi tanulás előrehaladása segítséget nyújt a törekvésükhöz. A Pennsylvaniai Egyetem legutóbbi kiadványa a szociális média elemzésével megvizsgálta a mentális betegségek előrejelzésének módjait. Úgy tűnik, hogy a depresszió tünetei és más mentális egészségi állapotok kimutathatók az internet használatának tanulmányozásával. A tudósok remélik, hogy a jövőben ezek a módszerek képesek lesznek jobban azonosítani és segíteni a veszélyeztetett egyéneket.

A tárgyak internete (IoT)

Az egészséggel kapcsolatos információk nagy mennyiségét gyűjtik és tárolják mobil és otthoni készülékeken is .

Pénzügyi tranzakciók

A betegek hitelkártyás tranzakciói szerepelnek a Carolinas HealthCare System által használt prediktív modellekben, amelyek azonosítják azokat a betegeket, akik nagy kockázatnak vannak kitéve a kórházba való visszaérkezéshez. A Charlotte-alapú egészségügyi szolgáltató nagy mennyiségű adatot használ a betegek különböző csoportokba osztására, például a betegség és a földrajzi elhelyezkedés alapján.

Etikai és magánélet-védelmi vonatkozások

Ki kell emelni, hogy bizonyos esetekben fontos egészségügyi és magánéletre vonatkozó következmények merülhetnek fel az adatok összegyűjtése és az egészségügyi ellátáshoz való hozzáférés során. A nagy adatok új forrásai javíthatják megértésünket az egyének és a lakosság egészségének hatásairól, azonban a különböző kockázatokat alaposan meg kell fontolni és figyelemmel kell kísérni. Most is felismerték, hogy az előzőleg névtelennek tekintett adatok újra azonosíthatók. Például a Harvard Data Privacy Lab laboratóriumának Latanya Sweeney professzora áttekintette a Personal Genome Project-ben résztvevő 1.130 önkéntest. Ő és csapata a megosztott információ (ZIP, születési dátum, nem) alapján helyesen nevezte meg a résztvevők 42 százalékát . Ez a tudás növelheti tudatosságunkat a potenciális kockázatokkal kapcsolatban, és segíthet nekünk jobb adatmegosztási döntéseket hozni.

> Források:

> Conway M, O'Connor D. A szociális média, a nagy adatok és a mentális egészség: a jelenlegi fejlődés és az etikai következmények. Jelenlegi vélemény a pszichológiában 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Nagy adatok, nagyobb eredmények. Az Amerikai Egészségügyi Információs Menedzsment Szövetség ( Journal of the American Health Information Management Association) , 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. A depresszió és a mentális betegségek felismerése a közösségi médiában: integrált áttekintés . Jelenlegi vélemény a viselkedési tudományokban 2017; 18: 43-49.

> Lazer D, Kennedy R, G király, Vespignani A. A Google influenza példája: csapdák a nagy adatelemzésben . Tudomány 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Nagy adatelemzés az egészségügyben: ígéret és erőteljes al. Egészségügyi információs rendszerek és rendszerek 2014; 2: 3.

> Sweeney L, Abu A, Winn J. A résztvevők azonosítása a Personal Genome Project név szerint . Harvard Egyetem. Adatvédelmi Lab. Fehér könyv 1021-1. 2013. április 24.