A nagy adatok forrása az orvostudományban

by Kevin Hwang, MD, MPH; Írta: Richard N. Fogoros, MD

A nagy adatok egyszerű meghatározása az orvostudományban: "a betegek egészségi állapotára és jólétére vonatkozó adatok összessége" (Raghupathi 2014). De pontosan ezek az adatok, és honnan származnak?

Az alábbiakban áttekintjük az egészségügyi szolgáltatók, a kutatók, a fizetők, a döntéshozók és az ipar érdeklődésére számot tartó nagy adatok típusát és forrásait.

Ezek a kategóriák nem kölcsönösen kizárják egymást, mert ugyanazok az adatok különböző forrásokból származhatnak.

Ez a lista sem kimerítő, mert a nagy adatelemzések gyakorlati alkalmazása biztosan tovább fog bővülni.

Klinikai információs rendszerek

Ezek a klinikai adatok hagyományos forrásai, amelyeket az egészségügyi szolgáltatók megszokták a megtekintéshez.

Az elektronikus egészségügyi nyilvántartások (EHR-k) gyűjtenek, tárolnak és megjelenítenek olyan információkat, mint a demográfia, a múltbeli kórtörténet, aktív orvosi problémák, immunizálás, allergia, gyógyszerek, vitális jelek, laboratóriumi és radiológiai vizsgálatok eredményei, patológiai jelentések, szolgáltatók, valamint adminisztratív és pénzügyi dokumentumok
Az elektronikus egészségügyi nyilvántartás (EMR) nem azonos az EHR-kkel, és általában az adott orvosnál tárolt adatokra vonatkozik.
Az egészségügyi információcsere hubokként szolgál a különféle klinikai információs rendszerek között

Az egészségügyi szervezetek által saját betegeik által fenntartott betegkönyvek gyakran kapcsolódnak az EHR-hez. Más nyilvántartások nyomon követik az immunizációkat, rákot, traumákat és más közegészségügyi kérdéseket szélesebb földrajzi skálán.

A betegportálok lehetővé teszik a betegek számára az egészségügyi szervezet EHR-jében tárolt személyes egészségügyi információkat. Egyes betegportálok lehetővé teszik a felhasználók számára, hogy kérjenek újratöltést és biztonságos elektronikus üzeneteket cseréljenek az egészségügyi csapattal.

A klinikai adattárházak több klinikai információs rendszerből, például EHR-ből és más forrásból gyűjtenek páciens szintű adatokat

Kifizetési adatok a fizetőktől

A köztulajdonosok (pl. Medicare) és a magánfizetők nagy mennyiségű adattárral rendelkeznek a követelésekről a kedvezményezettjeikről. Néhány egészségbiztosító most is ösztönzést nyújt az egészségügyi adatok megosztására.

Kutatási tanulmányok

A kutatási adatbázisok információkat tartalmaznak a résztvevőkről, a kísérleti kezelésekről és a klinikai eredményekről. A nagy tanulmányokat általában gyógyszeripari vállalatok vagy kormányzati szervek szponzorálják. A személyre szabott gyógyszer alkalmazásának célja az egyéni betegek hatékony kezelése, a klinikai vizsgálatok adatai alapján.

Ez a megközelítés túlmutat a bizonyítékokon alapuló orvosi alapelvek alkalmazásán, amellyel az egészségügyi szolgáltató meghatározza, hogy a páciens széles körű jellemzőkkel (pl. Életkor, nem, faj, klinikai állapot) osztozik-e a kísérleti résztvevőkkel. Nagy adatanalitika mellett lehetőség nyílik a szemcsésebb információk, például a páciens rák genetikai profilja alapján történő kezelés kiválasztására (lásd alább).

A klinikai döntéstámogató rendszerek (CDSS) is gyorsan fejlődnek, és most a mesterséges intelligencia (AI) jelentős részét képviselik az orvostudományban.

A betegadatokat felhasználják az orvosok döntéshozatalhoz való segítésére, és gyakran az EHR-kkel kombinálva.

Genetikai adatbázisok

Az emberi genetikai információ tárolója gyors ütemben felhalmozódik. Mivel az emberi genomprojekt 2003-ban fejeződött be, az emberi DNS-szekvenálás költségei egymilliószor csökkentek. A Harvard Medical School által 2005-ben elindított Personal Genome Project (PGP) arra törekszik, hogy 100.000 önkéntes teljes genomját sorrendben és nyilvánosságra hozza a világ minden tájáról. A PGP maga a nagy adatprojekt egyik legfontosabb példája a puszta adatmennyiségnek és változatosságnak köszönhetően.

A személyes genom körülbelül 100 gigabájt adatot tartalmaz. A genomok szekvenálásán túl a PGP szintén gyűjt adatokat az EHR-ekről, felmérésekről és mikrobiológiai profilokról.

Számos vállalat kínál közvetlen fogyasztói genetikai szekvenciát az egészség, a személyes tulajdonságok és a farmakogenetika számára kereskedelmi alapon.

Ezt a személyes adatot nagy adatelemzésnek vethetjük alá. Például: 23. és a 22. év november 22-én leállította az egészségügyi vonatkozású genetikai jelentéseket új ügyfeleknek, hogy megfeleljen az Egyesült Államok Élelmiszer- és Gyógyszerügyi Hatóságának. 2015-ben azonban a vállalat újra megindította a genetikai nyálvizsgálat egyes egészségügyi összetevőit, ezúttal az FDA jóváhagyásával.

Nyilvános adatok

A kormány részletes nyilvántartást vezet az egészséggel kapcsolatos eseményekről, például bevándorlásról, házasságról, születésről és halálról. Az Egyesült Államok népszámlálása 1790 óta 10 évente hatalmas mennyiségű információt gyűjtött össze. A népszámlálás statisztikai honlapja 2013-ban 370 milliárd sejt volt, évente hozzávetőleg 11 milliárdot.

Webes keresések

A Google és más internetes keresési szolgáltatók által gyűjtött webes keresési információk valós idejű betekintést nyújthatnak a lakosság egészségével kapcsolatban. Ugyanakkor a webes keresési mintákból származó nagy adatok értéke javítható a hagyományos egészségügyi adatokkal való kombinálásával.

Közösségi média

A Facebook, a Twitter és más közösségi média platformok gazdag adathalmazt generálnak éjjel-nappal, így megtekinthetik a felhasználók helyszíneit, egészségügyi viselkedéseit, érzelmeit és társadalmi kapcsolatait. A közösségi média nagy adatainak közegészségügyi alkalmazását digitális betegség-kimutatásnak vagy digitális epidemiológiának nevezik. A Twitter például az influenzajárványok elemzésére szolgál az általános lakosság körében.

A Pennsylvani Egyetemen elindított Világkielégítő projekt egy másik példa a szociális média tanulmányozására, hogy jobban megértse az emberek tapasztalatait és egészségét. A projekt összefogja a pszichológusokat, a statisztikusokat és a számítógépes tudósokat, akik az online interakció során használt nyelveket elemzik például például a Facebookon és a Twitteren. A tudósok megfigyelik, hogy a felhasználók nyelvének hogyan viszonyul az egészségéhez és boldogságához. A természetes nyelvfeldolgozás és a gépi tanulás előrehaladása segítséget nyújt a törekvésükhöz. A Pennsylvaniai Egyetem legutóbbi kiadványa a szociális média elemzésével megvizsgálta a mentális betegségek előrejelzésének módjait. Úgy tűnik, hogy a depresszió tünetei és más mentális egészségi állapotok kimutathatók az internet használatának tanulmányozásával. A tudósok remélik, hogy a jövőben ezek a módszerek képesek lesznek jobban azonosítani és segíteni a veszélyeztetett egyéneket.

A tárgyak internete (IoT)

Az egészséggel kapcsolatos információk nagy mennyiségét gyűjtik és tárolják mobil és otthoni készülékeken is .

Okostelefonok : Több ezer mHealth alkalmazás rögzíti a felhasználó fizikai aktivitásával, táplálékbevitelével, alvási szokásaival, érzelmeivel és egyéb paramétereivel kapcsolatos információkat. Az őshonos mobiltelefon-alkalmazások (pl. GPS, e-mail, szövegküldés) is adhatnak információt az egyén egészségi állapotáról.
Hordozható monitorok és eszközök: A bőr alá beágyazott pedométerek, gyorsulásmérők, szemüvegek, órák és zsetonok is összegyűjtik az egészséggel kapcsolatos információkat, és elküldhetik őket a felhőbe.
A távorvoslási eszközök lehetővé teszik az egészségügyi szolgáltatók számára, hogy nyomon kövessék a páciensek paramétereit, például a vérnyomást, a pulzusszámot, a légzésszámot, az oxigénellátást, a hőmérsékletet, az EKG-nyomokat és a súlyt.

Pénzügyi tranzakciók

A betegek hitelkártyás tranzakciói szerepelnek a Carolinas HealthCare System által használt prediktív modellekben, amelyek azonosítják azokat a betegeket, akik nagy kockázatnak vannak kitéve a kórházba való visszaérkezéshez. A Charlotte-alapú egészségügyi szolgáltató nagy mennyiségű adatot használ a betegek különböző csoportokba osztására, például a betegség és a földrajzi elhelyezkedés alapján.

Etikai és magánélet-védelmi vonatkozások

Ki kell emelni, hogy bizonyos esetekben fontos egészségügyi és magánéletre vonatkozó következmények merülhetnek fel az adatok összegyűjtése és az egészségügyi ellátáshoz való hozzáférés során. A nagy adatok új forrásai javíthatják megértésünket az egyének és a lakosság egészségének hatásairól, azonban a különböző kockázatokat alaposan meg kell fontolni és figyelemmel kell kísérni. Most is felismerték, hogy az előzőleg névtelennek tekintett adatok újra azonosíthatók. Például a Harvard Data Privacy Lab laboratóriumának Latanya Sweeney professzora áttekintette a Personal Genome Project-ben résztvevő 1.130 önkéntest. Ő és csapata a megosztott információ (ZIP, születési dátum, nem) alapján helyesen nevezte meg a résztvevők 42 százalékát . Ez a tudás növelheti tudatosságunkat a potenciális kockázatokkal kapcsolatban, és segíthet nekünk jobb adatmegosztási döntéseket hozni.

> Források:

> Conway M, O'Connor D. A szociális média, a nagy adatok és a mentális egészség: a jelenlegi fejlődés és az etikai következmények. Jelenlegi vélemény a pszichológiában 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Nagy adatok, nagyobb eredmények. Az Amerikai Egészségügyi Információs Menedzsment Szövetség ( Journal of the American Health Information Management Association) , 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. A depresszió és a mentális betegségek felismerése a közösségi médiában: integrált áttekintés . Jelenlegi vélemény a viselkedési tudományokban 2017; 18: 43-49.

> Lazer D, Kennedy R, G király, Vespignani A. A Google influenza példája: csapdák a nagy adatelemzésben . Tudomány 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Nagy adatelemzés az egészségügyben: ígéret és erőteljes al. Egészségügyi információs rendszerek és rendszerek 2014; 2: 3.

> Sweeney L, Abu A, Winn J. A résztvevők azonosítása a Personal Genome Project név szerint . Harvard Egyetem. Adatvédelmi Lab. Fehér könyv 1021-1. 2013. április 24.