Didžiųjų duomenų šaltiniai medicinoje

Didžiųjų duomenų šaltiniai medicinoje

Paprastai dideli medicinos duomenys apibrėžiami kaip "su pacientų sveikatos priežiūra ir gerove susiję duomenys" (Raghupathi 2014). Bet kas tiksliai yra šie duomenų tipai ir iš kur jie kilę?

Toliau pateikiama plati sveikatos priežiūros paslaugų teikėjų, tyrėjų, mokėtojų, politikų ir pramonės atstovų susidomėjimo didelių duomenų rūšių ir šaltinių apžvalga.

Šios kategorijos nėra tarpusavyje susijusios, nes tie patys duomenys gali būti kilę iš įvairių šaltinių.

Šis sąrašas nėra išsamus, nes praktinis didelių duomenų analizės taikymas neabejotinai išaugs.

Klinikinės informacinės sistemos

Tai yra tradiciniai klinikinių duomenų šaltiniai, kad sveikatos priežiūros paslaugų teikėjai yra pripratę prie žiūrėjimo.

Pateikiami duomenys iš mokėtojų

Viešieji mokiniai (pvz., "Medicare") ir privatūs mokiniai turi didelių duomenų apie jų gavėjus reikalavimus. Kai kurie sveikatos draudikai dabar taip pat siūlo paskatas dalytis savo sveikatos duomenimis.

Moksliniai tyrimai

Tyrimų duomenų bazėse pateikiama informacija apie tyrimo dalyvius, eksperimentinius tyrimus ir klinikinius rezultatus. Dideles studijas paprastai finansuoja farmacijos įmonės arba vyriausybės agentūros. Individualizuoto vaisto vartojimas yra suderinti atskirus pacientus su veiksmingu gydymu, remiantis klinikinių tyrimų duomenimis.

Šis metodas neleidžia taikyti įrodymais pagrįstų medicinos principų, pagal kuriuos sveikatos priežiūros paslaugų teikėjas nustato, ar pacientas turi bendrų savybių (pvz., Amžių, lytį, rasę, klinikinę būklę) su bandymų dalyviais. Naudojant didelius duomenų analizės duomenis, galima pasirinkti gydymą, pagrįstą daug labiau granuliuota informacija, pvz., Paciento vėžio genetiniu profiliu (žr. Toliau).

Klinikinės sprendimų palaikymo sistemos (CDSS) taip pat sparčiai vystosi ir dabar yra didžioji dalis dirbtinio intelekto (AI) medicinoje.

Jie naudoja paciento duomenis, kad padėtų gydytojams priimti sprendimus, ir dažnai juos derina su EHR.

Genetinės duomenų bazės

Žmogaus genetinės informacijos saugykla ir toliau sparčiai kaupiasi. Kadangi žmogaus genomo projektas buvo baigtas 2003 m., Žmogaus DNR sekos nustatymo išlaidos buvo sumažintos milijonu kartų. 2005 m. "Harvardo medicinos mokyklos" pradėtas asmens genomo projektas (PGP) siekia sekti 100 000 savanorių iš viso pasaulio genome. Pačios PGP yra pagrindinis didžiųjų duomenų projektų pavyzdys, nes duomenų gausa ir įvairovė.

Asmens genomoje yra apie 100 gigabaitų duomenų. Be genomų sekų nustatymo, PGP taip pat renka duomenis iš EHR, apklausų ir mikrobiologinių profilių.

Nemažai kompanijų siūlo komercinį pagrindą sveikatos, asmeninių savybių ir farmakogenetikos sėklų genetinei sekai .

Ši asmeninė informacija gali būti paklūsta dideliems duomenų analizei. Pavyzdžiui, nuo 2013 m. Lapkričio 22 d. 23andMe nustojo teikti su sveikata susijusias genetines ataskaitas naujiems klientams, siekdami laikytis JAV maisto ir vaistų administracijos. Tačiau 2015 m. Bendrovė vėl pradėjo siūlyti tam tikrų sveikatos komponentų savo genetinių seilių tyrimą, šį kartą su FDA patvirtinimu.

Viešieji įrašai

Vyriausybė saugo išsamius įvykių, susijusių su sveikata, įrašus, tokius kaip imigracija, santuoka, gimimas ir mirtis. JAV surašymas surinko didžiulę informacijos kiekį kas 10 metų nuo 1790 m. Nuo 2013 m. Surašymo statistikos svetainėje buvo 370 milijardų ląstelių, kurių kasmet papildomai mokama apie 11 milijardų.

Žiniatinklio paieškos

"Google" ir kitų interneto paieškos paslaugų teikėjų surinkta žiniatinklio paieškos informacija gali suteikti realaus laiko įžvalgas, susijusias su gyventojų sveikata. Tačiau didelių duomenų iš interneto paieškos modelių vertė gali būti pagerinta derinant ją su tradiciniais sveikatos duomenų šaltiniais.

Socialinė žiniasklaida

"Facebook", "Twitter" ir kitos socialinės žiniasklaidos platformos sukuria daugybę įvairių duomenų per parą, pateikia informaciją apie vietoves, elgesį sveikatai, emocijas ir socialinę vartotojų sąveiką. Socialinės žiniasklaidos didelių duomenų taikymas visuomenės sveikatai vadinamas skaitmenine ligos aptikimo ar skaitmenine epidemiologija. Pavyzdžiui, "Twitter" buvo naudojamas analizuoti gripo epidemijas tarp gyventojų.

Pensilvanijos universitete įsteigtas "Pasaulio gero gyvenimo" projektas yra dar vienas socialinės žiniasklaidos priemonės tyrimo pavyzdys, siekiant geriau suprasti žmonių patirtį ir sveikatą. Projekte sujungiami psichologai, statistikai ir kompiuterių mokslininkai, kurie analizuoja kalbą, naudojamą bendraujant internete, pavyzdžiui, rašydami "Facebook" ir "Twitter" būsenos atnaujinimus. Mokslininkai pastebi, kaip vartotojai kalba apie jų sveikatą ir laimę. Pasiruošimas gamtos kalbų apdorojimui ir mašinų mokymasis padeda siekti jų pastangų. Neseniai Pensilvanijos universiteto leidinyje buvo nagrinėjamos psichinės ligos prognozavimo būdai, analizuojant socialinę žiniasklaidą. Atrodo, kad depresijos ir kitų psichinės sveikatos būklės simptomai gali būti aptikti tiriant mūsų naudojimąsi internetu. Mokslininkai tikisi, kad ateityje šie metodai galės geriau nustatyti ir padėti rizikos grupei priklausantiems asmenims.

Daiktų internetas (IoT)

Su sveikata susijusios informacijos srautai taip pat renkami ir saugomi mobiliuosiuose ir namų įrenginiuose .

Finansiniai sandoriai

Pacientų kredito kortelių operacijos įtraukiamos į prognozuojamus modelius, kuriuos naudoja "Carolinas HealthCare" sistema, siekiant nustatyti pacientus, kuriems gresia didelis pavojus būti grąžintoms į ligoninę. Šarlotės sveikatos priežiūros paslaugų teikėjas naudoja didelius duomenis, skirtus pacientams suskirstyti į įvairias grupes, pavyzdžiui, atsižvelgiant į ligą ir geografinę vietą.

Etikos ir privatumo pasekmės

Reikia pabrėžti, kad kai kuriais atvejais gali būti svarbus etikos ir privatumo užtikrinimas, kai renkami ir naudojami sveikatos priežiūros duomenys. Nauji didelių duomenų šaltiniai gali pagerinti mūsų supratimą apie tai, kokį poveikį žmonėms ir gyventojų sveikatai daro, tačiau reikia atidžiai apsvarstyti ir stebėti skirtingą riziką. Dabar taip pat buvo pripažinta, kad duomenys, anksčiau laikomi anoniminiais, gali būti iš naujo nustatyti. Pavyzdžiui, Harvardo duomenų privatumo laboratorijos profesorė Latanya Sweeney peržiūrėjo 1130 savanorių, dalyvaujančių Personalo genomo projekte. Ji ir jos komanda sugebėjo teisingai įvardyti 42 procentus dalyvių, remdamiesi informacija, kurią jie dalijasi (pašto kodas, gimimo data, lytis). Šios žinios gali padidinti mūsų supratimą apie galimą riziką ir padėti mums geriau spręsti dėl dalijimosiis duomenimis.

> Šaltiniai:

> Conway M, O'Connor D. Socialinė žiniasklaida, dideli duomenys ir psichinė sveikata: dabartiniai pasiekimai ir etiškos pasekmės. Dabartinė psichologijos nuomonė 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Dideli duomenys, didesni rezultatai. Amerikos sveikatos informacijos valdymo asociacijos leidinys 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Depresijos ir psichinių ligų nustatymas socialinėje žiniasklaidoje: integruotoji apžvalga . Dabartinė nuomonė elgesio mokslų 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Pavyzdys iš "Google" gripo: spąstai didelėse duomenų analizėse . Mokslas 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Didelė duomenų analizė sveikatos priežiūros srityje: pažadas ir potenci al. Sveikatos informacijos mokslų ir sistemų 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifikuoti asmeninio genomo projekto dalyvius pagal pavadinimą . Harvardo universitetas. Duomenų privatumo laboratorija. Baltoji knyga 1021-1. 2013 m. Balandžio 24 d.