Gräva guld i patientjournaler

Auria biopankki
Auria-tietopalvelu

Det är utmanande att maskinellt utnyttja patientjournaler som är skrivna i form av fritext, eftersom även enkla saker kan uttryckas på många olika sätt. Lingsoft ansvarar för indexering och textutvinning av Egentliga Finlands sjukvårdsdistrikts datapool i samarbete med Auria Tjänster 

Auria Biobank är Finlands första biobank. Biobanken har en samling på ungefär en miljon prover som kan användas inom medicinsk forskning. Även om prover från en biobank i sig är värdefulla för forskare ökar värdet enormt om proverna kan kombineras med uppgifter i patientjournaler. Uppgifterna i patientjournalerna administreras av Auria Datajänster – också de första i sitt slag i Finland. De har till uppgift att organisera, harmonisera och administrera de patientuppgifter som samlas i sjukvårdsdistriktets många datasystem, så att uppgifterna är så tillgängliga som möjligt för forskare och andra experter. 

Lingsoft har specialiserat sig på analys av kliniskt språk sedan 2008, och hälso- och sjukvård är en av våra snabbast växande kundsektorer. Den långsiktiga specialiseringen och unika kärnteknologin övertygade även Auria Tjänster, vars datapool över patientuppgifter vi började indexera och göra textutvinning i hösten 2017.

Forskningsbaserade kunskaper, trygg vård 

Det är utmanande att maskinellt utnyttja patientjournaler som är skrivna i form av fritext, eftersom något så enkelt som rökning kan uttryckas på många olika sätt – för att inte tala om mer komplicerade företeelser. Arbetet försvåras dessutom av exempelvis skrivfel och slang: i sjukskötarnas texter har begreppet noradrenalin visat sig ha hela 60 grundformer.
 
Informationssökning i fritext, det vill säga textutvinning, kräver språkteknologi, som i Aurias fall förutom det finska språket även klarar av att analysera kliniskt språk. Med Lingsofts språkteknologi är det möjligt att hitta de företeelser i patientjournaler som man är ute efter: vi kan återställa orden till deras grundform och berika dem med semantisk information. Semantisk information som bygger på ontologier med överordnade och underordnade begrepp och styrande termer tar informationssökning till en ny nivå, och gör att man kan undvika en del av utmaningarna med synonymi. Dessutom kan man identifiera andra önskade strukturer i texterna, som exempelvis namn eller personbeteckningar, som kan anonymiseras och pseudonymiseras med vår teknologi. I den datapool som administreras av Auria Datajänster och som ligger bakom dess brandväggar görs indexeringen som möjliggörs genom textutvinning utan att patientuppgifterna flyttas någonstans.
 
”En effektiv och säker vård bygger på forskningsbaserad kunskap. Jag har stora förväntningar på textutvinningen, och tiden får utvisa vilka typer av verktyg vi lyckas utveckla till hjälp för läkare och forskare,” säger Arho Virkki, chef för Auria Datajänster.

Det har även uppstått ett stort internationellt intresse för uppgifterna i de finska biobankerna och patientuppgifterna: uppgifterna är tillförlitliga, elektroniska, kan sammanföras från olika system och är från en lång tid tillbaka. Dessutom är finländarnas arvsanlag lockande. Utan den rätta sorten hacka förblir dock grävandet efter guld en dröm. Detsamma gäller för andra branscher, vars utmaningar Lingsofts lösningar kan ge svar på.