Behovet av öppna data för hälso- och sjukvården

Del 8 i bloggserien för uppdraget Swelife 😍 AI. Swelifes AI-projekt undersöker Sveriges förutsättningar för att bli framstående inom AI-tekniker. Vi har stött på, i mitt tycke, helt onödiga hinder hos exempelvis Inera när vi försöker få använda de texter som finns på 1177.se för AI-tekniken NLP (Natural Language Processing).

Vi fick inte lov att sprida detta material ens i workshops för att folkbilda om AI. Inte heller för att ge bort ett startpaket med data och exempelkod till de som på egen hand vill börja lära sig om AI i omsorgen, hälso- och sjukvården.

Allt som betalats av skattebetalare borde vara öppet?

Allt som produceras av SKL och Inera borde per automatik erbjudas som öppna data. Om inte ens artiklarna på 1177.se lämnas ut öppet kan man undra hur vi ska kunna bli bäst på ehälsa till 2025? I dagsläget betraktas 1177-artiklarna som allmän handling och erbjuds i en strukturerad form (ett så kallat API). Dock krävs det att man signerar avtal och att man inte sprider informationen vidare. Dessa hållhakar begränsar inte exempelvis Google som genom sin storhet kan hämta allt material direkt från webbplatsen.

Gynna utländska aktörer?

Det är lite konstigt att det som bekostats av svenska skattebetalare är lättare att använda för Google än våra egna entreprenörer, eller vård- och omsorgen själv.

Öppna data

Öppna data har en definition vilket innebär att det är lätt att kravställa. Definitionen är allmänt accepterad. Att det är webbens grundare, Berners-Lee, som författade det hela gjorde det säkert enklare att nå en samsyn.

Frågan har varit aktuell i åtminstone 10 år. Bland annat hos Edelegationen, Riksarkivet och finns numera hos DIGG. Dock är det dags att de organisationer som producerar viktiga datamängder öppnar upp dem per automatik och att eventuella begränsningar är välmotiverade och ganska sällsynta.

Fler datakällor som vore intressanta att mixa ihop med det Inera producerar är bland annat:

  • Kolada – kommuner och landsting rapporterar jämförelsedata nationellt, men tycks inte få lov att själva återanvända varandras data för att göra egna analyser, exempelvis mellan två storstadsregioners sjukhus.
  • Kvalitetsregister – allt ofarligt från registren. Kanske på gruppnivå, kommunnivå, diagnosgrupper, etc. Karolinska har tidigare gjort projekt om hur mycket abstraktion som behövs för att gömma en person i en grupp när det gäller vårddata.

Data anses vara vår nya naturresurs. Men om den inte är öppen och lätt att hitta kommer den ändå inte till användning.

Mer om öppenhet kring datakällor

Lämna ett svar

E-postadressen publiceras inte. Obligatoriska fält är märkta *