Delrapport 2: Internationell utblick – AI för bättre hälsa

Del 15 i bloggserien för uppdraget Swelife 😍 AI. Här kommer delrapport två, som handlar om ett mer internationellt perspektiv.

Sammanfattning

Det råder stor aktivitet internationellt inom AI för att uppnå bättre hälsa . Men en stor del av aktiviteten är en bra bit bort från att vara implementerad. Utifrån det finns tekniska måttstockar och då finner vi  mycket i den lägre änden av TRL-skalan (Technology Readiness Level). Om man däremot ser dem utifrån ett innovationsperspektiv  är de nya, antagligen nyttiga men ännu inte nyttiggjorda. Bland annat en koreansk forskningsrapport inventerade hoppfulla studier inom radiologi och fann att  inte en bråkdel var validerade mot något som liknar den kliniska verkligheten.
Samtidigt finns det en äldre generation av AI-system (expertsystem) som åtminstone inom sjukvården
är  implementerad sedan länge.

Många gör saker inom AI för bättre hälsa. Men det som berättas om, nyheter som sprids över världen, skiljer sig från det som faktiskt förändrar människors  hälsa på riktigt. Massor med inspirerande, uppseendeväckande fynd och lösningar är lätta att hitta. De sakerna som hittar hela vägen fram till att göra nytta för människor, eller faktiskt implementerats, är det tystare om. Antagligen inte för att det saknas sådana exempel, gissningsvis för att AI mer ses som något som komma skall än något man kan kritiskt granska med egna ögon här och nu. Eller som John McCarthy, en av grundarna av AI-området, uttryckte den så kallade AI-effekten [1] :

“As soon as it works, no one calls it AI any more.”
– John McCarthy

Det saknas inte utmaningar. De är av olika sort, bland annat tillgång till lämpliga datakällor, regelverk som amerikanska HIPAA, EU:s dataskyddsförordning GDPR och det medicintekniska regelverket som klassar mjukvara som medicintekniska produkter. De sistnämnda belyser utmaningen med transparens, tillförlitlighet och etik för att lyckas uppnå en god hälsa oavsett ursprung eller individuella egenskaper.

Vissa spår en så kallad AI-vinter som nära förestående. En period av produktivitet där hajpen är borta, vilket är så som hajpkurvor förutspår utvecklingen över tid för alla innovativa tekniker. Samtidigt har nog inte särskilt stor del av de som till vardags jobbar med omvårdnad, hälsa eller sjukvård riktigt tagit till sig vad AI kan bidra med. Förhoppningsvis kommer dessa domänexperter tillsammans med kunniga inom AI att tillsammans börja omsätta idéerna till livskraftiga lösningar.



Inledning , syfte och metod

Denna delrapport tar avstamp från bl.a. den internationella utblick Socialstyrelsen gjorde i sin rapport, Digitala vårdtjänster och artificiell intelligens i hälso- och sjukvården [2] , som släpptes i oktober [3] . Med tanke på våra olika uppdrag finns kompletterande perspektiv som kan vara värda att ta upp.  Dessutom finns ett flertal befintliga utredningar och rapporter i ämnets olika delar.

Därför kommer denna delrapport att hänvisa frekvent och snarare än att redovisa kompletta förteckningar mer fokusera på nyansering , aktuell diskurs och uppdateringar sedan respektive referens skrevs.

AI beskrivs som den fjärde industriella revolutionen och något som snart , eller kanske redan nu, alla vi måste bry oss om för att fortsätta vara relevanta. Det är i ljuset av de högt ställda förväntningarna på detta “nya” som denna rapport studerat nuläget och om det även är tillämpbart inom life science som bransch, för att uppnå en bättre hälsa.

Avsikten med en internationell utblick är för a tt se vad andra gör och vilken nisch som skulle kunna göra Sverige konkurrenskraftigt internationellt. Att Sverige skulle kunna dominera på AI-området är det nog få som tror, men det finns också en farhåga att små länder riskerar att bli dataexportörer och inte hittar sin plats lite högre upp i värdekedjan.

Den här rapporten har inte alla svar på utmaningen om hur Sverige blir konkurrenskraftigt inom AI för bättre hälsa. Ambitionen är att ge en utblick, problematisera vissa ofta repeterade “sanningar” om sakernas tillstånd, bland annat.

Delrapporten ingår i det AI-projekt det strategiska innovationsprogrammet Swelife genomför under 2019. Delrapporten är att betrakta som ett öppet utkast för vem som helst att läsa och reagera på innan projektets slutrapport skrivs i januari 2020. Slutprodukten kommer även den att släppas öppet.

Metod för insamling av information

Studerat artiklar, läst böcker och rapporter i ämnet, poddar samt det som framkommit från intervjuer med svensk expertis.


Olika förekommande definitioner av life science och AI

En aktuell rapport som definierar AI är Socialstyrelsens Digitala vårdtjänster och artificiell intelligens i hälso- och sjukvården [4]  (oktober 2019). För att inkluderas ska AI-systemet relativt autonomt utföra en uppgift utifrån den information den fått, och/eller att systemet som med tiden lär sig och förbättrar sin förmåga att utföra sin uppgift [5] .

Beroende på hur man läser Socialstyrelsens kriterier kan det vara extremt få AI-verktyg som kvalificerar sig. Men man inkluderar också mer klassiska expertsystem, som är regelbaserade, trots att de inte lär sig själva utan snarare ganska handgripligen tränats av en människa. Dessa system kallas ofta för symbolisk AI [6]  eller GOFAI (Good Old-Fashioned AI). Symbolisk AI är en äldre generation av AI än den djupinlärning som tagit fart på senare år. Men till skillnad från system baserade på djupinlärning finns dessa sedan länge i drift inom vården.

En komplikation i definitionen [7]  av AI är att Socialstyrelsen i tidigare nämnd rapport, i termen “AI-stöd”, diskuterar de kring sina intervjuer med regionerna och då inkluderar mycket mer. Bland annat RPA [8]  för att minska mängden administration, samt “ System för ersättningar för vård från andra regioner ”.
Detta ska inte betraktas som kritik mot varken rapporten eller den definition som rapporten tar upp. Dock gör det definitionen mer oklar än om tilläggen utelämnats, vilket gör att den är svår att anamma fullt ut i denna rapport.

Definition av AI i denna rapport

Till skillnad från (en tolkad version av) Socialstyrelsens definition ställs möjligen lägre krav på hur pass autonom, självlärande eller självförbättrande en AI behöver vara. Dock utesluts all form av RPA eller generell automatisering. Relativt sofistikerade expertsystem i vården inkluderas. Dock är det inte helt enkelt att få tillräckligt med detaljer för att verkligen veta vilka komponenter som använts.

Exakt vad som avses med autonom, självlärande eller självförbättrande är en separat diskussion. Men i all korthet, dagens AI är:

  • Autonom  inom väldigt begränsade ramar.
  • Självlärande  avseende att maskininlärningsalgoritmernas har en förmåga att lösa en uppgift genom att utvinna information på ett (mer eller mindre) autonomt sätt. resultatet kan användas till exempel för att ge svar på specifika frågor.  
  • Självförbättrande  gäller vissa AI-system. I den mån de förfinar sina algoritmer baserat på nya data den utsätts för, så kallad online learning [9] . Vilket inom reinforcement learning [10]  är själva poängen då AI:n ska utforska olika möjliga lösningar.

Man ska inte förvänta sig att en AI som framgångsrikt klassificerar hudåkommor börjar excellera inom psykiatrin på egen hand. Då kommer man troligen vänta förgäves. Dessutom är självförbättrandet en process man behöver ha koll på vilket gör det enklare att bara släppa förbättringar stötvis när man kollat att resultatet faktiskt var en förbättring.

Life science enligt denna rapport ≈ bättre hälsa för människor

Swelife jobbar med svensk life science. När det gäller denna rapport avgränsas “life science” till att avse det som främjar bättre hälsa hos människor. Hur man håller människor friska, hanterar deras riskfaktorer och försöker bota sjukdom. Det kan handla om egenvård, läkemedel, hälsovård, sjukvård och omsorg exempelvis. Med andra ord finns en mängd olika aktörer som påverkar hur AI kan bidra till en bättre hälsa.

Allt som kallas för AI kanske inte är AI?

Under 2019 har det kommit ut nedslående studier om hur liten andel av det som säljs in som AI ens innehåller något sådant.

“According to the survey from London venture capital firm MMC, 40 percent of European startups that are classified as AI companies don’t actually use artificial intelligence in a way that is “material” to their businesses. MMC studied some 2,830 AI startups in 13 EU countries to come to its conclusion, reviewing the “activities, focus, and funding” of each firm.”
– Forty percent of ‘AI startups’ in Europe don’t actually use AI, claims report [11]  (The Verge, mars 2019)

Men det är inte så att det först 2019 upptäcktes att många lovade mer än de kunnat leva upp till när det gäller AI.

“Much of what’s being sold as “AI” today is snake oil — it does not and cannot work.”
– Arvind Narayanan [12] , professor i computer science på Princeton University

Andra inte direkt positiva resultat har gjorts av hur nära nyligen publicerade akademiska fynd inom AI är den verklighet som skriker efter AI-lösningar. Korean Journal of Radiology publicerade en artikel i februari, där man studerat flera hundra artiklar inom medicinsk bilddiagnostik. Dessvärre var det bara någon ynka procent som hade verifierats av utomstående och dessutom gick att använda till något:

“Of 516 eligible published studies, only 6% (31 studies) performed external validation. None of the 31 studies adopted all three design features: diagnostic cohort design, the inclusion of multiple institutions, and prospective data collection for external validation.”
– Dong Wook Kim, et al. [13]  (Korean Journal of Radiology, februari 2019)

De allra flesta studierna var testprojekt som inte gick att tillämpa i verkligheten. Man drog slutsatsen att:

“Nearly all of the studies published in the study period that evaluated the performance of AI algorithms for diagnostic analysis of medical images were designed as proof-of-concept technical feasibility studies and did not have the design features that are recommended for robust validation of the real-world clinical performance of AI algorithms.”
– Dong Wook Kim, et al. (Korean Journal of Radiology, februari 2019)

Ett kompletterande perspektiv från en intervjuad medicinteknisk ingenjör är att om det AI:n gör verkligen är intelligent är den troligen olaglig att använda, åtminstone i EU. Detta med hänvisning till den AI som inte kan förklara sig, ofta kallad blackbox  och att det ska vara nära på omöjligt att CE-märka sådant, samt att dataskyddsförordningen ställer sina krav på bevarandet av individers integritet och skydd mot automatiserat beslutsfattande.

Bild 1: TRL-skalan, en metod för att bedöma mognadsgrad på teknik
Bild 1: TRL-skalan, en metod för att bedöma mognadsgrad på teknik

Ett välvilligt sätt att se på AI-hajpen är att det mesta som blir rubriker inom AI är på en väldigt låg nivå på TRL-skalan [14] . Alltså att det är väldigt långt kvar till implementation ute i verkligheten. Inget fel i sig, men det framgår inte alltid hur långt det är kvar innan en lyckosam lösning kan förväntas komma till användning.


Internationella AI-centra

Inte allt det som listas nedan är specifikt för AI för bättre hälsa. Dessutom är det svårt att inte jämföra äpplen med päron, med tanke på allt som idag utmålas som AI. En god dos skepsis är på sin plats. Det som ändå tas upp är med är för att man nog i många fall kan komplettera den AI/IT-expertis som finns med närområdets domänexpertis inom hälsa. Vill du ha fler infallsvinklar har Socialstyrelsen en internationell utblick [15]  som sammanfattar förra årets Vinnova-rapport Artificiell intelligens i svenskt näringsliv och samhälle ,  samt den mer generella rapport, Artificial Intelligence: A European Perspective ,  som EU Science Hub [16]  släppte i september.

Alternativt kan du kolla in Crunchbase [17] , de har identifierat 219 st “hubbar” inom AI i stort och 7000 st startups inom maskininlärning. Dock blandar de nationer, region och städer, så det kräver lite geografikunskaper.

Nationer i framkant

USA och Kina nämns ofta, men också Kanada och EU-länderna som grupp. En vanlig jämförelse på nationell nivå är att prata om hur mycket man satsar rent ekonomiskt eller att det redovisas vilka kända företag som finns. Det är mer sällsynt att man pratar om resultat på en nationell nivå. Det kanske är naturligt då resultat ofta rapporteras längre ner i strukturen, exempelvis från företag och universitet, eller på en överstatlig nivå med de teknikjättar som finns.

Ett land som sticker ut lite är Kanada med deras CIFAR [18] , de släpper en årlig rapport [19]  om hur det går med deras nationella AI-strategi. Enligt CIFAR var de först med att ta fram en nationell AI-strategi.

EU vill förstås inte vara sämre och satsar relativt stort. När Europeiska investeringsfonden (EIF) i november [20]  gick ut med att man satsar en miljard på AI (och blockkedjeteknik) poängterar man behovet av att inte enbart finansiera forskning:

“[…] much of the funding is directed at the research and proof-of-concept stage. When it comes to funding development on a larger scale, we just don’t do so much of it in Europe.”
– Why do we need to support blockchain and AI in Europe? (EIF, november 2019)

EIF poängterar att de som lyckas ta steget från forskning till företagande i stor utsträckning varit beroende av stöd från USA eller den amerikanska marknaden. Vilket kan leda till “brain-drain” i Europa, att de med bra lösningar flyttar eller på andra sätt binds upp av utom-Europeiska intressen.
I form av faktiska resultat är det kanske EU:s HLEG (High-Level Experts Group) on AI
[21]  som stått för det mest påtagliga bidraget på senare tid genom sina Etiska riktlinjer för tillförlitlig AI [22] . Under 2018-2019 har etisk användning av AI diskuterats flitigt. En och annan snyting har utdelats för hur användningsområden och mål för den AI som utvecklas i Kina, men också hur väl amerikanska företags AI-teknik linjerar med integritet, individens rätt till ett privatliv och skydd mot automatiska beslut så som de regleras bland annat i EU:s dataskyddsförordning.

Företag som verkar inom AI för bättre hälsa

Gartner släppte en rapport [23]  juli 2019, som visserligen inte är specifik för life science, där 59% av företagen redan sjösatt minst ett AI- eller maskininlärningsprojekt. Genomsnittligen har de fyra projekt igång, sex ytterligare planerade för 2020. Till år 2022 uppskattar de som svarat i studien att de har i genomsnitt 35 projekt igång.

En intressant detalj i den studien är att den vanligaste drivkraften bakom AI-initiativen uppges bero på önskan om en förbättrad kundupplevelse. Hela 40% hoppas på att uppnå detta. Denna studie är inte specifik för de som jobbar med AI för bättre hälsa, men beskriver hur tankegångarna går generellt.

Hajpkurva med olika stadier av teknikmognad


Bild 2: Hajpkurva med olika stadier av teknikmognad  

Det är svårt att veta vad exakt vad som avses med alla dessa skrivelser och pressmeddelanden man stöter på. Är det samma AI alla pratar om?
Det är lätt att tro att de etablerade aktörerna inom hälsosektorn inte innoverar med hjälp av AI-teknik då de sällan får de stora rubrikerna. Om man ska våga sig på lite spekulerande kanske de etablerade aktörerna befinner sig längre till höger på hajpkurvan
[24] , de är mer mogna , de är inne i den produktiva platån. Det förutsätter att AI-teknik inte kom som en total överraskning för dem utan att de jobbat metodiskt och datadrivet redan innan. Att dagens AI-teknik i deras värld bara är kontinuerlig förbättring av det de redan gjorde och var experter på.

Om man spekulerar lite kring de sensationella rubrikerna så är de ofta från en startup eller att någon har en mäktig IT-jätte i ryggen. Som startup är kommunikation väsentligt, samt att dra nytta av en hajp hjälper för att hitta finansiärer för att ha råd med sin utveckling. På startup-scenen är av naturliga skäl hajpkurvans “Peak of inflated expectations” ett normaltillstånd, det är trots allt att omvandla en “technology trigger” till något lönsamt man försöker hitta.  AI är utan tvekan en technology trigger och möjliggörare. En startup kan dra nytta av att använda detta på sätt som de etablerade aktörerna inte insett skapar nytta. En startup är förstås snabbare på att ställa om i sitt utforskande av möjligheterna.

Exempel på intressanta bolag

Med all respekt för etablerade aktörers arbete listas nedan några exempel på mer omvälvande lösningar. Sen om de kommer att fungera bra nog för en implementation återstår att se.

Insilico Medicine  har i vad som utmålats som läkemedelindustrins AlphaGo-ögonblick visat exempel på hur man lyckats generera fram kandidater till läkemedel [25]  på några dagar. Det ska vara femton gånger snabbare än vad som är brukligt.

”The drug discovery process consists of many phases and often takes decades. In preclinical phases the failure rates are over 99%. Our AI can be used in all phases and in some cases lead to superhuman results. Our AI is exceptionally good at finding the molecular targets in specific diseases and inventing new chemistry. We intend to use this in a big way.”
– Alex Zhavoronkov PhD, Founder & CEO, Insilico Medicine
[26]

Företaget Verily [27]  (ägd av Alphabet, alltså Googles moderbolag) jobbar i gränslandet mellan teknik, data science och hälsovården med att skapa nytta av all den hälsodata som finns. Detta genom precisionsmedicin som personaliserad behandling av parkinsons, men också i NHS:s testbädd för tidiga interventioner, bland många exempel [28] .

Ett företag som många av oss nog inser har en bit kvar innan en massmarknad är Neuralink [29]  som har Elon Musk som färgstark ambassadör. Neuralinks ansats är att bygga ett gränssnitt mellan hjärnans biologi och teknisk utrustning, så kallad brain-machine interface (BMI). Detta skulle kunna användas dels för kommunikation mellan hjärna och maskin, men också för terapi genom att hjärnan stimuleras.

“Brain-machine interfaces (BMIs) hold promise for the restoration of sensory and motor function and the treatment of neurological disorders, but clinical BMIs have not yet been widely adopted, in part because modest channel counts have limited their potential.
[…]
We have also built a neurosurgical robot capable of inserting six threads (192 electrodes) per minute. Each thread can be individually inserted into the brain with micron precision for avoidance of surface vasculature and targeting specific brain regions. The electrode array is packaged into a small implantable device”

– An integrated brain-machine interface platform with thousands of channels
[30]  (Elon Musk, Neuralink, juli 2019)


Problematisering

Som väntat när något är så eftertraktat som det löfte AI utlovar uppstår det en angelägenhet och ibland oro över många frågor. Vilka är det som kan ställa om hälso- och sjukvården, läkemedel, eller hjälpa människor med egenvård? Är det rimligt att någon startup kan bli en hälsoteknikjätte och tvinga fram ett helt annat ekosystem, likt sociala mediers framfart, eller annonsföretaget Googles sätt att dra nytta av webben?

Nya företag, och de som inte är erfarna vid just hälsosektorn, riskerar förstås att sakna vissa erfarenhet som de etablerade betraktar som så uppenbar praxis att man inte nödvändigtvis kommer ihåg att kravställa det vid upphandling eller samarbeten. Brittiska NHSx, som jobbar med digitalisering av NHS, belyser i sin rapport Artificial Intelligence: How to get it right – Putting policy into practice for safe data-driven innovation in health and care  att man behöver ett ramverk för styrning av AI. Där nämns bland annat behovet av en uppförandekod, använda öppna standarder, att algoritmer ska kunna förklaras, och mycket mer.

Amerikanska och kinesiska IT-jättar kliver in och styr upp healthtech?

En relativt vanlig idé om vad som komma skall är att de stora IT-bolagen (snart) kommer att komma ikapp vården. Att de med sin djupa kompetens inom teknik och allt vad AI är kommer lösa både hälso- och sjukvård ens utmaningar – bara de får tillgång till tillräckligt mycket data.

För i data finns evidens i form av mer eller mindre gömda mönster. AI:n är så mycket mer effektiv än människor på att hitta dessa mönster. AI kan dessutom lära sig själv saker redan nu, och vissa menar att utvecklingen sker i en exponentiell takt – det går redan jättefort och allt fortare. Så varför skulle det ta mer än enbart tid för AI att utklassa människor i allt som har med hälsa och vård att göra?

Försök till nyansering

Är AI för bättre hälsa ens ett teknikproblem? Man skulle kunna tro det när man läser om vad stora teknikbolag förväntas kunna åstadkomma. Dock, om man tilldelar dessa teknikbolag en annan branschtillhörighet än just IT så är blir det ofta marknadsföring, media eller e-handel. Det gäller både de amerikanska och kinesiska IT-jättarna.

De är jätteduktiga på att med teknik hantera människors uppmärksamhet, visa annonser, föreslå produkter och liknande. Dessa egenskaper är inte oviktiga för att kunna skapa en bättre hälsa, men det är inte direkt den domänexpertis som saknas för att AI ska slå igenom stort inom hälsa som område.

En kr itik  mot de amerikanska IT-jättarna är att de i bästa fall är nybörjare inom hälsoområdet, ibland att de vid flera tillfällen tidigare testat och misslyckats med sina hälsosatsningar. Även de kinesiska jättarna är små inom hälsa. Kritik kan riktas mot  det kinesiska systemet i största allmänhet, och hur de investerar i AI, är att det visserligen satsas mycket pengar men att det är så pass illa organiserat att resultaten [31]  inte alls motsvarar investeringen.

Ingen av de två länderna kommer att svära sig fria från att vara en stormakt inom AI. Det har de inget att vinna på. Alla andra har dock att förlora på att inte se en mer nyanserad bild.

Italien har fler inflytelserika AI-forskare än Kina…

En högst kvantifierad jämförelse mellan USA, Kina och EU har publicerats av tankesmedjan Center for Data Innovation [32]  i augusti 2019. I många fall är EU i klass med USA (som ofta leder i jämförelserna), ibland sämst av de tre. Det beror förstås också på hur man räknar och vad man anser kommer göra skillnad för ekonomin och samhället i stort. Som hur stor chans att en AI-forskares insikter kan smitta av sig på den övriga befolkningens innovativa förmåga. Exempelvis gick det 23,2 ledande AI-forskare per miljon arbetare i EU 2017, medan det endast var 1,2 i Kina [33] .

Sen diskuterar Center for Data Innovation också vilken kvalitet det är på AI-forskningen. Ett sätt att mäta är h-index som sätter ett värde på produktivitet och vilken påverkan man haft. Om man tar den grupp som internationellt är topp tio procent mätt på det sättet får man fram att:

“Through 2017, the European Union led with an estimated 5,787 researchers, ahead of the United States (5,158) and China (977). The United Kingdom (1,177), Germany (1,119), France (1,056), Italy (987), and Spain (772) combined for 5,111 such individuals.”
– Who Is Winning the AI Race: China, the EU or the United States? (Center for Data Innovations, augusti 2019)

Italien har alltså fler högkvalificerade AI-forskare än hela Kina. Varken det eller att EU åtminstone på ett sätt att se på saken leder över USA är inget man hör ofta.

Är det en kapprustning likt kalla kriget?

Det finns också kritik mot dramaturgin att det är en kapplöpning eller en tävling mellan nationer. Det är även så som den kinesiska staten har riggat sitt system [34]  om de pengar som delas ut, det hela blir en tävling mellan olika partitoppar i respektive kinesisk region.

De som är duktiga på AI svär inte nödvändigtvis en livslång lojalitet mot en nation. En orsak till diskussionen om AI-utvecklingen som en kamp mellan nationer kan vara att det antas finnas en stor potential inom autonom krigföring. Dessutom sägs Vladimir Putin ha sagt att

“It comes with colossal opportunities, but also threats that are difficult to predict. Whoever becomes the leader in this sphere will become the ruler of the world.”
– Vladimir Putin (Russia Today [35] , 2017)

Detta är något som framstående personer inom teknikbranschen tagit fasta på, bland annat Elon Musk [36] . Fastnar man i ovanstående citat har man dock missat att Putin också sagt att man inte önskar att ha monopol på denna teknik om man nu uppnår en avgörande nivå först.

“If we become leaders in this area, we will share this know-how with entire world, the same way we share our nuclear technologies today.”
– Vladimir Putin (The Verge
[37] , 2017)

Om dessa uttalanden gjorts av Norges statsminister hade nog få reagerat särskilt starkt.

En initierad person som sågar hela diskussionen om att det är en tävling är AI-professorn Virginia Dignum:

“Press and policy makers are obsessed with the so-called AI race, and with Europe’s position in it. Just this week at Davos, US executives warned that China may be winning this supposed race. In another recent article, Bloomberg pointed out that countries are rushing to not be left behind.
[…]
Firstly, there is no race and secondly, if there is, it is the wrong race to run.
[…]
There is no race because of the very definition of a race: a competition of speed, against an objective criterion, usually a clock or to a specific point. In AI developments, we don’t have a end point! Nor do we have a specific time to stop. There is therefore no way to determine when and where someone will win this so-called race. ”

– Virginia Dignum
[38] , medgrundare av ALLAI

Hur stora landvinningar inom AI för hälsa har gjorts?

Rubrikerna vi läser är tydliga. Gång på gång är maskiner bättre på något än människor, inte sällan bättre än de bästa experterna. Så vad är problemet? Varför har inte denna exponentiella AI-utveckling redan landat exempelvis i sjukvården?

En anledning är att när en AI i ett jämförande test mot exempelvis en hudläkare visar sig vara bättre på något så innebär inte det att hudläkaren kan ersättas av en AI. Det AI:n är bättre på är en liten detalj i helheten, om än helt avgörande i vissa fall. Men en AI som är jättebra på att avgöra en viss typ av hudcancer kan inte på egen hand ta hand om allt det andra. Som att boka läkartid, träffa patienten, undersöka patientens vitalparametrar, hantera medicinteknisk utrustning för att ta bilden på huden, etc, etc.

“Paradoxen; hur kan det vara så att vi säger att AI är minst lika bra som mänskliga experter, å andra sidan så verkar AI inte ens vara användbar i dagsläget?”
– Claes Lundström, Almedalen 2019

Claes Lundström [39] , professor på Linköpings Universitet och Arenaledare på Analytic Imaging Diagnostic Arena (AIDA), pratade om detta under Almedalen 2019 som AI-landskapets vassa toppar [40]  under seminariet Hur kan AI gå från vision till verklig patientnytta?  Att det är ett svårt och stort steg att ta AI från “skyddad forskningsverkstad” till “klinisk vildmark”.


AI betraktat som ett landskap, där höjden representerar vad AI klarar av idag Bild 3: AI betraktat som ett landskap, där höjden representerar vad AI klarar av idag

AI-landskapet har toppar där AI är i klass med mänskliga experter, men landskapet är också väldigt glest och massor med saker som AI inte alls kan hjälpa till med. Därför är det svårt att direkt hoppa från en imponerande forskningsstudie till något som kan implementeras. Det räcker inte att jobba med att höja topparna, det måste också hamna i ett kliniskt och vardagligt sammanhang.


Utmaningar (juridik, informationshantering, informationssäkerhet, energiåtgång etc)

Det är mycket fokus på de juridiska utmaningarna när det gäller AI generellt, men förstås också när det ska tillämpas inom hälso- och sjukvård med tanke på de särskilt känsliga personuppgifterna det innebär. I vissa fall kanske det inte är utmaningar utan snarare en avsaknad av samsyn eller prejudikat som oroar. När det gäller juridik inom vården är Swelifes rapport Personcentrerad data och juridik [41]  från 2018 läsvärd för en överblick. AI-juridik handlar inte enbart om användandet av utländska moln, även om man ibland kan tro det, utan också om patientsäkerhet, patientdata, transparens, medicintekniska regelverk, bland annat.

Specifik juridik: AI för bättre hälsa

Socialstyrelsens rapport [42]  tar från ett svenskt perspektiv upp frågan om lagar och regler och sammanfattar det ganska väl även för en icke-svensk synvinkel. Vad som kan betraktas som nyheter eller aktuellt i skiftet mellan 2019-2020 är nog främst det europeiska regelverket för CE-märkning av medicintekniska produkter. En av nyheterna det talats mycket om i detta sammanhang är hur programvara regleras, vilket inkluderar AI-tekniker som maskininlärning, datorseende, med mera. Regelverket gäller från maj 2020 och innebär ett större krav och mer arbete för alla tillverkare, importörer och distributörer av medicintekniska programvaror och informationssystem.

Amerikanska marknaden och FDA

För de som tänker på den amerikanska marknaden regleras samma fråga av myndigheten FDA (The Food and Drug Administration), lite motsvarande svenska Läkemedelsverket.  
FDA har en handlingsplan som går under namnet Digital Health Innovation Action Plan, vilket annonserades i januari 2019
[43] . Med ambitionen “ aiming to make the agency more efficient, while promoting safety throughout a product’s lifecycle ” enligt deras företrädare Scott Gottlieb.

FDA släppte ett klargörande [44]  utkast om mjukvaror inom kliniskt beslutstöd i september 2019. Det går ut på att reglera de mjukvaror som har en medel till hög risk att direkt påverka hälsa. Enligt FDA:s pressmeddelande [45]  i anslutning till klargörandet berättade man att regleringen måste vara en balans mellan att uppmuntra innovation utan att tumma på patientsäkerheten. FDA har tidigare sjösatt idéer inom området, som en enklare process att kunna certifiera AI-lösningar, vad de kallar “ Digital Health Precertification (Pre-Cert) Program [46] , där man jobbar med processen fram till en lösning snarare än att först när AI-lösningen väl är klar försöker få den certifierad.

En kommentar till FDA:s arbete kom från Eric Topol, expert på Scripps Research Institute och författare till boken Deep Medicine, per epost med STAT. Topol konstaterar det kloka i att inte certifiera baserat på dåtid genom att frysa lösningen vid ögonblicket den certifieras.

“[Eric Topol] added that the eventual regulatory framework should support the ability of adaptive AI systems to learn and improve over time. “It is important to come up with a means of not shortchanging the auto-didactic power of deep learning nets that will continue to improve, not ‘freeze’ at the time of approval”
– FDA developing new rules for artificial intelligence in medicine
[47]  (STAT, april 2019)

Internationellt samarbete är inte helt enkelt

Om man ser på lagstiftning internationellt är det inte helt kompatibelt mellan olika länder. Det har förts en stundtals polariserad debatt om hur, om ens alls,  europeiska organisationer ska kunna använda amerikanska företags molninfrastruktur. SKL släppte under hösten Vägledningar för molntjänster [48]  ur ett svenskt perspektiv (vilket snabbt möttes med besvikelse [49]   [50]  på sina håll). Det är värt att komma ihåg att SKL är en medlemsorganisation där molnet inte enbart är en fråga om extremt känsliga patientuppgifter utan också om elever kan använda kontorsprogram i molnet och även om fullständigt harmlösa uppgifter som allmänna handlingar som lyder under öppenhetslagstiftning, som EU:s PSI-direktiv [51] , eller svensk offentlighetsprincip.

Nederländerna har kommit fram till att de är tvungna att ha andra avtal med leverantörer utanför EU och delar av Tyskland har kommit fram till att man inte ens kan använda standardapplikationer, likt Microsofts Office, som drar nytta av molnet [52] .

“I ett par tidigare utredningar [53] , så kallade Data Protection Impact Assessments, DPIA, har Privacy Company kommit fram till att de nederländska myndigheterna inte kan använda Microsoft Office, varken i desktop-, moln- eller mobilversionerna”
– Microsoft ändrar i Office för att få GDPR-godkänt [54]  (Computer Sweden, augusti 2019)

Mycket kan härledas till CLOUD Act och FISA [55] . CLOUD Act [56]  handlar om utbyte av data för brottsutredning när data inte ligger på servrar rent geografiskt i USA, vilket är anledningen till diskussionen om amerikanska myndigheter kan kräva ut data som finns på servrar placerade i EU, där servern kontrolleras av ett amerikanskt företag. Michael Punke, Vice President Public Policy på Amazon Web Services, har skrivit ett öppet brev [57]  i frågan om CLOUD Act.

“The CLOUD Act authorizes executive agreements between the United States and trusted foreign partners that will make both nations’ citizens safer, while at the same time ensuring a high level of protection of those citizens’ rights.”
– The Purpose and Impact of the CLOUD Act
[58] , U.S. Department of Justice (april 2019)

CLOUD Act innebär ett samarbete om data mellan USA och andra länder, men kräver ett avtal mellan USA och respektive land, som Sverige exempelvis, för att gälla, och först då ska USA respektera respektive lands lagstiftning.  Till försvar för CLOUD Act är att både EU och USA har skrivit under den så kallade Budapestkonventionen [59]  vilken reglerar hur man hjälps åt för att utreda cyberbrott. Den kritiskt lagde skulle säkert här åberopa ändamålsglidning och att inte alla berörda parter brytt sig om ifall deras verksamhet följt lagstiftningen historiskt.

Till USA:s försvar ska också nämnas att de inte är ensamma om att ha denna typ av lagstiftning, något som Försäkringskassans vitbok [60]  om molntjänster tar upp:

“Flera stater, däribland USA, Kina och Indien, har numera lagstiftning som ger deras myndigheter rätt att under vissa förutsättningar ta del av data och uppgifter som lagras hos tjänsteleverantörer under sin jurisdiktion, även om lagringen sker utanför den egna statens territorium. Det har mot den bakgrunden uppstått en debatt om huruvida det är förenligt med svensk rätt och EU-rätt att använda sig av de molntjänster som erbjuds på marknaden. ”
– Vitbok: Molntjänster i samhällsbärande verksamhet – risker, lämplighet och vägen framåt (Försäkringskassan, november 2019)

Att Försäkringskassans generaldirektör i samband med denna vitbok går ut i Dagens Nyheter [61]  under rubriken “Sveriges digitala suveränitet hotas av IT-tjänster i molnet” beskriver ganska väl den aktuella diskussionen.

FISA är en reglering av amerikansk underrättelsetjänst. Kontentan av Edward Snowdens avslöjande 2013 [62]  var att den amerikanska underrättelsemyndigheten, NSA, medvetet valt att inte följa FISA [63] .

Tyskland och Frankrike tänker sig att man ska sätta upp ett EU-moln för att undvika problematiken [64]  med utomeuropeiska moln helt och hållet:

“Det som vilar i bakgrunden är samma diskussion som pågår i Sverige om hur de amerikanska molnjättarnas tjänster kan användas i offentlig sektor med alla deras sekretessbelagda uppgifter. Det finns en oro att amerikanska leverantörer kan tvingas lämna ut uppgifter till amerikanska myndigheter, enligt inhemsk lagstiftning som Cloud act och FISA.”
– Första steget mot ett EU-moln är taget – vad händer nu? (ComputerSweden, november 2019)

Kanske blir det lösningen, att inte ha internationella IT-jättar utan snarare segmenterat inom de olika jurisdiktionerna. EU har egna “IT-jättar”, USA sina, Kina sina bakom The Great Firewall of China [65] , Ryssland sina, etc.

Informationshantering

Även i  mixen mellan juridik och hanterandet av information finns utmaningar, det uppmärksammades sommaren 2019 när amerikanska Cerner berättade att deras produkt Millennium inte i befintligt skick klarade av Patientdatalagen [66] . Vilket åtminstone i fallet för Västra Götalandsregionen inte ens inbegrep användandet av något amerikanskt moln.

En annan utmaning är hur generell insamlad data är. Kan den jämföras med en annan verksamhet med till synes identiskt uppdrag? Några  som påtalat att insamlad data kan vara väldigt lokal är författaren av All Data Are Local: Thinking Critically in a Data-Driven Society [67]  (MIT Press, april 2019).  Redan i bokens beskrivning sammanfattas utmaningen ganska väl:

“[…] we should approach data sets with an awareness that data are created by humans and their dutiful machines, at a time, in a place, with the instruments at hand, for audiences that are conditioned to receive them.”

 Det är helt enkelt riskfyllt att anta att insamlad data är jämförbar över diverse gränser, vilket minskar dess användbarhet. Om man ändå använt denna lokala träningsdata till en lösning kommer den inte vara fullt så pricksäker någon annanstans.

Linjera med de globala målen

De globala målen [68]  är en lista med mål för att främja hållbarhet. Det är FN:s utvecklingsprogram (UNDP) som tagit fram dem “ för att avskaffa fattigdom, minska ojämlikheter, främja fredliga samhällen” [69] .

Bara inom ganska uppenbara utmaningar, som jämlikhet, har allt från AI-forskningen till tillämpningarna på sina håll stora problem. I april belyste AINow detta med sin rapport [70]  “ Discriminating Systems: Gender, Race, and Power in AI” :

“There is a diversity crisis in the AI sector across gender and race. Recent studies found only 18%of authors at leading AI conferences are women, and more than 80%of AI professors are men. This disparity is extreme in the AI industry: women comprise only 15% of AI research staff at Facebook and 10% at Google.“

Och då har man inte funnit några data om transpersoner eller andra könsminoriteter. Dock varnar man för att ambitionen att föra fram kvinnor inom teknikbranschen snedfördelar, att det kommer gynna vita kvinnor. Mångfald är mångfacetterat!

Många organisationer lanserar diverse grupperingar inom AI för att kraftsamla. Ett talande exempel var universitetet Stanford som under våren berättade om sitt nya Institute for Human-Centered Artificial Intelligence . Av de 121 fakultetsmedlemmarna som lyftas fram på deras webbplats var ingen mörkhyad [71] . För hudfärg och kön finns organisationer som försöker göra skillnad, bland annat Black in AI [72]  och Women in AI [73] . Men det är värt att komma ihåg att det bara är två av många sorters bias.

Att träna upp en AI kräver en del energi. Karen Hao skrev en artikel i MIT Technology Review [74]  där undertiteln summerar problemet väl, nämligen att: “Deep learning has a terrible carbon footprint”. Deep learning råkar vara den variant som är populär den här nya vågen av AI, det är just deep learning som kapitaliserar på de stora datamängderna det ofta talas om som en förutsättning, och risken är att de som följer AI-trenden ger sig in på just det spåret. Inte nog med att det blir en del koldioxid, det pressar upp priser på energimarknaden vilket i bästa fall har en positiv sidoeffekt att det finns pengar för att utveckla mindre smutsig energi.

Summering

Ett genomgående tema i denna delrapport är att det finns enorma förhoppningar på vad AI-tekniken kan bidra med, att det absolut finns utmaningar, men att den nya varianten av AI lyser med sin frånvaro i en klinikers vardag.

Att det är på det sättet beror på flera saker, bland annat att de regelverk som finns inte är helt anpassade eller etablerade i form av tydliga prejudikat. En annan orsak är att den AI-teknik som är bättre på något än mänskliga experter inte är mångsidig nog att ta sig ut i en klinikers vardag, eller en patient heller för den delen.

Sen är det inte enkelt att jämföra vad en organisation anser är AI med någon annan då det inte finns någon etablerad, entydig, definition. De som jobbat med AI för bättre hälsa i årtionden har varit inne på en annan generation av AI, så kallade expertsystem. Medan den nya vågen av AI, som inleddes 2012, är baserad på deep learning. Med andra ord är det extremt sällsynt att någon har erfarenheter av “dagens AI” som sträcker sig särskilt långt tillbaka.
Men det beror förstås på ens definition av AI. De som inkluderar olika former av automatisering, bland annat
Robotic Process Automation , kan förstås spåra sina erfarenheter en bit in på 1900-talet. Med en så tillåtande definition har undertecknad jobbat med AI sedan 1997, fast jag skulle hellre vara öppen med att det var mjukvaruagenter i Lotus Notes jag byggde. Det tycker inte jag är AI.

December, 2019
Marcus Österberg, för Swelife AI-projektet


Appendix

Tack till…

De som hjälp till med korrektur, kommenterat, bidragit med tips eller på annat sätt ställt upp. Särskilt tack till:

  • Maria Lidholm
  • Sonja Aits
  • Gino Almondo
  • Jessica Ylvén

Intressanta resurser

Följande är en förteckning över de resurser som upptäcktes under arbetets gång. De som redovisas är de med mer tydlig relevans till AI för bättre hälsa, den fulla listan finner du i bilaga 1.

Tävlingar

Man kan tävla i data science. Genom att ta fram den bästa lösningen på ett problem baserat på en datakälla som sprids öppet. Nedan är några tävlingar och arrangörer:

  • The ISIC Challenge [75]  – detektera hudsjukdomar
  • BraTS [76]  – multimodal hjärntumörsegmentering
  • Turingtestet / Loebnerpriset [77]  – att få en människa att tro den pratar med en människa (trots att det är en maskin i andra änden)
  • Kaggle [78]  – arrangör av många olika tävlingar, ofta om hälsa

Datakällor

Det finns massor med olika datakällor. Vissa har en öppen licens som innebär att man får göra vad man vill med innehållet, andra är öppet tillgängliga men inget man får vidareutnyttja kommersiellt. Vissa datakällor är mer kända, ibland kallade referensdatakällor, då de används som just referenser.

I bilaga 1 hittar du en längre förteckning vilket är intressant om du vill se datakällor om demografi eller sånt som kan användas för sentimentanalys, etc.

Referensdatakällor:

  • HAM10000 [79]  – bilder inom dermatologi
  • ASAN Dataset [80]  – klinisk diagnos baserat på bilder
  • CAMELYON [81]  – bilder för att upptäcka metastaser i bröstvävnad

Övriga datakällor:

  • ISIC [82]  (International Skin Imaging Collaboration) – projekt för att detektera hudcancer
  • CheXNet [83]  – Stanfords dataset för att identifiera lunginflammation genom thorax-bilder
  • Healthdata.gov [84]  – samling datakällor från amerikanska myndigheter
  • MIMIC Critical Care Database [85]  – Samling dataset med hälsodata från 40 000 patienter. Bland annat demografi, vitalparametrar och läkemedel.
  • STRIDES [86]  – biomedicinska data
  • NIH Data Sharing Repositories [87]  – hälsodatakällor som finansierats av NIH (USA:s National Institute of Health).

Bilaga 1: fynd under arbetet

Övrigt, med mer eller mindre stark koppling till AI eller life science

Alliance on Artificial Intelligence

Grundat av tre holländare som är med i EU:s HLEG om AI. Bl.a Virginia Dignum.
Webb:   http://allai.nl/

EurAI (European Association for Artificial Intelligence)

Webb:   https://www.eurai.org/

HealthTech Nordic

Webb:   http://healthtechnordic.com/

OpenAI – Kalifornien, USA

“OpenAI’s mission is to ensure that artificial general intelligence benefits all of humanity. We’re a team of a hundred people based in San Francisco, California.”
Webb:
  https://openai.com/

Future of Life Institute

Bland annat AI. Grundat av Max Tegmark mfl.
Webb:   https://futureoflife.org/

CIFAR, Kanada

Webb:   https://www.cifar.ca/ai

Etik, hållbarhet, etc

Center for Humane Technology

“Our primary goal was to move public discourse in Silicon Valley from a cacophony of disconnected grievances and scandals (”they took our data!”) to a meaningful humane agenda of actions that address the vast surface area of problems arising from technology’s race for attention.
In last week’s presentation, we explained how seemingly separate problems – tech addiction, teen depression, shortening attention spans, political polarization, the breakdown of truth, outrage-ification of culture, and the rise of vanity/micro-celebrity culture – are actually not separate issues. They are all symptoms of one underlying problem: the race between tech giants to capture human attention, which becomes a race to overwhelm human weaknesses. Put together, that race creates “human downgrading.””
Webb:
  https://humanetech.com/

AI for Good Foundation

Webb:   https://ai4good.org

Human-Centered AI

Webb:   https://hai.stanford.edu/

High-Level Expert Group on Artificial Intelligence – EU

Släppte rapport våren 2019.
Webb: https://ec.europa.eu/digital-single-market/en/artificial-intelligence
Webb:   https://ec.europa.eu/digital-single-market/en/high-level-expert-group-artificial-intelligence

The Nightingale Initiative (USA)

Dataplattform i mixen mellan medicin och data science, till nytta för “public good”.
Webb:
  http://www.nighvision.net/

Konferenser

Var kan man hitta exempel på organisationer i framkant.

HealthConf (Portugal)

Webb:   https://websummit.com/healthconf

World Congress on Healthcare & Technologies (England)

Webb:   https://europe.healthconferences.org/

Intelligent Health AI (Schweiz)

I Basel, september.
Webb:
  https://intelligenthealth.ai/

Vitalis (Sverige)

Webb:   https://vitalis.nu/

InnoHEALTH (Indien)

Webb:   http://innohealth.in/

HIMMS Europe (Finland 2019)

Webb:   https://www.himss.eu/

HIMMS (USA)

Webb:   https://www.himssconference.org/

AMIA Informatics Summit (USA)

Har ett spår för data science.
Webb:
  https://www.amia.org/summit2019

Bio-IT World Conference (USA)

Bland annat om blockkedja, AI, machine learning, deep learning.

Webb:   http://www.giiconference.com/chi653337/

AI Healthcare Innovation Summit (USA)

Webb:   https://www.theinnovationenterprise.com/summits/ai-healthcare-san-francisco

Big Data & Analytics in Healthcare Summit (USA)

Bland annat om AI/ML.
Webb:
  https://10times.com/big-data-analytics-in-healthcare

HLTH (USA)

Har ett spår tillägnat AI.
Webb:   https://hlth.com

SXSW Health & Medtech (USA)

Webb:   https://www.sxsw.com/conference/health-and-medtech/

SCOPE (USA)

Har “AI in Clinical Research” som ett av spåren.
Webb:
  https://www.scopesummit.com

Connected Health (USA)

Har AI, ML och analytics på schemat.
Webb:
  https://www.connectedhealthconf.org/boston/2019

Exponential Medicine (USA)

AI, kvant och liknande på schemat.
Webb:
  https://exponential.singularityu.org/medicine/

Healthcare Innovation Summit (USA, flera orter)

Bl.a. om AI och data analytics.
Webb:
  https://www.hcinnovationgroup.com/summits

RSNA Annual Meeting (USA)

Radiologi.  
Webb:   https://www.rsna.org/annual-meeting

AI Applications in Biopharma Summit (USA)

“Welcome to the AI Applications in Biopharma Summit; a new kind of collaborative experience where the industry’s top science minds, AI technology experts and strategy leaders share detailed use cases to help each other build out the adoption of AI technology to improve patients’ lives.
The Summit is a ‘who’s who’ of AI in biopharma and is your chance to engage in deep coverage of AI in drug discovery, clinical development and real-world evidence from an elite speaker line up including Sanofi, Novartis Institutes for Biomedical Research, Pfizer, Biogen, AstraZeneca, Boehringer Ingelheim Pharmaceuticals, Janssen, GSK and more who are pioneers in the movement.”
Webb:
  https://www.aiapplicationssummit.com/biopharma/

AI-ML Clinical Development (USA)

Webb:   https://ai-clinicaldevelopment.com/

MedInfo (Frankrike)

Lite AI och analytics på programmet 2019.
Webb:   https://medinfo-lyon.org/en/

Osorterat

Crunchbase – lista med startups

Finns 8000 ML-startups juni 2019.
Webb:
  https://www.crunchbase.com/

Internationella utredningar och uppdrag

AI Watch – EU

“Monitor the development, uptake and impact of Artificial Intelligence for Europe”
Webb:   https://ec.europa.eu/knowledge4policy/ai-watch_en

Samarbeten

Declaration on AI in the Nordic-Baltic Region

“Declaration on AI in the Nordic-Baltic Region” framställdes, i maj 2018, av ministrar ansvariga för digital utveckling i Danmark, Estland, Finland, Färöarna, Island, Lettland, Litauen, Norge och Sverige. Samarbetet har i avsikt att utveckla och främja användningen av artificiell intelligens som ett hjälpmedel för människan. Länderna vill genom samarbetet mer specifikt fokusera på;

  1. Förbättra möjligheter för utveckling av kompetens
  2. Främja tillgång till data
  3. Utveckla etiska samt transparenta riktlinjer, principer, standarder och värden
  4. Utveckla standarder för hårdvara och mjukvara som gör det möjligt för integritet, säkerhet och tillit
  5. Försäkra att ai har en framträdande roll inom europeiska diskussioner gällande “the Digital Single Market”
  6. Undvika onödiga regleringar
  7. Använda Nordic Council of Ministers för främjande av samarbetet.

The Nordic AI Network

Webb:   https://www.chalmers.se/en/areas-of-advance/ict/news/Pages/Chalmers-in-new-Nordic-network-for-artificial-intelligence.aspx

Nordic Five Tech

Chalmers, KTH, finska Aalto, danska DTU och norska NTNU är med.
Webb:
  http://www.nordicfivetech.org/

“Appbutiker” och utvecklarpaket

Nvidia Clara Platform

“NVIDIA Clara™ is a computational platform that makes it easy to build, manage, and deploy intelligent medical imaging workflows and instruments. Developers use Clara to increase diagnostic accuracy and the quality of scans to enhance patient outcomes and reduce the cost of care.”
Webb:   https://www.nvidia.com/en-us/healthcare/

Nuance AI Marketplace

Webb:   https://aimarketplace.portal.azure-api.net/   och https://www.nuance.com/healthcare/diagnostics-solutions/ai-marketplace.html

Datakällor

Google Dataset Search

Webb:   https://toolbox.google.com/datasetsearch/search

NLP

Amazon Review
Wikipedia Links Data

https://code.google.com/archive/p/wiki-links/downloads

Sentiment analysis

Stanford Sentiment Treebank

https://nlp.stanford.edu/sentiment/code.html

Twitter US Airline Sentiment

https://www.kaggle.com/crowdflower/twitter-airline-sentiment

Demografi

World Bank Open Data

https://data.worldbank.org/

IMF Data

https://www.imf.org/en/Data

Datorseende

Google’s Open Images

9 million URLs to categorized public images in over 6,000 categories. Each image is licensed under creative commons.
https://ai.googleblog.com/2016/09/introducing-open-images-dataset.html

Hälsa

Healthdata.gov

“a resource from the US federal government providing data to improve health outcomes for the US population.”
Webb: https://healthdata.gov/search/type/dataset

MIMIC Critical Care Database

“Datasets for Computational Physiology with unidentified health data from 40,000 critical care patients (demographics, vital signs, medications, etc.)”
Webb:
  https://mimic.physionet.org/

Data USA

Har data från “industrier” som sjukhus bland annat.
Webb:
  https://datausa.io

National Institute of Health (USA)

Deras kontor för data science finns att läsa om här: https://datascience.nih.gov/

De har också Common Data Elements (CDE) som är data gemensam för flera datakällor, alltså referenser som överbryggar olika datakällor.

https://www.nlm.nih.gov/cde/index.html

STRIDES – biomedicinska data

Webb:   https://datascience.nih.gov/strides

NIH Data Sharing Repositories

Lång lista med olika sorters datakällor som stöttats av NIH.
Webb:
  https://www.nlm.nih.gov/NIHbmic/nih_data_sharing_repositories.html

EU Open Data Portal

Har kategori för “Health”, samt att det kan gömma sig intressanta saker under de andra kategorierna.
Webb:
  https://data.europa.eu/euodp/data/

European Data Portal

Har kategori för “Health”. De skördar dataset från länders olika öppna datasamlingar.
Webb:
  https://www.europeandataportal.eu/data/datasets?categories=heal&page=1&locale=en

ISIC

Webb:   https://www.isic-archive.com

Stanford CheXNet

Webb:   https://stanfordmlgroup.github.io/projects/chexnet/

Tal

Flickr Audio Caption Corpus

“40,000 spoken captions from 8,000 images in a manageable size.  It was initially designed for unsupervised speech pattern discovery.”
Webb:
  https://groups.csail.mit.edu/sls/downloads/flickraudio/

Speech Commands Dataset

“A continuously evolving collection of one second long utterances from thousands of different people. It’s still receiving contributions and is useful for building basic voice interfaces.”
Webb:
  https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html

Ljud

FSD (Freesound)

“A collection of every day sounds collected by contribution under an open source license.”
Webb:
  https://annotator.freesound.org/fsd/

Environmental Audio Datasets

“It does contain some proprietary information, but a large portion is open source. It contains sound events tables and acoustic scenes tables.”
Webb:
  http://www.cs.tut.fi/~heittolt/datasets

Övrigt

OpenDataSoft

“2600 data portals arranged in an interactive map formation or by country list. If you’re looking for it, chances are, it’s here.”
Webb:
  https://www.opendatasoft.com/a-comprehensive-list-of-all-open-data-portals-around-the-world/

Kaggle

“an online community of data scientists where users can work with and upload datasets. It’s a community and a resource in one.”
Webb:
  http://www.kaggle.com/

UCI Machine Learning Repository

“User contributed datasets in various levels of cleanliness. It’s one of the originals, and you can download datasets without having to register anything.”
Webb:
  http://mlr.cs.umass.edu/ml/

Inventering: Personal Health Train

Nederländskt initiativ att koppla samman de olika datakällorna som utgör den personliga hälsan.

Webb: https://www.dtls.nl/fair-data/personal-health-train/

Tävlingar

Rena tävlingar men också referensdataset att tävla om att bemästra.

The ISIC Challenge – detektera hudsjukdom

Webb: https://www.isic-archive.com

Kaggle – tävlingar i flera kategorier

Har både tävlingar och öppna datakällor.

Webb:   https://www.kaggle.com

Turingtestet/Loebnerpriset – avslöja en dator i konversation

Webb:   http://www.aisb.org.uk/events/loebner-prize

BraTS (Multimodal Brain Tumor Segmentation Challenge)

Var i en bild finns hjärntumören?
Webb:
  http://braintumorsegmentation.org/

Referensdatakällor

Lista finns bland annat här:   https://benchmarks.ai/

MNIST – handskriven text
CIFAR-10/100 – klassificera bilder
SVHN – gatunummer
STL-10 – bildigenkänning
MPI Sintel – optiskt flöde
PASCAL VOC Object – detektion/segmentering
COCO Object Detection. Panoptic Segmentation
KITTI Optical Flow
NIST 2000 Switchboard – tal/konversation över telefon
WMT English ->? – maskinöversättning, bla till finska
ImageNet – bilddatabas

“Dataset containing over 14 million images available for download in different formats. It also includes API integration and is organized according to the WordNet hierarchy.”
Webb:   http://www.image-net.org/

WordNet

Orddatabas.
Webb:   https://wordnet.princeton.edu/download

ASAN Dataset – klinisk diagnos baserat på bilder

Webb:   https://api.medicalphoto.org/datasets.html

HAM10000 – bilder för dermatologi

Webb:   https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/DBW86T

CAMELYON  – bilder för att upptäcka metastaser i bröstvävnad

Webb: http://gigadb.org/dataset/100439

Regelverk

EU:s GDPR: Article 22  – Automated individual decision-making, including profiling

“The data subject shall have the right not to be subject to a decision based solely on automated processing, including profiling, which produces legal effects concerning him or her or similarly significantly affects him or her. “

Gäller dock inte om det finns ett uttryckligt medgivande:
“of the data subject means any freely given, specific, informed and unambiguous indication of the data subject’s wishes by which he or she, by a statement or by a clear affirmative action, signifies agreement to the processing of personal data relating to him or her;”
Webb:
  http://www.privacy-regulation.eu/en/article-22-automated-individual-decision-making-including-profiling-GDPR.htm

EU:s MDR Classification: Rule 11 , Medical Device Software

“Software intended to provide information which is used to take decisions with diagnosis or therapeutic purposes is classified as class IIa, except if such decisions have an impact that may cause:
– Death or an irreversible deterioration of a person’s state of health, in which case it is in class III; or
– Serious deterioration of a person’s state of health or a surgical intervention, in which case it is classified as class IIb.
Software intended to monitor physiological processes is classified as class IIa, except if it is intended for monitoring of vital physiological parameters, where the nature of variations of those parameters is such that it could result in immediate danger to the patient, in which case it is classified as class IIb.
All other software are classified as class I.”
Webb:
  https://www.johner-institute.com/articles/regulatory-affairs/and-more/mdr-rule-11-software/

EU:s Open data & PSI directive (2019)

“All public sector content that can be accessed under national access to documents rules is in principle freely available for re-use.”

Webb:   http://europa.eu/rapid/press-release_IP-19-525_en.htm

Finland: Secondary use of health and social data

Webb:   https://stm.fi/en/secondary-use-of-health-and-social-data

USA:s HIPAA  – Health insurance portability and accountability act

Info:   https://en.wikipedia.org/wiki/Health_Insurance_Portability_and_Accountability_Act


[1]  https://en.wikipedia.org/wiki/AI_effect

[2]  https://www.socialstyrelsen.se/globalassets/sharepoint-dokument/artikelkatalog/ovrigt/2019-10-6431.pdf

[3]  https://www.socialstyrelsen.se/om-socialstyrelsen/pressrum/press/mycket-forskning-men-begransad-anvandning-av-ai-i-halso–och-sjukvarden/

[4]  https://www.socialstyrelsen.se/globalassets/sharepoint-dokument/artikelkatalog/ovrigt/2019-10-6431.pdf

[5]  Sida 45, Digitala vårdtjänster och artificiell intelligens i hälso- och sjukvården

[6]  https://en.wikipedia.org/wiki/Symbolic_artificial_intelligence

[7]  Sida 63, Digitala vårdtjänster och artificiell intelligens i hälso- och sjukvården

[8]  https://en.wikipedia.org/wiki/Robotic_process_automation

[9]  https://en.wikipedia.org/wiki/Online_machine_learning

[10]  sv. Förstärkt lärande

[11]  https://www.theverge.com/2019/3/5/18251326/ai-startups-europe-fake-40-percent-mmc-report

[12]  https://www.cs.princeton.edu/~arvindn/talks/MIT-STS-AI-snakeoil.pdf

[13]  https://www.kjronline.org/search.php?where=aview&id=10.3348/kjr.2019.0025&code=0068KJR&vmode=FULL

[14]  https://sv.wikipedia.org/wiki/Technology_Readiness_Level

[15]  (sida 47) https://www.socialstyrelsen.se/globalassets/sharepoint-dokument/artikelkatalog/ovrigt/2019-10-6431.pdf

[16]  https://ec.europa.eu/jrc/en/publication/artificial-intelligence-european-perspective

[17]  https://www.crunchbase.com/search/hubs/field/hubs/category_groups/artificial-intelligence-e551

[18]  https://www.cifar.ca/ai

[19]  https://www.cifar.ca/docs/default-source/ai-reports/ai_annualreport2019_web.pdf?sfvrsn=244ded44_17

[20]  https://medium.com/@eif4smes/why-do-we-need-to-support-blockchain-and-ai-in-europe-30a122383f33

[21]  https://ec.europa.eu/digital-single-market/en/high-level-expert-group-artificial-intelligence

[22]  https://ec.europa.eu/newsroom/dae/document.cfm?doc_id=60441

[23]  Survey Analysis: AI and ML Development Strategies, Motivators and Adoption Challenges

[24]  https://sv.wikipedia.org/wiki/Hajpkurva

[25]  https://www.nature.com/articles/s41587-019-0224-x

[26]  https://www.linkedin.com/pulse/pharmas-alphago-moment-first-time-ai-has-designed-new-colangelo/

[27]  https://verily.com

[28]  https://verily.com/projects/

[29]  https://neuralink.com

[30]  https://www.biorxiv.org/content/10.1101/703801v2

[31]  https://www.datahubbs.com/ai-and-super-powered-economic-errors/

[32]  https://www.datainnovation.org/2019/08/who-is-winning-the-ai-race-china-the-eu-or-the-united-states/

[33]  Tabell 8, Center for Data Innovations rapport Who Is Winning the AI Race: China, the EU or the United States?

[34]  AI Superpowers: China, Silicon Valley, and the New World Order, av Kai-Fu Lee, ISBN: 9781328546395

[35]  https://www.rt.com/news/401731-ai-rule-world-putin/

[36]  https://twitter.com/elonmusk/status/904633084309422080

[37]  https://www.theverge.com/2017/9/4/16251226/russia-ai-putin-rule-the-world

[38]  http://allai.nl/there-is-no-ai-race/

[39]  https://liu.se/medarbetare/clalu03

[40]  https://youtu.be/hV8sqnvEL4c?t=353

[41]  https://swelife.se/2018/11/09/ny-rapport-om-personcentrerad-data-och-juridik-i-varden/

[42]  Sida 39, https://www.socialstyrelsen.se/globalassets/sharepoint-dokument/artikelkatalog/ovrigt/2019-10-6431.pdf

[43]  https://www.fda.gov/downloads/medicaldevices/digitalhealth/ucm568735.pdf

[44]  https://www.fda.gov/regulatory-information/search-fda-guidance-documents/clinical-decision-support-software samt själva utkastet https://www.fda.gov/media/109618/download

[45]  https://www.fda.gov/news-events/press-announcements/statement-new-steps-advance-digital-health-policies-encourage-innovation-and-enable-efficient-and

[46]  https://www.fda.gov/news-events/press-announcements/statement-fda-commissioner-scott-gottlieb-md-agencys-new-actions-under-pre-cert-pilot-program

[47]  https://www.statnews.com/2019/04/02/fda-new-rules-for-artificial-intelligence-in-medicine/

[48]  https://skl.se/4.27efeeb616e088819f6c7cf8.html

[49]  https://www.peterhedenskog.com/blog/2019/11/drommen-om-molnet/

[50]  https://www.linkedin.com/pulse/skls-vilseledning-f%25C3%25B6r-molntj%25C3%25A4nster-magnus-kolsj%25C3%25B6/

[51]  https://sv.wikipedia.org/wiki/PSI-lagen

[52]  https://edri.org/microsoft-office-365-banned-from-german-schools-over-privacy-concerns/

[53]  https://www.privacycompany.eu/blogpost-en/new-dpia-on-microsoft-office-and-windows-software-still-privacy-risks-remaining-short-blog

[54]  https://computersweden.idg.se/2.2683/1.722011/office-365-gdpr-godkant

[55]  https://sv.wikipedia.org/wiki/Foreign_Intelligence_Surveillance_Act

[56]  https://en.wikipedia.org/wiki/CLOUD_Act

[57]  https://aws.amazon.com/blogs/security/aws-and-the-cloud-act/

[58]  https://www.justice.gov/opa/press-release/file/1153446/download

[59]  https://en.wikipedia.org/wiki/Convention_on_Cybercrime

[60]  https://www.forsakringskassan.se/wps/wcm/connect/30cc57bd-b5cd-4e04-94cd-1f7a02a9ae1a/vitbok.pdf?MOD=AJPERES&CVID=

[61]  https://www.dn.se/debatt/sveriges-digitala-suveranitet-hotas-av-it-tjanster-i-molnet/

[62]  https://www.bbc.com/news/world-us-canada-23721818

[63]  https://sv.wikipedia.org/wiki/Foreign_Intelligence_Surveillance_Act#Brott_mot_lagen

[64]  https://computersweden.idg.se/2.2683/1.726130/forsta-steget-eu-moln

[65]  https://en.wikipedia.org/wiki/Great_Firewall

[66]  https://computersweden.idg.se/2.2683/1.725805/forsenat-projekt-varden-skadestand

[67]  https://mitpress.mit.edu/books/all-data-are-local

[68]  https://www.globalamalen.se

[69]  https://www.globalamalen.se/om-undp/

[70]  https://ainowinstitute.org/discriminatingsystems.pdf

[71]  https://axbom.blog/representation-ai-sweden/

[72]  https://blackinai.github.io

[73]  https://www.womeninai.co

[74]  https://www.technologyreview.com/s/613630/training-a-single-ai-model-can-emit-as-much-carbon-as-five-cars-in-their-lifetimes/

[75]  https://www.isic-archive.com

[76]  http://braintumorsegmentation.org

[77]  http://www.aisb.org.uk/events/loebner-prize

[78]  https://www.kaggle.com

[79]  https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/DBW86T

[80]  https://api.medicalphoto.org/datasets.html

[81]  http://gigadb.org/dataset/100439

[82]  https://www.isic-archive.com

[83]  https://stanfordmlgroup.github.io/projects/chexnet/

[84]  https://healthdata.gov/search/type/dataset

[85]  https://mimic.physionet.org

[86]  https://datascience.nih.gov/strides

[87]  https://www.nlm.nih.gov/NIHbmic/nih_data_sharing_repositories.html

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *