{"id":1490,"date":"2018-03-05T11:38:47","date_gmt":"2018-03-05T10:38:47","guid":{"rendered":"https:\/\/vgrblogg.se\/utveckling\/?p=1490"},"modified":"2018-03-05T11:38:47","modified_gmt":"2018-03-05T10:38:47","slug":"naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst","status":"publish","type":"post","link":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/","title":{"rendered":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst"},"content":{"rendered":"<p>Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. N\u00e5got som funkar bra sedan n\u00e5gra \u00e5r tillbaka \u00e4r att identifiera o\u00f6nskad epost. Detta g\u00f6rs med en teknik kallad NLP (Natural Language Processing), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.<!--more--><\/p>\n<h2>Vad NLP g\u00f6r bra, ok och mindre bra<\/h2>\n<p>Andra saker som NLP \u00e4r bra p\u00e5 (\u00e5tminstone p\u00e5 engelska som spr\u00e5k) \u00e4r Named Entity Recognition (NER) och parts-of-speech tagging (POS eller POST). NER handlar om att i en textmassa hitta inneh\u00e5ll som omn\u00e4mnda organisationer och personer. Ett typiskt exempel i det jag l\u00e4st \u00e4r \u201cSteve Jobs var VD p\u00e5 Apple Corp under 2010\u201d. I det fallet skulle en lyckosam NER-algoritm hitta att Steve Jobs \u00e4r en person, att Apple Corp \u00e4r en organisation och att 2010 har med tid att g\u00f6ra.<\/p>\n<p>POS handlar om att grammatiskt g\u00e5 igenom en textmassa. Bland annat kan man posta in en text till en POS-algoritm och f\u00e5 tillbaka en lista som anger ord tillsammans med dess ordklass. Exempelvis att ordet allergi \u00e4r ett substantiv och genom en kombination av NLP-metoder kan man f\u00f6rs\u00f6ka ta reda p\u00e5 vem som har besv\u00e4r med allergi.<\/p>\n<h3>Ganska bra inom NLP<\/h3>\n<p>N\u00e5got som jobbas p\u00e5 men kanske \u00e4r bara lite b\u00e4ttre \u00e4n slumpen \u00e4r sentiment analysis. Det inneb\u00e4r att f\u00f6rs\u00f6ka f\u00f6rst\u00e5 den k\u00e4nsla eller de \u00e5sikter som en text framf\u00f6r och kan handla om att f\u00f6rs\u00f6ka f\u00f6rst\u00e5 om texten indikerar att n\u00e5gon \u00e4r f\u00f6rbannad, lycklig, irriterad, n\u00f6jd eller liknande.<\/p>\n<p><a href=\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft size-full wp-image-1492\" src=\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate.png\" alt=\"Google Translate mellan svenska och kinesiska\" width=\"1200\" height=\"866\" srcset=\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate.png 1200w, https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate-300x217.png 300w, https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate-768x554.png 768w, https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/google-translate-1024x739.png 1024w\" sizes=\"(max-width: 767px) 89vw, (max-width: 1000px) 54vw, (max-width: 1071px) 543px, 580px\" \/><\/a><\/p>\n<p>En annan sak inom NLP som n\u00e4stan fungerar tillfredsst\u00e4llande \u00e4r maskin\u00f6vers\u00e4ttning. De flesta av oss har sett komiska \u00f6vers\u00e4ttningar, inte minst p\u00e5 Facebook med Bings \u00f6vers\u00e4ttningar av v\u00e4nners statusmeddelanden. Men vill man se hur f\u00f6rvanskat det blir med maskin\u00f6vers\u00e4ttning \u00e4r det inte sv\u00e5rare \u00e4n att anlita Google, Bing eller n\u00e5gon av de andra, skriva en text p\u00e5 svenska och \u00f6vers\u00e4tta till kinesiska. Sedan tar du det kinesiska och \u00f6vers\u00e4tter tillbaka till svenska s\u00e5 ser du viskningsleken vid en enkel interaktion. Ofta fungerar det hj\u00e4lpligt, men inte helt s\u00e4llan blir inneb\u00f6rden det rakt motsatta.<\/p>\n<p>En ytterligare grej inom NLP som bara n\u00e4stan fungerar \u00e4r att extrahera information ur en text. Utan att l\u00e4gga extremt mycket tid p\u00e5 definitionerna (likt min k\u00e4ra kollega Lars L) s\u00e5 kan man s\u00e4ga att det \u00e4r skillnad p\u00e5 text, information och kunskap. Ur text kan man i b\u00e4sta fall finna information och av det kan kunskap skapas. Information Extraction handlar om att med s\u00e4kerhet utvinna information, att hitta strukturerad information i en ostrukturerad k\u00e4lla. Exempel p\u00e5 s\u00e5dana ostrukturerade uppgifter i v\u00e5rden \u00e4r anamnes, det vill s\u00e4ga den sjukdomshistoria som en patient redog\u00f6r f\u00f6r. Det \u00e4r text, en ber\u00e4ttelse som beskriver n\u00e5got. Den typen av text st\u00e5r i tydlig kontrast till en klassificeringskod som pekar ut en exakt diagnos f\u00f6r patienten. Anamnes kan inneh\u00e5lla samma sak, men strukturen \u00e4r inte n\u00f6dv\u00e4ndigtvis d\u00e4r. Utan struktur \u00e4r det sv\u00e5rt att veta om patienten \u00e4r glad f\u00f6r att ha blivit frisk fr\u00e5n diagnosen, orolig f\u00f6r att drabbas, eller pratar om en n\u00e4rst\u00e5endes h\u00e4lsoproblem.<\/p>\n<h3>Inte s\u00e5 imponerande (\u00e4nnu)<\/h3>\n<p>Du har s\u00e4kert inte missat hajpen med chatbottar. Och att varenda fram\u00e5tlutad organisation numera t\u00e4nker anlita maskiner till sin kundtj\u00e4nst. Well, det gjorde SJ redan p\u00e5 1990-talet och de i min krets av v\u00e4nner minns det som en enorm frustration \u00f6ver den komplett idiotiska maskinen. D\u00e5 var komplexiteten begr\u00e4nsad till vilken ort man ville resa till och varje g\u00e5ng beh\u00f6vde man sk\u00e4rpa till sig.<\/p>\n<blockquote><p>&#8221;Nej dumj\u00e4vel, jag sa BAAASTUTR\u00c4SK!1!\u201d<br \/>\n<span style=\"font-size: 1.125rem\">Interaktion med SJ:s bot p\u00e5 90-talet.<\/span><\/p><\/blockquote>\n<p>Numera fungerar detta en hel del b\u00e4ttre, men i \u00e4rlighetens namn verkar det fortfarande sv\u00e5rt. Jag \u00f6vningsk\u00f6rde talstyrning p\u00e5 Microsofts Azure-tj\u00e4nster f\u00f6r n\u00e5gon vecka sedan. Sittandes p\u00e5 ett kaf\u00e9 och fortfarande lite t\u00e4t i n\u00e4san efter en f\u00f6rkylning skulle jag tr\u00e4na deras AI p\u00e5 min r\u00f6st. Sj\u00e4lvklart valde jag frasen \u201cI&#8217;m gonna make him an offer he can&#8217;t refuse\u201d. Frasen skulle l\u00e4sas in n\u00e5gra g\u00e5nger. Jag misslyckades fyra g\u00e5nger p\u00e5 raken att g\u00f6ra mig f\u00f6rst\u00e5dd trots att tj\u00e4nsten visste vilken fras jag l\u00e4ste.<\/p>\n<p>S\u00e5 nej, det funkar inte under rimliga och vardagliga omst\u00e4ndigheter. F\u00f6r nog b\u00f6r dessa saker funka p\u00e5 ens andraspr\u00e5k, n\u00e4r man \u00e4r f\u00f6rkyld och i milj\u00f6er med bakgrundsljud?<\/p>\n<p>L\u00e4raren i den NLP-kurs jag l\u00e4st p\u00e5 Udemy tog upp att detta \u00e4r ett problem \u00e4ven f\u00f6r de med engelska som modersm\u00e5l. Ett komiskt exempel \u00e4r n\u00e4r frasen \u201crecognize speech\u201d \u00f6vers\u00e4tts till \u201cwreck a nice beach\u201d. H\u00e4r uppst\u00e5r problem inte helt olikt n\u00e4r en AI identifierade en sk\u00f6ldpadda som ett vapen oavsett vilken vinkel den s\u00e5gs ur.<\/p>\n<p>En annan sv\u00e5r del av NLP \u00e4r parafrasering och summering. Just summering \u00e4r n\u00e5got jag och kollegor inom psykiatrin tittat p\u00e5 eftersom journaler f\u00f6r vissa patienter kan vara oerh\u00f6rt l\u00e5nga. S\u00e5 dels finns behovet av att inom rimlig tid s\u00e4tta sig in i en patients historia men ocks\u00e5 summera viktiga livsh\u00e4ndelser s\u00e5 man inte missar viktiga detaljer i dokumentationen.<\/p>\n<h2>AI:s klassiska \u201dtoy problems\u201d<\/h2>\n<p>M\u00e5nga g\u00e5nger n\u00e4r man n\u00e4rmar sig AI \u00e4r det naiva eller grovt f\u00f6renklade problem som l\u00f6ses med hj\u00e4lp av tekniken. Spam \u00e4r p\u00e5 s\u00e4tt och vis ett s\u00e5dant eftersom konsekvenserna av ett misslyckande \u00e4r relativt harml\u00f6sa. J\u00e4mf\u00f6r med om vi misslyckas med en summering av en journal och ofta missar att lyfta fram patienters tidigare suicidf\u00f6rs\u00f6k.<\/p>\n<p>Vilken pricks\u00e4kerhet kr\u00e4vs f\u00f6r att sj\u00f6s\u00e4tta en l\u00f6sning som bygger p\u00e5 AI i din verksamhet?<\/p>\n<h2>\u201cVi sl\u00e4nger lite AI p\u00e5 problemet!\u201d<\/h2>\n<p>Vad som vid f\u00f6rsta anblick verkar vara den d\u00e4r magin m\u00e5nga tror och hoppas AI kan bidra med uppt\u00e4cker jag n\u00e4r jag provk\u00f6r AdaBoost f\u00f6r att klassificera o\u00f6nskad epost.<\/p>\n<p>Att skilja \u00f6nskad fr\u00e5n o\u00f6nskad epost \u00e4r egentligen ett typiskt s\u00f6kproblem. Det handlar om att bearbeta texten statistiskt, vilket g\u00f6rs med en formel kallad <a href=\"https:\/\/en.wikipedia.org\/wiki\/Tf%E2%80%93idf\">TF-IDF<\/a> (term frequency\u2013inverse document frequency).<\/p>\n<p>I ovanst\u00e5ende exempel \u00e4r pricks\u00e4kerheten n\u00e4stan alltid b\u00e4ttre om man drar nytta av AdaBoost. Men hur hanterar man de fall d\u00e4r algoritmen underpresterar? F\u00f6r att ens veta om det beh\u00f6ver man samk\u00f6ra flera algoritmer samtidigt och l\u00e5ta dem skvallra p\u00e5 varandra.<\/p>\n<h2>Projektets datak\u00e4lla<\/h2>\n<p>D\u00e5 AI-projektet jag \u00e4r inblandad i delvis har anamnes (typ fritext som beskriver patientens ber\u00e4ttelse, fast ofta med en v\u00e5rdpersons ord) \u00e4r det av intresse att studera vad NLP kan bidra med. Det vi g\u00f6r just nu handlar om att med NLP bearbeta anamnes f\u00f6r att f\u00f6rs\u00f6ka matcha den mot ett kodverk vid namn <a href=\"https:\/\/en.wikipedia.org\/wiki\/International_Classification_of_Primary_Care\">ICPC-2<\/a>. ICPC-2 anv\u00e4nds f\u00f6r att beskriva prim\u00e4rv\u00e5rdens perspektiv p\u00e5 v\u00e5rd och best\u00e5r av 726 definitioner av h\u00e4lsotillst\u00e5nd, allt fr\u00e5n demens, relationsproblem med barn, till akne.<\/p>\n<p>En (av mig p\u00e5hittad) anamnes kan se ut s\u00e5 h\u00e4r:<\/p>\n<blockquote><p>&#8221;Haft hosta under den senaste tiden. \u00c4r r\u00f6kare och har k\u00e4nt sig snuvig i faktiskt flera m\u00e5nader och har \u00e4ven misstanke om n\u00e5gon form av allergi\u201d<\/p><\/blockquote>\n<p>Om man med hj\u00e4lp av NLP unders\u00f6ker en anamnes kan man v\u00e4lja att plocka ut det som \u00e4r intressant. F\u00f6r att en s\u00e5n h\u00e4r automatisering ska vara genomf\u00f6rbar i stor skala beh\u00f6ver man t\u00e4nka p\u00e5 prestanda. D\u00e5 vi ska f\u00f6rs\u00f6ka matcha mot kodverket ICPC-2 \u00e4r det bra att g\u00f6ra sig av med ord som aldrig kommer finnas en matchning mellan anamnes och kodverket. Till att b\u00f6rja med kan man ta bort alla stoppord, det vill s\u00e4ga s\u00e5dant som inte p\u00e5verkar inneh\u00e5llet. Efter det \u00e4r det s\u00e4kert smart att inspektera datak\u00e4llan och lista de mest vanliga orden f\u00f6r att sedan exkludera dem fr\u00e5n anv\u00e4ndning.<\/p>\n<p>I de stickprov jag gjort inom thorax f\u00e5r jag ocks\u00e5 uppfattningen att det som beskriver problemet alltid \u00e4r ett substantiv (anges som NN nedan), men jag har \u00e4nnu inte best\u00e4mt mig om det bara \u00e4r substantiv som ska matchas mot kodverket. Det kr\u00e4vs en hel del mer utforskande innan den typ av \u00e5tg\u00e4rder kan tas.<\/p>\n<p>S\u00e5 h\u00e4r blir ovanst\u00e5ende anamnes om jag tar bort stoppord:<\/p>\n<blockquote><p>(S<br \/>\nhaft\/NN<br \/>\nhosta\/NN<br \/>\nsenaste\/NN<br \/>\ntiden\/NN<br \/>\nr\u00f6kare\/NN<br \/>\nk\u00e4nt\/FW<br \/>\nsnuvig\/NN<br \/>\nfaktiskt\/NN<br \/>\nflera\/NN<br \/>\nm\u00e5nader\/NN<br \/>\n\u00e4ven\/NNP<br \/>\nmisstanke\/VBZ<br \/>\nform\/NN<br \/>\nallergi\/NN)<\/p><\/blockquote>\n<p>Det man troligen beh\u00f6ver g\u00f6ra ut\u00f6ver detta \u00e4r att jobba med stemming, allts\u00e5 att f\u00e5 ner respektive ord till sin grundform. Detsamma f\u00f6r kodverket s\u00e5 det finns n\u00e5got att matcha mot. Det handlar om att omvandla ord som \u201callergier\u201d till \u201callergi\u201d, \u201csnuvig\u201d till \u201csnuva\u201d och s\u00e5 vidare.<\/p>\n<h2>Vad detta kan l\u00f6sa p\u00e5 sikt? Sj\u00e4lvtriagering \u00f6ver n\u00e4tet?<\/h2>\n<p>I den b\u00e4sta av v\u00e4rldar kan en s\u00e5n h\u00e4r l\u00f6sning dels bearbeta anamnes som ens v\u00e5rdgivare antecknar under ett v\u00e5rdbes\u00f6k och ge beslutsst\u00f6d. I ett s\u00e5dant scenario finns en v\u00e5rdkunnig person som kan avg\u00f6ra tr\u00e4ffs\u00e4kerheten i det st\u00f6d som erbjuds.<\/p>\n<p>I en f\u00f6rl\u00e4ngning kanske n\u00e5got liknande detta anv\u00e4ndas f\u00f6r sj\u00e4lvtriagering \u00f6ver n\u00e4tet. Triage \u00e4r f\u00f6r m\u00e5nga det f\u00f6rsta som h\u00e4nder n\u00e4r de kommer till akuten. Erfaren personal g\u00f6r en bed\u00f6mning och prioritering av patientens tillst\u00e5nd.<\/p>\n<p>Nog hade det varit bra om v\u00e5rden blev s\u00e5 pass tillg\u00e4nglig att man kunde r\u00e5dg\u00f6ra med sin klocka om de kr\u00e4mpor man har \u00e4r illa nog f\u00f6r att \u00e5ka till akuten, en jourmottagning eller v\u00e4nta till n\u00e4sta tid p\u00e5 den v\u00e5rdcentral d\u00e4r man \u00e4r listad?<\/p>\n<p>Din klocka, mobil och annan personlig utrustning sitter dessutom p\u00e5 delar av sanningen kring din h\u00e4lsa. Bland annat hur du r\u00f6r dig, inte s\u00e4llan hur du sover (genom interaktion med v\u00e4ckarklockan) och kanske rent utav en del tr\u00e4ningsdata.<\/p>\n<p>Du som vill f\u00f6lja den prototypkod vi tar fram i projektet kan kolla in Github-l\u00e4nken nedan. K\u00e4nns dig varmt v\u00e4lkommen att ha \u00e5sikter och inspel.<\/p>\n<h2>Mer om AI-projektet och NLP<\/h2>\n<ul>\n<li>Koden f\u00f6r dig som inte r\u00e4ds lite Python: <a href=\"https:\/\/github.com\/marcusosterberg\/triage-at-home\">GitHub &#8211; marcusosterberg\/triage-at-home: ML-testprojekt f\u00f6r att anv\u00e4nda NLP-teknik f\u00f6r att klassificera, ge beslutsst\u00f6d och erbjuda sj\u00e4lvtriage p\u00e5 distans<\/a><\/li>\n<li><a href=\"https:\/\/en.wikipedia.org\/wiki\/AdaBoost\">AdaBoost &#8211; Wikipedia<\/a><\/li>\n<li><a href=\"https:\/\/en.wikipedia.org\/wiki\/Part-of-speech_tagging\">Part-of-speech tagging &#8211; Wikipedia<\/a><\/li>\n<li><a href=\"https:\/\/en.wikipedia.org\/wiki\/Named-entity_recognition\">Named-entity recognition &#8211; Wikipedia<\/a><\/li>\n<li><a href=\"https:\/\/en.wikipedia.org\/wiki\/Sentiment_analysis\">Sentiment analysis &#8211; Wikipedia<\/a><\/li>\n<li><a href=\"https:\/\/en.wikipedia.org\/wiki\/Information_extraction\">Information extraction &#8211; Wikipedia<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. N\u00e5got som funkar bra sedan n\u00e5gra \u00e5r tillbaka \u00e4r att identifiera o\u00f6nskad epost. Detta g\u00f6rs med en teknik kallad NLP (Natural Language Processing), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\" class=\"more-link\">Forts\u00e4tt l\u00e4sa<span class=\"screen-reader-text\"> \u201dAI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst\u201d<\/span><\/a><\/p>\n","protected":false},"author":3,"featured_media":1491,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,6],"tags":[774,781,779,780,311,762,776,777,775,782,778,783],"class_list":["post-1490","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-digital-halsa","category-innovation","tag-adaboost","tag-anamnes","tag-icpc-2","tag-international-classification-of-primary-care-icpc","tag-kodverk","tag-microsoft-azure","tag-named-entity-recognition-ner","tag-natural-language-processing-nlp","tag-part-of-speech-pos","tag-stemming","tag-term-frequency-inverse-document-frequency-tf-idf","tag-triage"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR<\/title>\n<meta name=\"description\" content=\"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\" \/>\n<meta property=\"og:locale\" content=\"sv_SE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR\" \/>\n<meta property=\"og:description\" content=\"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\" \/>\n<meta property=\"og:site_name\" content=\"Utveckling i VGR\" \/>\n<meta property=\"article:published_time\" content=\"2018-03-05T10:38:47+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1001\" \/>\n\t<meta property=\"og:image:height\" content=\"573\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Marcus \u00d6sterberg\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@marcusosterberg\" \/>\n<meta name=\"twitter:label1\" content=\"Skriven av\" \/>\n\t<meta name=\"twitter:data1\" content=\"Marcus \u00d6sterberg\" \/>\n\t<meta name=\"twitter:label2\" content=\"Ber\u00e4knad l\u00e4stid\" \/>\n\t<meta name=\"twitter:data2\" content=\"9 minuter\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\"},\"author\":{\"name\":\"Marcus \u00d6sterberg\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/89521ab4d20982613661305cbdd5bc79\"},\"headline\":\"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst\",\"datePublished\":\"2018-03-05T10:38:47+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\"},\"wordCount\":1899,\"commentCount\":1,\"publisher\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#organization\"},\"image\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png\",\"keywords\":[\"AdaBoost\",\"Anamnes\",\"ICPC-2\",\"International Classification of Primary Care (ICPC)\",\"Kodverk\",\"Microsoft Azure\",\"Named-Entity Recognition (NER)\",\"Natural Language Processing (NLP)\",\"Part-of-speech (POS)\",\"Stemming\",\"Term frequency\u2013inverse document frequency (TF-IDF)\",\"Triage\"],\"articleSection\":[\"Digital h\u00e4lsa\",\"Innovation\"],\"inLanguage\":\"sv-SE\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\",\"url\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\",\"name\":\"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR\",\"isPartOf\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png\",\"datePublished\":\"2018-03-05T10:38:47+00:00\",\"description\":\"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.\",\"breadcrumb\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#breadcrumb\"},\"inLanguage\":\"sv-SE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage\",\"url\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png\",\"contentUrl\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png\",\"width\":1001,\"height\":573,\"caption\":\"Adaboost och SciKit-Learn\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Hem\",\"item\":\"https:\/\/vgrblogg.se\/utveckling\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#website\",\"url\":\"https:\/\/vgrblogg.se\/utveckling\/\",\"name\":\"Utveckling i VGR\",\"description\":\"Inblick i utvecklingsarbetet inom VGR\",\"publisher\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/vgrblogg.se\/utveckling\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"sv-SE\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#organization\",\"name\":\"Utveckling i VGR\",\"url\":\"https:\/\/vgrblogg.se\/utveckling\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/02\/cropped-logotype_color-1.png\",\"contentUrl\":\"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/02\/cropped-logotype_color-1.png\",\"width\":1234,\"height\":250,\"caption\":\"Utveckling i VGR\"},\"image\":{\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/logo\/image\/\"}},{\"@type\":\"Person\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/89521ab4d20982613661305cbdd5bc79\",\"name\":\"Marcus \u00d6sterberg\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/3e009001c1a7e5183f24b2642fdbf63d?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/3e009001c1a7e5183f24b2642fdbf63d?s=96&d=mm&r=g\",\"caption\":\"Marcus \u00d6sterberg\"},\"description\":\"Jobbade som utvecklings- och innovationsledare p\u00e5 V\u00e4stra G\u00f6talandsregionen, bl.a. p\u00e5 avdelningen V\u00e5rdens digitalisering, med expertis inom webbanalys och webbutveckling. Slutade 2022. F\u00f6rfattare till boken Webbstrategi f\u00f6r alla, samt Webbanalys - f\u00f6rst\u00e5 och f\u00f6rb\u00e4ttra anv\u00e4ndarnas upplevelse. Mer om Marcus \u00d6sterberg finns h\u00e4r.\",\"sameAs\":[\"https:\/\/marcusosterberg.se\",\"https:\/\/se.linkedin.com\/in\/marcusosterberg\",\"https:\/\/x.com\/marcusosterberg\"],\"url\":\"https:\/\/vgrblogg.se\/utveckling\/author\/mosterberg\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR","description":"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/","og_locale":"sv_SE","og_type":"article","og_title":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR","og_description":"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.","og_url":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/","og_site_name":"Utveckling i VGR","article_published_time":"2018-03-05T10:38:47+00:00","og_image":[{"width":1001,"height":573,"url":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png","type":"image\/png"}],"author":"Marcus \u00d6sterberg","twitter_card":"summary_large_image","twitter_creator":"@marcusosterberg","twitter_misc":{"Skriven av":"Marcus \u00d6sterberg","Ber\u00e4knad l\u00e4stid":"9 minuter"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#article","isPartOf":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/"},"author":{"name":"Marcus \u00d6sterberg","@id":"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/89521ab4d20982613661305cbdd5bc79"},"headline":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst","datePublished":"2018-03-05T10:38:47+00:00","mainEntityOfPage":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/"},"wordCount":1899,"commentCount":1,"publisher":{"@id":"https:\/\/vgrblogg.se\/utveckling\/#organization"},"image":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage"},"thumbnailUrl":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png","keywords":["AdaBoost","Anamnes","ICPC-2","International Classification of Primary Care (ICPC)","Kodverk","Microsoft Azure","Named-Entity Recognition (NER)","Natural Language Processing (NLP)","Part-of-speech (POS)","Stemming","Term frequency\u2013inverse document frequency (TF-IDF)","Triage"],"articleSection":["Digital h\u00e4lsa","Innovation"],"inLanguage":"sv-SE","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/","url":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/","name":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst &#8212; Utveckling i VGR","isPartOf":{"@id":"https:\/\/vgrblogg.se\/utveckling\/#website"},"primaryImageOfPage":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage"},"image":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage"},"thumbnailUrl":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png","datePublished":"2018-03-05T10:38:47+00:00","description":"Det finns saker som AI, machine learning och besl\u00e4ktad teknik g\u00f6r bra och andra saker som fortfarande har en del att bevisa. Delar av en teknik kallad NLP (Natural Language Processing, naturligt spr\u00e5kprocessering), allts\u00e5 att med matematik och algoritmer bearbeta spr\u00e5k p\u00e5 ett automatiskt s\u00e4tt.","breadcrumb":{"@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#breadcrumb"},"inLanguage":"sv-SE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/"]}]},{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#primaryimage","url":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png","contentUrl":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/03\/adaboost.png","width":1001,"height":573,"caption":"Adaboost och SciKit-Learn"},{"@type":"BreadcrumbList","@id":"https:\/\/vgrblogg.se\/utveckling\/2018\/03\/05\/naturligt-sprakprocessering-nlp-forstarkt-av-svartkonst\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Hem","item":"https:\/\/vgrblogg.se\/utveckling\/"},{"@type":"ListItem","position":2,"name":"AI: Naturligt spr\u00e5kprocessering f\u00f6rst\u00e4rkt av svartkonst"}]},{"@type":"WebSite","@id":"https:\/\/vgrblogg.se\/utveckling\/#website","url":"https:\/\/vgrblogg.se\/utveckling\/","name":"Utveckling i VGR","description":"Inblick i utvecklingsarbetet inom VGR","publisher":{"@id":"https:\/\/vgrblogg.se\/utveckling\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/vgrblogg.se\/utveckling\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"sv-SE"},{"@type":"Organization","@id":"https:\/\/vgrblogg.se\/utveckling\/#organization","name":"Utveckling i VGR","url":"https:\/\/vgrblogg.se\/utveckling\/","logo":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/logo\/image\/","url":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/02\/cropped-logotype_color-1.png","contentUrl":"https:\/\/vgrblogg.se\/utveckling\/wp-content\/uploads\/sites\/3\/2018\/02\/cropped-logotype_color-1.png","width":1234,"height":250,"caption":"Utveckling i VGR"},"image":{"@id":"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/logo\/image\/"}},{"@type":"Person","@id":"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/89521ab4d20982613661305cbdd5bc79","name":"Marcus \u00d6sterberg","image":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/vgrblogg.se\/utveckling\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/3e009001c1a7e5183f24b2642fdbf63d?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/3e009001c1a7e5183f24b2642fdbf63d?s=96&d=mm&r=g","caption":"Marcus \u00d6sterberg"},"description":"Jobbade som utvecklings- och innovationsledare p\u00e5 V\u00e4stra G\u00f6talandsregionen, bl.a. p\u00e5 avdelningen V\u00e5rdens digitalisering, med expertis inom webbanalys och webbutveckling. Slutade 2022. F\u00f6rfattare till boken Webbstrategi f\u00f6r alla, samt Webbanalys - f\u00f6rst\u00e5 och f\u00f6rb\u00e4ttra anv\u00e4ndarnas upplevelse. Mer om Marcus \u00d6sterberg finns h\u00e4r.","sameAs":["https:\/\/marcusosterberg.se","https:\/\/se.linkedin.com\/in\/marcusosterberg","https:\/\/x.com\/marcusosterberg"],"url":"https:\/\/vgrblogg.se\/utveckling\/author\/mosterberg\/"}]}},"_links":{"self":[{"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/posts\/1490"}],"collection":[{"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/comments?post=1490"}],"version-history":[{"count":1,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/posts\/1490\/revisions"}],"predecessor-version":[{"id":1493,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/posts\/1490\/revisions\/1493"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/media\/1491"}],"wp:attachment":[{"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/media?parent=1490"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/categories?post=1490"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vgrblogg.se\/utveckling\/wp-json\/wp\/v2\/tags?post=1490"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}