{"id":1497,"date":"2018-04-04T11:30:25","date_gmt":"2018-04-04T09:30:25","guid":{"rendered":"https:\/\/vgrblogg.se\/utveckling\/?p=1497"},"modified":"2018-04-04T11:30:25","modified_gmt":"2018-04-04T09:30:25","slug":"textning-av-videoklipp","status":"publish","type":"post","link":"https:\/\/vgrblogg.se\/utveckling\/2018\/04\/04\/textning-av-videoklipp\/","title":{"rendered":"Halvautomatisk textning av videoklipp f\u00f6r webben"},"content":{"rendered":"
I och med EU:s s\u00e5 kallade webbdirektiv kommer svensk lagstiftning att kr\u00e4va att videoklipp som publiceras p\u00e5 webben ska vara tillg\u00e4ngligt. F\u00f6r de som har nedsatt h\u00f6rsel, \u00e4r i en bullrig milj\u00f6 eller kanske har en h\u00f6rselskada ska kunna ta del av videoklippet beh\u00f6ver det textas.<\/p>\n
Denna bloggpost unders\u00f6ker hur mycket arbete det inneb\u00e4r att f\u00f6rs\u00f6ka automatisera textning av en timmes filmad f\u00f6rel\u00e4sning.<\/p>\n
Video \u00e4r ett ypperligt media f\u00f6r de flesta. \u00c4r det en f\u00f6rel\u00e4sning som filmas kan \u00e4ven de som var p\u00e5 plats ha nytta av att i efterhand kunna friska upp minnet, men det kan ocks\u00e5 \u00f6verbrygga geografiska barri\u00e4rer genom direkts\u00e4ndning eller att man i efterhand kan ta del av inneh\u00e5llet.<\/p>\n
Video som media har \u00e4ven andra styrkor, bland annat att det \u00e4r ett mer l\u00e4ttillg\u00e4ngligt format f\u00f6r vissa j\u00e4mf\u00f6rt med att l\u00e4sa motsvarande information som text. Dessutom kan man jobba med visualisering, r\u00f6rliga bilder och dramatik f\u00f6r att ge eftertryck till s\u00e5dant inneh\u00e5ll som beh\u00f6ver det, vilket bidrar med tydlighet.<\/p>\n
Video beh\u00f6ver utformas med tillg\u00e4nglighet i \u00e5tanke d\u00e4rf\u00f6r att det g\u00f6r inneh\u00e5llet anv\u00e4ndbart f\u00f6r de flesta i n\u00e5gon situation, men ocks\u00e5 f\u00f6r att det \u00e4r n\u00f6dv\u00e4ndigt f\u00f6r de med s\u00e4rskilda behov. Bra ljud beh\u00f6ver kompletteras med textning, skarp bild f\u00f6r att kunna urskilja detaljer och att saker \u00e4r stora nog f\u00f6r att synas \u00e4r s\u00e5dant som \u00e4r viktigt att t\u00e4nka p\u00e5.<\/p>\n
Bra ljud \u00e4r en f\u00f6ruts\u00e4ttning f\u00f6r att det ska g\u00e5 att automatisera textningen. H\u00f6rs inte inneh\u00e5llet \u00e4r det sv\u00e5rt b\u00e5de f\u00f6r m\u00e4nniska och maskin. D\u00e4rf\u00f6r beh\u00f6vs en del f\u00f6rberedelser och reservplaner f\u00f6r att lyckas f\u00e5nga b\u00e5de bild och ljud som h\u00e5ller m\u00e5ttet.<\/p>\n
Eftersom ett bra ljud \u00e4r avg\u00f6rande f\u00f6r v\u00e4ldigt m\u00e5nga g\u00e4ller det att tillse att man har bra mikrofoner. Mikrofonerna beh\u00f6ver vara v\u00e4lplacerade och korrekt inst\u00e4llda. Bland inst\u00e4llningar finns exempelvis ofta n\u00e5got som kallas f\u00f6r gain, det \u00e4r inst\u00e4llning som avg\u00f6r hur mycket ljudet beh\u00f6ver f\u00f6rst\u00e4rkas. H\u00f6g gain plockar upp ljud l\u00e5ngt ifr\u00e5n mikrofonen men riskerar att ta med st\u00f6rande omgivningsljud. L\u00e5g gain kr\u00e4ver att ljudk\u00e4llan \u00e4r n\u00e4ra mikrofonen och talar klart och tydligt.<\/p>\n
F\u00f6rutom den mikrofon\/mygga som kopplas till kameran kan du beh\u00f6va en mikrofon om publiken ska kunna st\u00e4lla fr\u00e5gor. Det \u00e4r ocks\u00e5 bra att ha en extra mikrofon bredvid f\u00f6rel\u00e4saren som en extra s\u00e4kerhets\u00e5tg\u00e4rd om ljudet i kameran skulle strula eller visa sig inte vara tillr\u00e4ckligt bra.<\/p>\n
Se till att dina mikrofoner faktiskt f\u00e5ngar upp ljud, att du har tillr\u00e4ckligt med batteri\/str\u00f6m och att du bekantat dig med mikrofonernas funktioner.<\/p>\n
Om publiken ska kunna st\u00e4lla fr\u00e5gor s\u00e5 ber\u00e4tta att de beh\u00f6ver anv\u00e4nda mikrofonen. Att de ska inleda med sitt namn och annan kort info om sig innan de st\u00e4ller sin fr\u00e5ga. Sedan beh\u00f6ver n\u00e5gon springa runt med mikrofon bland de som st\u00e4ller fr\u00e5gor och eventuellt repetera eller summera fr\u00e5gor som man misst\u00e4nker inte f\u00e5ngats tillr\u00e4ckligt bra av mikrofonen.<\/p>\n
Undertexten kan skapas p\u00e5 olika s\u00e4tt. Helt manuellt d\u00e4r man sj\u00e4lv f\u00e5r l\u00e4gga en hel del tid p\u00e5 att undertexterna visas vid r\u00e4tt tid i filmen till n\u00e4r det pratas. Ett annat s\u00e4tt \u00e4r anv\u00e4nda ett program som analyserar ljudsp\u00e5ret och fr\u00e5n det automatiskt skapar en fil inneh\u00e5llandes tidskodad undertextning. Det inneb\u00e4r sj\u00e4lva texten som ska visas samt en tidskod f\u00f6r n\u00e4r texten ska in och ut ur bild. <\/span><\/p>\n Ett program f\u00f6r detta \u00e4r <\/span>autosub<\/b> som f\u00f6renklar processen ordentligt och \u00e4ven klarar av att producera undertexter i flera olika format, exempelvis .srt och JSON. Det st\u00f6djer till och med m\u00f6jligheten att skapa \u00f6vers\u00e4ttningar fr\u00e5n det pratade originalspr\u00e5ket till n\u00e5got av dom \u00f6vriga spr\u00e5ken som st\u00f6ds.<\/span><\/p>\n Dock \u00e4r det viktigt att f\u00f6rst\u00e5 att den automatiskt skapade undertexten \u00e4r l\u00e5ngt ifr\u00e5n perfekt, den beh\u00f6ver manuellt g\u00e5s igenom och finputsas i efterhand. Men, tack vare att tidskoder automatgenereras s\u00e5 \u00e4r det \u00e4nd\u00e5 mycket manuellt arbete som besparas.<\/span><\/p>\n Autosub kr\u00e4ver att Python 2 finns p\u00e5 din dator f\u00f6r att fungera. Information och nedladdning finns p\u00e5: <\/span>www.python.org\/downloads\/<\/span><\/a> Du beh\u00f6ver ocks\u00e5 installera biblioteket FFmpeg, det beh\u00f6vs f\u00f6r att plocka ut ljudsp\u00e5ret ur videoklippet. Det kan laddas ner fr\u00e5n <\/span>www.ffmpeg.org\/download.html<\/span><\/a>, d\u00e4r finns ocks\u00e5 information f\u00f6r installation p\u00e5 n\u00e5gon av om du anv\u00e4nder n\u00e5gon Linux-distribution som operativsystem.<\/span><\/p>\n N\u00e4r v\u00e4l Python 2 och FFmpeg \u00e4r installerat \u00e4r det bara att k\u00f6ra f\u00f6ljande kommando i terminalen s\u00e5 installeras autosub automatiskt:<\/span><\/p>\n Mer information finns p\u00e5: <\/span>github.com\/agermanidis\/autosub<\/span><\/a><\/p>\n F\u00f6rutom svenska s\u00e5 finns dom nordiska och skandinaviska spr\u00e5ken med. Totalt \u00e4r det 91 spr\u00e5k som, i skrivande stund, st\u00f6ds. F\u00f6r komplett lista, och spr\u00e5kkoder, k\u00f6r f\u00f6ljande kommando i terminalen:<\/span><\/p>\n Nu \u00e4r det dags att generera undertextningen och i det h\u00e4r exemplet vill vi f\u00e5 det i .srt-format:<\/span><\/p>\n Resultatet blir en textfil med samma namn som k\u00e4llan, fast med \u00e4ndelsen .srt, s\u00e5ledes \u201cexempel.srt\u201d.<\/span><\/p>\n V\u00e4xlarna \u201c-S\u201d och \u201c-D\u201d beh\u00f6ver inte vara samma, vi hade kunnat ange \u201cen\u201d f\u00f6r \u201c-D\u201d och d\u00e4rmed f\u00e5tt en \u00f6vers\u00e4ttning till engelska ist\u00e4llet.<\/span><\/p>\n Som du kommer m\u00e4rka g\u00e5r det riktigt snabbt att generera undertexten. Detta eftersom <\/span>autosub<\/span> inte skickar hela originalfilen \u00f6ver internet. F\u00f6rst unders\u00f6ker den inneh\u00e5llet och plockar bara ut ljudsp\u00e5ret som sedan skickas till tj\u00e4nsten som \u00f6vers\u00e4tter tal till text. En originalfil p\u00e5 4.4Gb, ungef\u00e4r en timmes f\u00f6rel\u00e4sning, tog exempelvis bara n\u00e5gon minut f\u00f6r <\/span>autosub<\/span> att generera undertexten f\u00f6r.<\/span><\/p>\n N\u00e4r undertexten v\u00e4l har genererats \u00e4r det dags att kvalitetsgranska den. Det h\u00e4r \u00e4r fortfarande ny teknologi och NLP (Natural Language Processing) \u00e4r \u00e4nnu inte perfekt. Det beh\u00f6vs fortfarande manuellt arbete f\u00f6r att kvalitetss\u00e4kra. Dock, tack vare att texten nu har tidskoder f\u00f6r var i filmen r\u00e4tt undertext ska visas, s\u00e5 \u00e4r det \u00e4nd\u00e5 en stor m\u00e4ngd manuellt arbete som automatiserats bort. D\u00e5 taligenk\u00e4nning blir allt b\u00e4ttre s\u00e5 kommer automatiskt genererade undertexter ocks\u00e5 att kontinuerligt f\u00f6rb\u00e4ttras, d\u00e4rmed minska det manuella arbetet och snabbare g\u00f6ra video tillg\u00e4ngligt f\u00f6r fler som beh\u00f6ver det.<\/span><\/p>\n I n\u00e4sta avsnitt g\u00e5r vi igenom hur du genomf\u00f6r dom manuella f\u00f6rb\u00e4ttringarna av r\u00e5texten.<\/span><\/p>\n En utmaning med att texta ett videoklipp \u00e4r att det kan beh\u00f6va erbjudas textning p\u00e5 flera olika spr\u00e5k. Rent utav ett g\u00e4ng spr\u00e5k du sj\u00e4lv inte beh\u00e4rskar. En kvalificerad gissning \u00e4r att om du g\u00f6r en utm\u00e4rkt textning p\u00e5 ditt eget modersm\u00e5l blir det l\u00e4ttare f\u00f6r flerspr\u00e5kiga kollegor eller spr\u00e5kkonsulter att f\u00f6rst\u00e5 mer exakt vad som avses n\u00e4r de g\u00f6r \u00f6vers\u00e4ttningarna. I brist p\u00e5 andra rekommendationer \u00e4r det nog smart att h\u00e5lla sig till klarspr\u00e5k eller \u00e5tminstone ett s\u00e5 pass enkelt spr\u00e5k som m\u00f6jligt.<\/p>\n Det \u00e4r bra om det som textas \u00e4r s\u00e5 kort som m\u00f6jligt. Annars riskerar den som l\u00e4ser att inte hinna med texten under den tid den \u00e4r framme. Ett st\u00f6d f\u00f6r att undvika detta finns i kolumnen CPS i textningsprogrammet Aegisub, d\u00e4r r\u00f6dmarkeras det om det \u00e4r orimligt mycket text att l\u00e4sa p\u00e5 den tid som textremsan \u00e4r framme.<\/p>\n Ska materialet publiceras f\u00f6r offentlig sektors r\u00e4kning \u00e4r det praxis inom minoritetsspr\u00e5k du beh\u00f6ver kolla upp, ut\u00f6ver vilka spr\u00e5k som m\u00e5lgruppen kan. T\u00e4nk ocks\u00e5 p\u00e5 att h\u00f6rselskadade inte n\u00f6dv\u00e4ndigtvis har svenska som modersm\u00e5l!<\/p>\n De tv\u00e5 videoklipp vi jobbat med som bas f\u00f6r denna bloggpost \u00e4r cirka en timme samt en p\u00e5 knappt femtio minuter. I v\u00e5rt fall var det inspelade ljudet bra, men kunde absolut varit b\u00e4ttre. Dock \u00e4r det oklart om ett b\u00e4ttre ljud skulle lett till ett b\u00e4ttre resultat d\u00e5 talet var p\u00e5 svenska, ett ganska exotiskt spr\u00e5k i dessa sammanhang. Det \u00e4r s\u00e4kert s\u00e5 att en extremt artikulerande f\u00f6rel\u00e4sare hade gett n\u00e5got b\u00e4ttre automatiska texter.<\/p>\n P\u00e5 f\u00f6rhand kan det vara sv\u00e5rt att veta hur mycket tid det tar att redigera texterna. I v\u00e5rt fall tog det 6-10 g\u00e5nger s\u00e5 l\u00e5ng tid som videoklippet att f\u00e5 till textremsorna. Vissa extrema delar av videoklippen tog 50 minuter f\u00f6r att redigera fem minuter tal i textremsor. Extremfallen berodde p\u00e5 att textblock med enskilda ord hade skapats vid genereringen och det tog tid att koda om dessa manuellt.<\/p>\n Exempel p\u00e5 automatiserad textning:<\/p>\n ”Jag somnade som en turen Peter brukaren konstatera s\u00e5 \u00e4r det ju Det verkar sv\u00e5rt att bli b\u00e4ttre n\u00e5got om man inte \u00e4ter eller vet vad den m\u00e5ste f\u00f6lja upp\u201d<\/p><\/blockquote>\n Vilket skulle ha varit:<\/p>\n ”Som managementgurun Peter Drucker konstaterar \u00e4r det verkligen sv\u00e5rt att f\u00f6rb\u00e4ttra n\u00e5got om man inte m\u00e4ter eller vet vad det \u00e4r man ska f\u00f6lja upp\u201d<\/p><\/blockquote>\n Det g\u00e5r med andra ord inte att n\u00f6ja sig med vad som s\u00e4gs, textremsorna blir inte logiska d\u00e5. Men f\u00f6r att vara f\u00f6rsta g\u00e5ngen att jobba med textning \u00e4r upplevelsen att jobbet med att ange respektive tidpunkt f\u00f6r varje textremsa hade gjort jobbet mycket v\u00e4rre.<\/p>\n Efter att man laddat upp videoklippet f\u00e5r man ladda upp sin textfil i anslutning till videoklippet. Har man flera spr\u00e5k verkar \u00e4ven det g\u00e5 bra, \u00e5tminstone p\u00e5 Youtube och Vimeo.<\/p>\n Videoklippen vi jobbat med textningen p\u00e5 \u00e4r dessa:<\/p>\n Program som hj\u00e4lper till:<\/p>\n Riktlinjer och andra tips:<\/p>\n \/\/Thomas & Marcus<\/p>\n","protected":false},"excerpt":{"rendered":" I och med EU:s s\u00e5 kallade webbdirektiv kommer svensk lagstiftning att kr\u00e4va att videoklipp som publiceras p\u00e5 webben ska vara tillg\u00e4ngligt. F\u00f6r de som har nedsatt h\u00f6rsel, \u00e4r i en bullrig milj\u00f6 eller kanske har en h\u00f6rselskada ska kunna ta del av videoklippet beh\u00f6ver det textas. Denna bloggpost unders\u00f6ker hur mycket arbete det inneb\u00e4r att … <\/p>\nInstallera Python 2 och FFmpeg<\/span><\/h4>\n
\nHar du Macos eller Linux \u00e4r det troligt att du redan har Python 2 installerat.<\/span><\/p>\nInstallera autosub<\/span><\/h4>\n
pip install autosub<\/span><\/pre>\nVilka spr\u00e5k st\u00f6ds<\/span><\/h4>\n
autosub --list-languages<\/span><\/pre>\nGenerera undertexten<\/span><\/h4>\n
autosub -F srt -S sv -D sv exempel.mp4<\/span><\/pre>\n\n
Redigera textningen<\/h3>\n
<\/a>Hur m\u00e5nga spr\u00e5k ska vi texta f\u00f6r?<\/h4>\n
\nSt\u00f6rsta tidsvinsten med ovanst\u00e5ende automatiska textning \u00e4r nog att inte beh\u00f6va skriva tidskoderna f\u00f6r n\u00e4r en textremsa ska in och ur bild. Texten som genererats \u00e4r verkligen inte felfri.<\/p>\nTids\u00e5tg\u00e5ng att redigera de automatiska textningarna<\/h3>\n
Publicering<\/h2>\n
L\u00e4s mer \/ l\u00e4nkar<\/h2>\n
\n
\n
\n