{"id":1497,"date":"2018-04-04T11:30:25","date_gmt":"2018-04-04T09:30:25","guid":{"rendered":"https:\/\/vgrblogg.se\/utveckling\/?p=1497"},"modified":"2018-04-04T11:30:25","modified_gmt":"2018-04-04T09:30:25","slug":"textning-av-videoklipp","status":"publish","type":"post","link":"https:\/\/vgrblogg.se\/utveckling\/2018\/04\/04\/textning-av-videoklipp\/","title":{"rendered":"Halvautomatisk textning av videoklipp f\u00f6r webben"},"content":{"rendered":"

I och med EU:s s\u00e5 kallade webbdirektiv kommer svensk lagstiftning att kr\u00e4va att videoklipp som publiceras p\u00e5 webben ska vara tillg\u00e4ngligt. F\u00f6r de som har nedsatt h\u00f6rsel, \u00e4r i en bullrig milj\u00f6 eller kanske har en h\u00f6rselskada ska kunna ta del av videoklippet beh\u00f6ver det textas.<\/p>\n

Denna bloggpost unders\u00f6ker hur mycket arbete det inneb\u00e4r att f\u00f6rs\u00f6ka automatisera textning av en timmes filmad f\u00f6rel\u00e4sning.<\/p>\n

Vad \u00e4r po\u00e4ngen med video?<\/h2>\n

Video \u00e4r ett ypperligt media f\u00f6r de flesta. \u00c4r det en f\u00f6rel\u00e4sning som filmas kan \u00e4ven de som var p\u00e5 plats ha nytta av att i efterhand kunna friska upp minnet, men det kan ocks\u00e5 \u00f6verbrygga geografiska barri\u00e4rer genom direkts\u00e4ndning eller att man i efterhand kan ta del av inneh\u00e5llet.<\/p>\n

Video som media har \u00e4ven andra styrkor, bland annat att det \u00e4r ett mer l\u00e4ttillg\u00e4ngligt format f\u00f6r vissa j\u00e4mf\u00f6rt med att l\u00e4sa motsvarande information som text. Dessutom kan man jobba med visualisering, r\u00f6rliga bilder och dramatik f\u00f6r att ge eftertryck till s\u00e5dant inneh\u00e5ll som beh\u00f6ver det, vilket bidrar med tydlighet.<\/p>\n

Video beh\u00f6ver utformas med tillg\u00e4nglighet i \u00e5tanke d\u00e4rf\u00f6r att det g\u00f6r inneh\u00e5llet anv\u00e4ndbart f\u00f6r de flesta i n\u00e5gon situation, men ocks\u00e5 f\u00f6r att det \u00e4r n\u00f6dv\u00e4ndigt f\u00f6r de med s\u00e4rskilda behov. Bra ljud beh\u00f6ver kompletteras med textning, skarp bild f\u00f6r att kunna urskilja detaljer och att saker \u00e4r stora nog f\u00f6r att synas \u00e4r s\u00e5dant som \u00e4r viktigt att t\u00e4nka p\u00e5.<\/p>\n

Hur g\u00e5r textningen till?<\/h2>\n

Bra ljud \u00e4r en f\u00f6ruts\u00e4ttning f\u00f6r att det ska g\u00e5 att automatisera textningen. H\u00f6rs inte inneh\u00e5llet \u00e4r det sv\u00e5rt b\u00e5de f\u00f6r m\u00e4nniska och maskin. D\u00e4rf\u00f6r beh\u00f6vs en del f\u00f6rberedelser och reservplaner f\u00f6r att lyckas f\u00e5nga b\u00e5de bild och ljud som h\u00e5ller m\u00e5ttet.<\/p>\n

Planering och f\u00f6rberedelse<\/h3>\n

Eftersom ett bra ljud \u00e4r avg\u00f6rande f\u00f6r v\u00e4ldigt m\u00e5nga g\u00e4ller det att tillse att man har bra mikrofoner. Mikrofonerna beh\u00f6ver vara v\u00e4lplacerade och korrekt inst\u00e4llda. Bland inst\u00e4llningar finns exempelvis ofta n\u00e5got som kallas f\u00f6r gain, det \u00e4r inst\u00e4llning som avg\u00f6r hur mycket ljudet beh\u00f6ver f\u00f6rst\u00e4rkas. H\u00f6g gain plockar upp ljud l\u00e5ngt ifr\u00e5n mikrofonen men riskerar att ta med st\u00f6rande omgivningsljud. L\u00e5g gain kr\u00e4ver att ljudk\u00e4llan \u00e4r n\u00e4ra mikrofonen och talar klart och tydligt.<\/p>\n

F\u00f6rutom den mikrofon\/mygga som kopplas till kameran kan du beh\u00f6va en mikrofon om publiken ska kunna st\u00e4lla fr\u00e5gor. Det \u00e4r ocks\u00e5 bra att ha en extra mikrofon bredvid f\u00f6rel\u00e4saren som en extra s\u00e4kerhets\u00e5tg\u00e4rd om ljudet i kameran skulle strula eller visa sig inte vara tillr\u00e4ckligt bra.<\/p>\n

Inf\u00f6r inspelning<\/h3>\n

Se till att dina mikrofoner faktiskt f\u00e5ngar upp ljud, att du har tillr\u00e4ckligt med batteri\/str\u00f6m och att du bekantat dig med mikrofonernas funktioner.<\/p>\n

Under inspelningen<\/h3>\n

Om publiken ska kunna st\u00e4lla fr\u00e5gor s\u00e5 ber\u00e4tta att de beh\u00f6ver anv\u00e4nda mikrofonen. Att de ska inleda med sitt namn och annan kort info om sig innan de st\u00e4ller sin fr\u00e5ga. Sedan beh\u00f6ver n\u00e5gon springa runt med mikrofon bland de som st\u00e4ller fr\u00e5gor och eventuellt repetera eller summera fr\u00e5gor som man misst\u00e4nker inte f\u00e5ngats tillr\u00e4ckligt bra av mikrofonen.<\/p>\n

Efter inspelningen<\/h2>\n

Att generera text baserat p\u00e5 ett ljudklipp<\/b><\/h3>\n

Undertexten kan skapas p\u00e5 olika s\u00e4tt. Helt manuellt d\u00e4r man sj\u00e4lv f\u00e5r l\u00e4gga en hel del tid p\u00e5 att undertexterna visas vid r\u00e4tt tid i filmen till n\u00e4r det pratas. Ett annat s\u00e4tt \u00e4r anv\u00e4nda ett program som analyserar ljudsp\u00e5ret och fr\u00e5n det automatiskt skapar en fil inneh\u00e5llandes tidskodad undertextning. Det inneb\u00e4r sj\u00e4lva texten som ska visas samt en tidskod f\u00f6r n\u00e4r texten ska in och ut ur bild. <\/span><\/p>\n

Ett program f\u00f6r detta \u00e4r <\/span>autosub<\/b> som f\u00f6renklar processen ordentligt och \u00e4ven klarar av att producera undertexter i flera olika format, exempelvis .srt och JSON. Det st\u00f6djer till och med m\u00f6jligheten att skapa \u00f6vers\u00e4ttningar fr\u00e5n det pratade originalspr\u00e5ket till n\u00e5got av dom \u00f6vriga spr\u00e5ken som st\u00f6ds.<\/span><\/p>\n

Dock \u00e4r det viktigt att f\u00f6rst\u00e5 att den automatiskt skapade undertexten \u00e4r l\u00e5ngt ifr\u00e5n perfekt, den beh\u00f6ver manuellt g\u00e5s igenom och finputsas i efterhand. Men, tack vare att tidskoder automatgenereras s\u00e5 \u00e4r det \u00e4nd\u00e5 mycket manuellt arbete som besparas.<\/span><\/p>\n

Installera Python 2 och FFmpeg<\/span><\/h4>\n

Autosub kr\u00e4ver att Python 2 finns p\u00e5 din dator f\u00f6r att fungera. Information och nedladdning finns p\u00e5: <\/span>www.python.org\/downloads\/<\/span><\/a>
\nHar du Macos eller Linux \u00e4r det troligt att du redan har Python 2 installerat.<\/span><\/p>\n

Du beh\u00f6ver ocks\u00e5 installera biblioteket FFmpeg, det beh\u00f6vs f\u00f6r att plocka ut ljudsp\u00e5ret ur videoklippet. Det kan laddas ner fr\u00e5n <\/span>www.ffmpeg.org\/download.html<\/span><\/a>, d\u00e4r finns ocks\u00e5 information f\u00f6r installation p\u00e5 n\u00e5gon av om du anv\u00e4nder n\u00e5gon Linux-distribution som operativsystem.<\/span><\/p>\n

Installera autosub<\/span><\/h4>\n

N\u00e4r v\u00e4l Python 2 och FFmpeg \u00e4r installerat \u00e4r det bara att k\u00f6ra f\u00f6ljande kommando i terminalen s\u00e5 installeras autosub automatiskt:<\/span><\/p>\n

pip install autosub<\/span><\/pre>\n

Mer information finns p\u00e5: <\/span>github.com\/agermanidis\/autosub<\/span><\/a><\/p>\n

Vilka spr\u00e5k st\u00f6ds<\/span><\/h4>\n

F\u00f6rutom svenska s\u00e5 finns dom nordiska och skandinaviska spr\u00e5ken med. Totalt \u00e4r det 91 spr\u00e5k som, i skrivande stund, st\u00f6ds. F\u00f6r komplett lista, och spr\u00e5kkoder, k\u00f6r f\u00f6ljande kommando i terminalen:<\/span><\/p>\n

autosub --list-languages<\/span><\/pre>\n

Generera undertexten<\/span><\/h4>\n

Nu \u00e4r det dags att generera undertextningen och i det h\u00e4r exemplet vill vi f\u00e5 det i .srt-format:<\/span><\/p>\n

autosub -F srt -S sv -D sv exempel.mp4<\/span><\/pre>\n