Forumnyheter:

Möjlighet för gäster att skriva inlägg har länge varit avstängt på grund av missbruk och spam, men i och med den nya forumprogramvaran är det nu påslaget igen. Se till att inte missbruka detta, för då kan det behöva stängas av igen.

Huvudmeny

material som ska få undertext

Startat av Jonas9881, 2 februari 2024 kl. 12:35:07

Föregående ämne - Nästa ämne

0 Medlemmar och 1 gäst tittar på detta ämne.

Jonas9881

Citat från: Mathilda Gustafsson skrivet  9 februari 2024 kl. 13:15:49Tack så mycket för att du tar dig tid till att dela med dig! Det här funkar bra och väljer man att ladda ner tar det inte alls lika lång tid som på Archive.
Det blir nog sämre kvalite visserligen, jämfört med Archive som behåller samma storlek som man laddar upp. Andra tjänster som erbjuder lagring av videos, minimerar storleken på videon för att det ska ta mindre plats i deras system. Men Archive är annorlunda. 

Men denna länk är inte permanent, utan när serien inte delas längre via Plex då funkar länken inte längre. Så passa på helt enkelt att ladda ner den :)  
"Vissa anser att dom har någon typ av ensamrätt till material och att det ej ska spridas. Men vi anser annorlunda. Detta är väl vad fildelning handlar om att kunna spela in material alla är uppväxta under olika tidsperioder och har inte haft samma möjligheter"
Förkortat citat från en annan användare

Mathilda Gustafsson

Citat från: Jonas9881 skrivet  9 februari 2024 kl. 13:30:50Det blir nog sämre kvalite visserligen, jämfört med Archive som behåller samma storlek som man laddar upp. Andra tjänster som erbjuder lagring av videos, minimerar storleken på videon för att det ska ta mindre plats i deras system. Men Archive är annorlunda.

Men denna länk är inte permanent, utan när serien inte delas längre via Plex då funkar länken inte längre. Så passa på helt enkelt att ladda ner den :) 
Men de här filerna har samma storlek som de du laddade upp på Archive så jag tror inte det är värre kvalitet.

Jonas9881

Citat från: Mathilda Gustafsson skrivet  9 februari 2024 kl. 13:35:00Men de här filerna har samma storlek som de du laddade upp på Archive så jag tror inte det är värre kvalitet.
Har inte laddat upp dessa avsnitt, men det låter bra.

Alla har väl nästan samma längd så det bör vara ungefär samma storlek.
"Vissa anser att dom har någon typ av ensamrätt till material och att det ej ska spridas. Men vi anser annorlunda. Detta är väl vad fildelning handlar om att kunna spela in material alla är uppväxta under olika tidsperioder och har inte haft samma möjligheter"
Förkortat citat från en annan användare

A

Citat från: Jonas9881 skrivet  9 februari 2024 kl. 11:15:41Ni får helt enkelt gå till denna länk som ni hittar alla avsnitt från S01 men som sagt inte E01-03.

https://ia601309.us.archive.org/24/items/arthur-s01-lankar/Arthur%20s01%20l%C3%A4nkar.txt

Dubbningshemsidan verktyg "infoga länk" verkar inte var min vän för den tar bort delar av länken och därav funkar det inte.

Kopiera det avsnittet ni vill se och om ni vill kan ni ladda ner det också :)
Förlåt för att jag tjatar och stressar dig men kan man få sådana listor med länkar till resten av säsongerna?

Steffan Rudvall

Citat från: A skrivet  9 februari 2024 kl. 15:10:06Förlåt för att jag tjatar och stressar dig men kan man få sådana listor med länkar till resten av säsongerna?
Ta det lugnt, han måste ju få vila lite också...

Jonas9881

Citat från: A skrivet  9 februari 2024 kl. 15:10:06Förlåt för att jag tjatar och stressar dig men kan man få sådana listor med länkar till resten av säsongerna?
Tyvärr inte. För tycker att det är bättre om jag laddar upp alla till Archive. 

Och du kan väl inte redan ha sett alla avsnitt jag länkade? ;D
"Vissa anser att dom har någon typ av ensamrätt till material och att det ej ska spridas. Men vi anser annorlunda. Detta är väl vad fildelning handlar om att kunna spela in material alla är uppväxta under olika tidsperioder och har inte haft samma möjligheter"
Förkortat citat från en annan användare

A

Citat från: Jonas9881 skrivet  9 februari 2024 kl. 15:44:06Tyvärr inte. För tycker att det är bättre om jag laddar upp alla till Archive.

Och du kan väl inte redan ha sett alla avsnitt jag länkade? ;D
Du har rätt men jag blev bara lite nervös och rädd när du sa att servern kan försvinna.

Jonas9881

Citat från: A skrivet  9 februari 2024 kl. 15:50:18Du har rätt men jag blev bara lite nervös och rädd när du sa att servern kan försvinna.
Det förstår jag. Men har du redan laddat ner alla avsnitt jag länkade?
"Vissa anser att dom har någon typ av ensamrätt till material och att det ej ska spridas. Men vi anser annorlunda. Detta är väl vad fildelning handlar om att kunna spela in material alla är uppväxta under olika tidsperioder och har inte haft samma möjligheter"
Förkortat citat från en annan användare

A

Citat från: Jonas9881 skrivet  9 februari 2024 kl. 15:55:41Det förstår jag. Men har du redan laddat ner alla avsnitt jag länkade?
Inte ännu just nu är jag på avsnitt 7 som håller på att laddas ner

Jonas9881

Citat från: A skrivet  9 februari 2024 kl. 15:59:31Inte ännu just nu är jag på avsnitt 7 som håller på att laddas ner
Ok. Inom sinne tid så kommer jag ladda upp alla på Archive, men det är väl bra att du också ha dom om dom av någon anledning skulle försvinna utan att jag hinner få tag på alla avsnitt.
"Vissa anser att dom har någon typ av ensamrätt till material och att det ej ska spridas. Men vi anser annorlunda. Detta är väl vad fildelning handlar om att kunna spela in material alla är uppväxta under olika tidsperioder och har inte haft samma möjligheter"
Förkortat citat från en annan användare

Daniel Hofverberg

#100
Citat från: Anders M Olsson skrivet 16 december 2023 kl. 23:31:23Jag har nu gjort en transkribering av intervjun och mailat den till dig, Daniel!

(Det saknas dock ett par ord i en text där jag inte för mitt liv kan höra vad Robert säger.)

Jag har använt en automatisk transkribering med hjälp av Whisper som grund, och sen gått igenom och korrigerat den manuellt.
Citat från: Anders M Olsson skrivet  4 februari 2024 kl. 18:32:27Även det finns inbyggt i Subtitle Edit, ett program som heter Whisper. Du får testa hur det fungerar för dig. Resultatet kan variera. Det brukar bli bäst med rent tal utan musik och ljudeffekter.
En väldigt gammal diskussion, men jag fortsätter i den här tråden då det passar bäst för ämnet (ena citerade inlägget ovan kommer från en annan tråd). Jag upptäckte nyligen att det för det svenska språket finns ett bättre alternativ än "vanliga" Whisper för transkribering - Kungliga Biblioteket har nämligen gjort en egen förbättrad version av Whisper vid namn KB-Whisper, som är tränad på enorma mängder av svenska TV-program från KBs arkiv.
https://www.kb.se/om-oss/nyheter/nyhetsarkiv/2025-02-20-valtranad-ai-modell-forvandlar-tal-till-text.html

"Vanliga" Whisper ska enligt uppgift "bara" vara tränad på 2000 timmar med svenskspråkigt material, så det säger sunt förnuft att 50000 timmar bör bli en rejäl förbättring.

Jag har testat att jämföra vanliga Whisper och KB-Whisper med en riktigt tuff uppgift; ett avsnitt av The New Scooby-Doo Movies från en gammal VHS-kassett från Musikservice - med mycket musik och effektljud, plus tillgjorda röster, som ju brukar vara en mardröm för sådana här tjänster. Jag blev väldigt imponerad - KB-Whisper gjorde i det närmaste ett felfritt jobb, med bara enstaka misstag här och var, men minst 95% stämmer perfekt; både texten och tidskoderna. :)

Vanliga Whisper gjorde inte direkt dåligt ifrån sig heller, men avsevärt fler misstag.

Här kommer de första två och en halv minuterna av filen, med först Whisper och sen KB-Whisper:

Whisper (v3-large):
Citat1
00:00:00,000 --> 00:00:19,060
Det är något som säger mig att det här inte
är den bästa dagen att åka och surfa på.

2
00:00:19,061 --> 00:00:24,760
Nä, var ju lite blixtrar. Vi kan alltid
hänga en oskledare bak på bredan.

3
00:00:24,761 --> 00:00:26,160
Som hon gör på lastbilar.

4
00:00:26,161 --> 00:00:28,600
Ja, vem är den för oskar?

5
00:00:30,000 --> 00:00:30,640
Jag!

6
00:00:30,641 --> 00:00:34,500
Oroa dig inte, scubby. Jag skulle
inte släppa ut en hund i de här vågorna.

7
00:00:34,501 --> 00:00:36,100
Ja, det regnar i alla fall inte.

8
00:00:36,101 --> 00:00:43,480
Vi kanske borde skippa stranden idag. Ingen
ger väl sig ut i det här vädret frivilligt.

9
00:00:43,481 --> 00:00:44,600
Utom de där.

10
00:00:44,601 --> 00:00:51,060
Oroa dig inte. Jag ska nog få
upp det här taket. När som helst.

11
00:00:51,061 --> 00:00:57,380
Den här vilan gör dig gott, Rory.
Du kan sitta i solen hela dagen bara.

12
00:00:58,220 --> 00:01:01,088
Och se dig spela golf
och se dig spela tennis

13
00:01:01,100 --> 00:01:03,980
och se dig åka
vattenskidor och se dig fiska.

14
00:01:03,981 --> 00:01:07,840
Precis.
Den motionen kommer göra dig gott, ja.

15
00:01:07,841 --> 00:01:10,420
En suverän andra smekmånad.

16
00:01:10,421 --> 00:01:12,080
Du förtjänar det.

17
00:01:12,081 --> 00:01:19,220
Var det där vad jag trodde var?

18
00:01:19,540 --> 00:01:25,526
Ingen panik nu, älskning. Allt jag behöver
göra är hissa upp fronten, ta av det

19
00:01:25,538 --> 00:01:31,460
lilla platta hjulet och sätta på det
lilla reservhjulet och vi är på väg igen.

20
00:01:31,940 --> 00:01:33,920
Förutom en liten detalj.

21
00:01:33,921 --> 00:01:35,800
Något att hissa upp den med.

22
00:01:35,801 --> 00:01:37,700
Nej, dummar inte.

23
00:01:37,701 --> 00:01:42,080
Ser din lilla Rory så dum ut att
han skulle glömma något sånt, va?

24
00:01:42,081 --> 00:01:43,020
Ja.

25
00:01:43,021 --> 00:01:45,040
Nej då, inte jag.

26
00:01:45,041 --> 00:01:50,840
Bra. Se så, hissa då upp den lilla bilen
och du glömde det lilla reservdäcket.

27
00:01:50,841 --> 00:01:53,120
Nej, jag glömde det inte.

28
00:01:53,500 --> 00:01:57,180
Jag lämnar det hemma för att få
plats med mina gamla vattenskidor.

29
00:01:57,181 --> 00:02:01,020
Ibland känner jag mig väldigt trött.

30
00:02:01,021 --> 00:02:05,180
Åh, kolla där. Kändisar.

31
00:02:05,181 --> 00:02:06,480
Vilka? Vilka då?

32
00:02:06,481 --> 00:02:10,200
Ja, det vet alla skubb.
Det är, vad heter hon och vad heter han?

33
00:02:10,201 --> 00:02:11,960
Sonja Cher.

34
00:02:11,961 --> 00:02:15,560
Åh, tusen. Vi som reser anonyma.

35
00:02:15,561 --> 00:02:18,320
Hur kunde ni se att vara
fin när jag har solbriller?

36
00:02:18,321 --> 00:02:21,820
Simpel. Det är bara att läsa på bildörren.

37
00:02:22,420 --> 00:02:24,660
Sonny Bonhoff och hans fru Sonny Bonhoff.

38
00:02:24,661 --> 00:02:28,080
Åh, tänk att få släta
på er två här i regnet.

39
00:02:28,081 --> 00:02:29,840
Vad gör du här, kär?

40
00:02:29,841 --> 00:02:31,320
Drunknar.

KB-Whisper:
Citat1
00:00:00,000 --> 00:00:05,000
-

2
00:00:15,080 --> 00:00:19,280
Det är något som säger mig att det här inte
är den bästa dagen att åka och surfa på.

3
00:00:19,280 --> 00:00:20,880
- Ja, ja.

4
00:00:20,880 --> 00:00:24,920
- Äh, vad är det för blixtar? Vi kan
alltid hänga en åskledare bak på brädan.

5
00:00:24,920 --> 00:00:26,680
Som de gör på lastbilar.

6
00:00:26,680 --> 00:00:29,320
- Ja, vem är rädd för åska?

7
00:00:30,000 --> 00:00:31,000
- Jag!

8
00:00:31,000 --> 00:00:35,000
- Oroa dig inte, jag skulle inte
släppa ut en hund i de här vågorna.

9
00:00:35,000 --> 00:00:37,000
Det regnar i alla fall inte.

10
00:00:38,000 --> 00:00:41,000
- Vi kanske borde skippa stranden idag.

11
00:00:41,000 --> 00:00:44,000
Ingen ger väl sig ut i
det här vädret frivilligt.

12
00:00:44,000 --> 00:00:46,000
- Utom de där.

13
00:00:46,000 --> 00:00:50,000
- Oroa dig inte,
jag ska nog få upp det här taket.

14
00:00:50,000 --> 00:00:54,000
När som helst. Den här vilan gör dig gott,
raring.

15
00:00:54,000 --> 00:00:58,000
Du kan sitta i solen hela dagen bara.

16
00:00:58,000 --> 00:01:00,000
- Och se dig spela golf.

17
00:01:00,000 --> 00:01:04,000
Och se dig spela tennis och se
dig åka vattenskidor och se dig fiska.

18
00:01:04,000 --> 00:01:08,000
Precis. Den motionen kommer göra dig gott.

19
00:01:08,000 --> 00:01:10,000
En suverän andra smekmånad.

20
00:01:10,000 --> 00:01:13,000
Du förtjänar det.

21
00:01:17,000 --> 00:01:19,000
Var det där vad jag tror det var?

22
00:01:19,000 --> 00:01:25,000
Ingen panik nu älskling. Allt jag
behöver gör du hissa upp fronten.

23
00:01:25,000 --> 00:01:30,000
Ta av det lilla platta hjulet och
sätta på det lilla reservhjulet.

24
00:01:30,000 --> 00:01:32,000
Och vi är på väg igen.

25
00:01:32,000 --> 00:01:34,000
Förutom en liten detalj.

26
00:01:34,000 --> 00:01:36,000
Något att hissa upp den med.

27
00:01:36,000 --> 00:01:38,000
Dummare inte.

28
00:01:38,000 --> 00:01:42,000
Ser din lilla raring så dum ut att
han skulle glömma något sånt?

29
00:01:42,000 --> 00:01:44,000
Ja.

30
00:01:44,000 --> 00:01:46,000
Nej då, inte jag.

31
00:01:46,000 --> 00:01:48,000
Bra, se så. Hissa då upp den lilla bilen.

32
00:01:48,000 --> 00:01:51,000
Och du glömde det lilla reservdäcket.

33
00:01:51,000 --> 00:01:53,000
Nej, jag glömde det inte.

34
00:01:53,000 --> 00:01:57,000
Jag lämnar det hemma för att få
plats med mina gamla vattenskidor.

35
00:01:57,000 --> 00:02:00,000
Ibland känner jag mig...

36
00:02:00,000 --> 00:02:03,000
väldigt trött.

37
00:02:03,000 --> 00:02:05,000
Åh, kolla där, kändisar.

38
00:02:05,000 --> 00:02:07,000
Vilka, vilka då?

39
00:02:07,000 --> 00:02:09,000
Det vet alla Scooby.

40
00:02:09,000 --> 00:02:11,000
Det är, vad heter hon och vad heter han?

41
00:02:11,000 --> 00:02:13,000
Sonny och Cher.

42
00:02:13,000 --> 00:02:16,000
Åh tusan, vi som reser anonyma.

43
00:02:16,000 --> 00:02:19,000
Hur kunde ni se att det
var vi när jag har solbrillor?

44
00:02:19,000 --> 00:02:22,000
Simpelt, det är bara att läsa på bildörren.

45
00:02:22,000 --> 00:02:25,000
Sonny Bonhoff och hans fru Sonny Bonhoff.

46
00:02:25,000 --> 00:02:28,000
Åh,
tänk att få stöta på er två här i regnet.

47
00:02:28,000 --> 00:02:30,000
Vad gör du här, Cher?

48
00:02:30,000 --> 00:02:34,000
Drunknar.

(Båda filerna är helt utan bearbetning, exakt så som det matades ut)

Även utan att ha avsnittet framför sig, så ser ni säkert ett flertal misstag från Whisper; och även enstaka misstag från KB-Whisper.

Nackdelen är att Subtitle Edit inte verkar ha stöd för KB-Whisper, så att få igång det är betydligt svårare. Hur Kungliga Biblioteket har tänkt att man ska göra är bortom mitt förstånd - deras tekniska beskrivning går lååångt över mitt huvud. Däremot finns det ett Python-skript vid namn Ragnar för att köra KB-Whisper lokalt på sin egen dator:
https://github.com/mickekring/TOOL--Ragnar

Jag lyckades få igång skriptet på min dator med lite möda, men både Python och webbläsaren kraschade efter ett tag med "Out of memory"-meddelanden - kanske blev det för mycket för min dator att hantera...?

Om ni andra får samma problem som mig finns även en online-tjänst där man kan ladda upp en video- eller ljudfil och få en .SRT-fil skickad per e-post. Inte riktigt lika bra som att köra lokalt av integritetsskäl, men det är åtminstone en svensk sajt som ligger på en svensk server; och således är bundna att följa GDPR (men är det något väldigt känsligt man vill texta kanske man vill undvika internet-tjänster ändå):
https://www.textamig.se/

Synd bara att det inte verkar finnas någon sådan förbättrad version av Whisper till andra språk - inte minst norska och danska hade ju inte suttit fel...

Anders M Olsson

Citat från: Daniel Hofverberg skrivet 21 november 2025 kl. 15:08:58Synd bara att det inte verkar finnas någon sådan förbättrad version av Whisper till andra språk - inte minst norska och danska hade ju inte suttit fel...
Till norska finns det ett antal modeller inbyggda i Subtitle Edit. Klicka på ... till höger om menyn Choose model och välj någon av de nedersta modellerna, t.ex. large.nb (6.2 GB Norwegian).

Det finns även det här:
https://huggingface.co/NbAiLab/nb-whisper-large

Daniel Hofverberg

Citat från: Anders M Olsson skrivet 21 november 2025 kl. 19:00:03Till norska finns det ett antal modeller inbyggda i Subtitle Edit. Klicka på ... till höger om menyn Choose model och välj någon av de nedersta modellerna, t.ex. large.nb (6.2 GB Norwegian).

Det finns även det här:
https://huggingface.co/NbAiLab/nb-whisper-large
Mycket intressant, den där länken verkar ju vara en norsk motsvarighet till KB-Whisper från Nasjonalbiblioteket (Norges motsvarighet till KB).

Den stora frågan är ju vad nb-modellerna i Subtitle Edit är för något...? Är det Nasjonalbibliotekets modeller eller något helt annat? NB är ju tyvärr en olyckligt tvetydig förkortning, då det både kan stå för den officiella språkkoden för bokmål (norsk bokmål) och för Nasjonalbiblioteket...

Och om det i Subtitle Edit inte är samma som länken till Huggingface, hur använder man då Nasjonalbibliotekets modeller...?

Finns det någon motsvarighet även i Danmark, månn tro...?

Anders M Olsson

Citat från: Daniel Hofverberg skrivet 22 november 2025 kl. 04:34:49Och om det i Subtitle Edit inte är samma som länken till Huggingface, hur använder man då Nasjonalbibliotekets modeller...?
Jag har gjort vissa framsteg. Det finns ett exempelscript till Faster-whisper på KBs sida:

#### faster-whisper model ####
from faster_whisper import WhisperModel

model_id = "KBLab/kb-whisper-large"
model = WhisperModel(
    model_id,
    device="cuda",
    compute_type="float16",
    download_root="cache", # cache directory
    # condition_on_previous_text = False # Can reduce hallucinations if we don't use prompts
)

# Transcribe audio.wav (convert to 16khz mono wav first via ffmpeg)
segments, info = model.transcribe("audio.wav", condition_on_previous_text=False)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Det kan man kopiera och spara som ett python-script, t.ex. som fw-sv.py. Helst skapar man en egen mapp för ändamålet eftersom det kommer att skapas underkataloger för modellerna första gången man kör scriptet.

Man måste installera Faster-whisper med kommandot
pip install faster-whisper
Kanske fungerar det för dig, men jag lyckades inte få scriptet att fungera med cuda (matematik i grafikkortet), så jag ändrade två rader till
device="cpu",
compute_type="int8",
Att räkna i cpu:n blir förmodligen lite långsammare, men bättre att det går långsamt än inte alls.

Sen kan man köra scriptet med kommandot
python fw-sv.py
Ljudet som ska transkriberas måste dessförinnan ha sparats som en 16 kHz wav-fil i mono döpt till audio.wav.

Resultatet blir kanske lite svårt att använda utan konvertering p.g.a. hur start och stopptiderna för replikerna anges.
[0.00s -> 2.00s]  Jag behöver hjälp!
[2.00s -> 5.00s]  Mabel, jag håller precis en kurs.
[5.00s -> 7.00s]  En kurs som du är anmäld till.
[7.00s -> 8.00s]  Tjabba, Mabel!
[8.00s -> 10.00s]  Följ med här.
[10.00s -> 14.00s]  De traditionella metoderna för att förstå djuren fungerade bara inte.

Man vill kanske hellre ha resultatet i en .srt-fil. Jag hittade ett exempel på nätet som jag har bakat in i scriptet som då blev så här:

#### faster-whisper model ####
from faster_whisper import WhisperModel
import pysubs2

model_id = "KBLab/kb-whisper-large"
model = WhisperModel(
    model_id,
    device="cpu",
    compute_type="int8",
    download_root="cache", # cache directory
    # condition_on_previous_text = False # Can reduce hallucinations if we don't use prompts
)

# Transcribe audio.wav (convert to 16khz mono wav first via ffmpeg)
segments, info = model.transcribe("audio.wav", condition_on_previous_text=False, language="sv")
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

# to use pysubs2, the argument must be a segment list-of-dicts
results= []
for s in segments:
    segment_dict = {'start':s.start,'end':s.end,'text':s.text}
    results.append(segment_dict)

subs = pysubs2.load_from_whisper(results)
#save srt file
subs.save('audio.srt')
#save ass file
#subs.save('audio.ass')

Jag lade även till language="sv" för att tvinga programmet att jobba med svenska ifall språkidentifieringen skulle misslyckas.

Detta kräver modulen pysubs2 som kan installeras med
pip install pysubs2
Resultatet sparas i audio.srt.

Det är förstås inte så elegant att ha filnamnen hårdkodade i scriptet, så det får bli föremål för vidare utveckling...

Anders M Olsson

Citat från: Daniel Hofverberg skrivet 22 november 2025 kl. 04:34:49Och om det i Subtitle Edit inte är samma som länken till Huggingface, hur använder man då Nasjonalbibliotekets modeller...?
För norska kan man göra samma sak. Det modifierade scriptet blir då så här:
#### faster-whisper model ####
from faster_whisper import WhisperModel
import pysubs2

model_id = "NbAiLab/nb-whisper-large"
model = WhisperModel(
    model_id,
    device="cpu",
    compute_type="int8",
    download_root="cache", # cache directory
    # condition_on_previous_text = False # Can reduce hallucinations if we don't use prompts
)

# Transcribe audio.wav (convert to 16khz mono wav first via ffmpeg)
segments, info = model.transcribe("audio.wav", condition_on_previous_text=False, language="no")
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

# to use pysubs2, the argument must be a segment list-of-dicts
results= []
for s in segments:
    segment_dict = {'start':s.start,'end':s.end,'text':s.text}
    results.append(segment_dict)

subs = pysubs2.load_from_whisper(results)
#save srt file
subs.save('audio.srt')
#save ass file
#subs.save('audio.ass')