Forumnyheter:

Möjlighet för gäster att skriva inlägg har länge varit avstängt på grund av missbruk och spam, men i och med den nya forumprogramvaran är det nu påslaget igen. Se till att inte missbruka detta, för då kan det behöva stängas av igen.

Huvudmeny

Förslag. Creditlistan som wiki

Startat av ssimon, 2 augusti 2024 kl. 17:52:54

Föregående ämne - Nästa ämne

0 Medlemmar och 1 gäst tittar på detta ämne.

ssimon

Creditlistan är relativt stor och det är svårt att hitta snabbt. En bra funktion som saknas är att klicka på skådisen och sen visa personens alla dubbningar.

Lägg till en mediawiki eller liknande så utvalda medlemmar kan lägga/ändra creditlistan.

mvh och tack för en bra sida.

Mathilda Gustafsson

Citat från: ssimon skrivet  2 augusti 2024 kl. 17:52:54Creditlistan är relativt stor och det är svårt att hitta snabbt. En bra funktion som saknas är att klicka på skådisen och sen visa personens alla dubbningar.

Lägg till en mediawiki eller liknande så utvalda medlemmar kan lägga/ändra creditlistan.

mvh och tack för en bra sida.
Läs den här tråden så förstår du att det är svårt...

https://www.dubbningshemsidan.se/forum/index.php?topic=14758

Citat från: Daniel Hofverberg skrivet 26 juli 2022 kl. 02:17:03Jag har haft en del kontakt med personen bakom den sidan, och man kan säga att det är en exempelsida som demonstrerar kod för hur Svenska röster och credits ska kunna förbättras. Exakt den koden kommer inte gå att använda, men tanken är att använda själva kärnan och idén för att förbättra Dubbningshemsidan - så att Svenska röster och credits på sikt ska fungera lite mer som IMDb, så att man ska kunna klicka på alla namn och då få fram alla creditlistor där den personen omnämns. Helt enkelt lite smartare lösning än den nuvarande sökfunktionen, som ju bara söker på delar av ord utan något som helst sammanhang.

Så den där sidan visar hur personens nuvarande kod fungerar, som tyvärr inte är riktigt hundraprocentig och tar med en del "skådespelare" som inte är skådespelare - eller vad sägs om den suveräna skådespelaren "(Säsong 1)"...? ;)

Datat på den där sidan är "skrapat" från Dubbningshemsidan över nätet (på samma sätt som vem som helst kan läsa källkoden på vilka sidor som helst på nätet), men har gått igenom ett Python-skript som tolkar innehållet i creditlistorna. Just det skriptet kommer nog inte kunna användas rakt av på Dubbningshemsidan, men det är ett exempel på hur man skulle kunna förbättra creditsavdelningen här - men då behövs det som sagt lite mer intelligens vid avläsningen, så att den förstår vad som är vad på creditlistorna och inte tar med sådant som definitivt inte är namn.

Men se det som en försmak på hur Svenska röster och credits (och givetvis även kommande Norske stemmer og credits) sannolikt kommer att utvecklas framöver, då sajten kommer bli lite mer likt IMDb med klickbara namn och dylikt - lite åt samma håll som recensionsavdelningen redan nu fungerar. :)

Sabelöga

Citat från: ssimon skrivet  2 augusti 2024 kl. 17:52:54Creditlistan är relativt stor och det är svårt att hitta snabbt. En bra funktion som saknas är att klicka på skådisen och sen visa personens alla dubbningar.

Lägg till en mediawiki eller liknande så utvalda medlemmar kan lägga/ändra creditlistan.

mvh och tack för en bra sida.
Det är verkligen inte bara att lägga till en MediaWiki. Däremot vore det bra med hyperlänkar från creditlistor till skådespelare och tillbaka.
Houba !

ssimon

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 18:39:22Det är verkligen inte bara att lägga till en MediaWiki. Däremot vore det bra med hyperlänkar från creditlistor till skådespelare och tillbaka.
Vad är det för fel på mediawiki? Passar stora som små projekt och fungerar bra om man är flera som jobbar samtidigt.
https://sv.wikipedia.org/wiki/Aladdin_och_r%C3%B6varnas_konung här är ett bra exempel på hur röster kan presenteras om man skulle använda en mediawiki.

Daniel Hofverberg

Citat från: ssimon skrivet  2 augusti 2024 kl. 17:52:54Creditlistan är relativt stor och det är svårt att hitta snabbt. En bra funktion som saknas är att klicka på skådisen och sen visa personens alla dubbningar.
Jag har länge tänkt att göra precis så, men det är tyvärr inte så enkelt att få till rent tekniskt. Kruxet är att alla creditlistor i dagsläget skrivs in och lagras som rena textfiler på servern, och skriptet som "serverar" textfilerna vet därför inte mer än vad som står i textfilerna.

För att få skådespelarna klickbara skulle man alltså behöva via reguljära uttryck (regexpar) tolka textfilerna, och lista ut vilka som är skådespelare av den stora textmassan - och det är inte helt enkelt att få det korrekt för alla creditlistor, då inte alla ser ut på exakt samma sätt. Det handlar alltså om att försöka få ut texten som står efter tabbstopp eller i början på en rad, fram tills eventuella parenteser eller snedstreck, och så vidare; för att sen per automatik lägga till A HREF-länkar när sådana namn dyker upp...

Dessutom måste man utöver det också handskas med problemet med skådespelare som har crediterats under mer än ett namn, och som rimligtvis bör räknas som samma skådespelare när man klickar på namnen - exempelvis är ju Anton Olofsson, Anton Olofsson Raeder, Anton Olofson Raeder och Anton Raeder samma person, trots att alla fyra namnen har förekommit i creditlistor... Sen har det ju också vid flertalet tillfällen hänt att skådespelare gift sig och bytt efternamn (eller lagt till efternamn), som också måste hanteras på något sätt för att det inte ska räknas som olika personer.

Eftersom det finns 1779 svenska creditlistor och 367 norska creditlistor i dagsläget är det helt orealistiskt att börja manuellt flytta över creditlistorna till ett mer robust format, och dessutom är textfiler praktiska för mig för att det ska gå snabbt och enkelt att skriva in creditlistor. För recensionsavdelningen har jag en mer robust och hållbar lösning, för att lagra varje namn för sig, men det har nackdelen att när en recension är färdig tar det mig 15 - 20 minuter att lägga in recensionen och lägga in varje skådespelare som ska stå med i rollistan. Det fungerar hjälpligt för recensioner, då jag ju sällan recenserar mer än 1 - 2 filmer i veckan, men skulle ta alldeles för lång tid för creditlistor; inte minst för att flytta över alla befintliga creditlistor...

Citat från: ssimon skrivet  2 augusti 2024 kl. 17:52:54Lägg till en mediawiki eller liknande så utvalda medlemmar kan lägga/ändra creditlistan.
Att lägga till en Mediawiki är inte direkt så bara, och än mindre att manuellt flytta över alla befintliga creditlistor - det skulle handla om minst 500 timmars arbete, så det skulle ta flera års tid...

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 18:39:22Det är verkligen inte bara att lägga till en MediaWiki. Däremot vore det bra med hyperlänkar från creditlistor till skådespelare och tillbaka.
Precis, och det är min ambition att få till när jag hittat en hållbar lösning rent programmatiskt.

Citat från: ssimon skrivet  2 augusti 2024 kl. 19:15:34Vad är det för fel på mediawiki? Passar stora som små projekt och fungerar bra om man är flera som jobbar samtidigt.
https://sv.wikipedia.org/wiki/Aladdin_och_r%C3%B6varnas_konung här är ett bra exempel på hur röster kan presenteras om man skulle använda en mediawiki.
Om man hade använt Mediawiki från första början hade det kanske varit en möjlig lösning, men jag gissar att du inte känner för att lägga ned några hundra timmars arbete för att manuellt skriva in alla dryga 2000 befintliga creditlistor...?

Och tyvärr har jag ingen tidsmaskin, för att kunna resa tillbaka till 1997 och övertala mig själv att hitta en annan lösning för creditlistor redan från start... ;)

ssimon

Citat från: Daniel Hofverberg skrivet  2 augusti 2024 kl. 19:32:36Jag har länge tänkt att göra precis så, men det är tyvärr inte så enkelt att få till rent tekniskt. Kruxet är att alla creditlistor i dagsläget skrivs in och lagras som rena textfiler på servern, och skriptet som "serverar" textfilerna vet därför inte mer än vad som står i textfilerna.

För att få skådespelarna klickbara skulle man alltså behöva via reguljära uttryck (regexpar) tolka textfilerna, och lista ut vilka som är skådespelare av den stora textmassan - och det är inte helt enkelt att få det korrekt för alla creditlistor, då inte alla ser ut på exakt samma sätt. Det handlar alltså om att försöka få ut texten som står efter tabbstopp eller i början på en rad, fram tills eventuella parenteser eller snedstreck, och så vidare; för att sen per automatik lägga till A HREF-länkar när sådana namn dyker upp...

Dessutom måste man utöver det också handskas med problemet med skådespelare som har crediterats under mer än ett namn, och som rimligtvis bör räknas som samma skådespelare när man klickar på namnen - exempelvis är ju Anton Olofsson, Anton Olofsson Raeder, Anton Olofson Raeder och Anton Raeder samma person, trots att alla fyra namnen har förekommit i creditlistor... Sen har det ju också vid flertalet tillfällen hänt att skådespelare gift sig och bytt efternamn (eller lagt till efternamn), som också måste hanteras på något sätt för att det inte ska räknas som olika personer.

Eftersom det finns 1779 svenska creditlistor och 367 norska creditlistor i dagsläget är det helt orealistiskt att börja manuellt flytta över creditlistorna till ett mer robust format, och dessutom är textfiler praktiska för mig för att det ska gå snabbt och enkelt att skriva in creditlistor. För recensionsavdelningen har jag en mer robust och hållbar lösning, för att lagra varje namn för sig, men det har nackdelen att när en recension är färdig tar det mig 15 - 20 minuter att lägga in recensionen och lägga in varje skådespelare som ska stå med i rollistan. Det fungerar hjälpligt för recensioner, då jag ju sällan recenserar mer än 1 - 2 filmer i veckan, men skulle ta alldeles för lång tid för creditlistor; inte minst för att flytta över alla befintliga creditlistor...
Att lägga till en Mediawiki är inte direkt så bara, och än mindre att manuellt flytta över alla befintliga creditlistor - det skulle handla om minst 500 timmars arbete, så det skulle ta flera års tid...
Precis, och det är min ambition att få till när jag hittat en hållbar lösning rent programmatiskt.
Om man hade använt Mediawiki från första början hade det kanske varit en möjlig lösning, men jag gissar att du inte känner för att lägga ned några hundra timmars arbete för att manuellt skriva in alla dryga 2000 befintliga creditlistor...?

Och tyvärr har jag ingen tidsmaskin, för att kunna resa tillbaka till 1997 och övertala mig själv att hitta en annan lösning för creditlistor redan från start... ;)
Jag har semester och försöker få till ett par projekt. Får jag skrapa din sida eller tillgång till textfilerna kan jag försöka konvertera den till mediawiki, wordpress, sql, csv eller annat format om du vill det.

Sabelöga

Citat från: Daniel Hofverberg skrivet  2 augusti 2024 kl. 19:32:36Jag har länge tänkt att göra precis så, men det är tyvärr inte så enkelt att få till rent tekniskt. Kruxet är att alla creditlistor i dagsläget skrivs in och lagras som rena textfiler på servern, och skriptet som "serverar" textfilerna vet därför inte mer än vad som står i textfilerna.

För att få skådespelarna klickbara skulle man alltså behöva via reguljära uttryck (regexpar) tolka textfilerna, och lista ut vilka som är skådespelare av den stora textmassan - och det är inte helt enkelt att få det korrekt för alla creditlistor, då inte alla ser ut på exakt samma sätt. Det handlar alltså om att försöka få ut texten som står efter tabbstopp eller i början på en rad, fram tills eventuella parenteser eller snedstreck, och så vidare; för att sen per automatik lägga till A HREF-länkar när sådana namn dyker upp...

Dessutom måste man utöver det också handskas med problemet med skådespelare som har crediterats under mer än ett namn, och som rimligtvis bör räknas som samma skådespelare när man klickar på namnen - exempelvis är ju Anton Olofsson, Anton Olofsson Raeder, Anton Olofson Raeder och Anton Raeder samma person, trots att alla fyra namnen har förekommit i creditlistor... Sen har det ju också vid flertalet tillfällen hänt att skådespelare gift sig och bytt efternamn (eller lagt till efternamn), som också måste hanteras på något sätt för att det inte ska räknas som olika personer.
Finns det inte redan en webbplats som gjort just detta? Alltså kopierat Dubbningshemsidan, men att dom stötte på det du nämner: att samma person kan ha stavat sitt namn olika eller två personer som delar namn osv.
Houba !

Sabelöga

Citat från: ssimon skrivet  2 augusti 2024 kl. 19:15:34Vad är det för fel på mediawiki? Passar stora som små projekt och fungerar bra om man är flera som jobbar samtidigt.
https://sv.wikipedia.org/wiki/Aladdin_och_r%C3%B6varnas_konung här är ett bra exempel på hur röster kan presenteras om man skulle använda en mediawiki.
Det är verkligen inget fel med MediaWiki, det är omställningen till MediaWiki som inte är så bara.
Houba !

ssimon

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 20:28:06Finns det inte redan en webbplats som gjort just detta? Alltså kopierat Dubbningshemsidan, men att dom stötte på det du nämner: att samma person kan ha stavat sitt namn olika eller två personer som delar namn osv.
Många som skrapat sidan skulle jag tro.

Flera fall av dubbletter kommer finnas och ett manuellt beslut behöver tas för varje fall.

PatoskyeIII

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 20:28:06Finns det inte redan en webbplats som gjort just detta? Alltså kopierat Dubbningshemsidan, men att dom stötte på det du nämner: att samma person kan ha stavat sitt namn olika eller två personer som delar namn osv.
Den finns men den är långt ifrån optimal.

https://dubbning.kodare.com/

ssimon

Ett förslag på layout som visar en lösning på problemet med olika namn på samma person. "name_full" kanske gör sig bättre som "name_real".

Screenshot from 2024-08-02 21-19-22.png
Gjorde en copy/paste in med alla titlar direkt från sidan för att visa hur det kan se ut i databasen.

Screenshot from 2024-08-02 21-26-44.png

Daniel Hofverberg

#11
Citat från: ssimon skrivet  2 augusti 2024 kl. 19:42:16Jag har semester och försöker få till ett par projekt. Får jag skrapa din sida eller tillgång till textfilerna kan jag försöka konvertera den till mediawiki, wordpress, sql, csv eller annat format om du vill det.
Du är mer än välkommen att skrapa sidan, och se om du lyckas att få fram alla namn som nämns. För att inte behöva ta bort sidhuvud och sidfot (menyer och dylikt) kan du använda ett knep, för att få fram den rena textfilen. Om URLn ifråga exempelvis är:
https://www.dubbningshemsidan.se/credits/100-saker/

Då innebär det att textfilen som faktiskt visas finns på denna adress:
https://www.dubbningshemsidan.se/svenska/100-saker.txt

Med andra ord, lägg till .txt i slutet, och så finns alla svenska creditlistor i mappen /svenska/. För norska creditlistor, byt ut /svenska mot /norsk. Det som faktiskt körs på sidan är alltså bara ett PHP-skript som läser in textfilen och matar ut den på skärmen tillsammans med huvud och fot.

Det jag faktiskt behöver är mer kodstycket/funktionen för att få fram namnen, mer än bara en export av namnen - jag behöver ju kunna köra samma kod på min server, för annars blir ju listan inaktuell så fort nya creditlistor tillkommer.

Helst vill jag ha kod i PHP, då nästan allt på Dubbningshemsidan är i PHP (allt utom gästboken, för att vara exakt) och det också är det språk jag behärskar bäst, men om det kniper går det bra med andra programmeringsspråk som går att köra på en Linux-server och som kan jobba mot MySQL. En separat funktion för att få fram alla namn vore bäst, så blir det lättare att integrera med mina skript.

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 20:29:01Det är verkligen inget fel med MediaWiki, det är omställningen till MediaWiki som inte är så bara.
Ja, precis. Jag tror mer på en vidareutveckling av mina skript (för att läsa av namn och lägga till A HREF-taggar vid behov vid utmatning) än att övergå till Mediawiki, då jag inte tycker det känns realistiskt att lyckas att migrera alla befintliga creditlistor till Mediawiki och få allt att se ut ungefär som i dagsläget och få med all text rätt. Att få ut själva namnen känns tillräckligt svårt, men att på det dessutom föra över all text och tabeller i alla 2100 creditlistor konverterat till Mediawiki-format så att det ser bra ut utan en massa manuellt arbete känns oöverstigligt i mina ögon...

Dessutom föredrar jag att kunna skriva in nya creditlistor som textfiler direkt i Anteckningar, då jag vill kunna förbereda creditlistor offline utan att hela tiden jobba mot servern.

Citat från: Sabelöga skrivet  2 augusti 2024 kl. 20:28:06Finns det inte redan en webbplats som gjort just detta? Alltså kopierat Dubbningshemsidan, men att dom stötte på det du nämner: att samma person kan ha stavat sitt namn olika eller två personer som delar namn osv.
Citat från: PatoskyeIII skrivet  2 augusti 2024 kl. 20:40:43Den finns men den är långt ifrån optimal.

https://dubbning.kodare.com/
Ja, sidan https://dubbning.kodare.com/ är skrapad från Dubbningshemsidan och sedan försökt att tolka ut all data via ett Python-skript. Jag har fått deras kod, men då jag inte är så bra på Python har jag inte lyckats vidareutveckla det till något som faktiskt är fullt användbart.

Den där sidan är som sagt långt ifrån hundraprocentig, då den visar en del skådespelare vid namn "(Säsong 1)" och liknande. Dessutom letar den efter den exakta texten "Svenska röster:", vilket innebär att den inte hittar åt något om det inte står exakt så på sidan. Exempelvis finns det en del creditlistor där det står "Berättare:" istället för "Svenska röster:" (dubbningar som bara har en berättarröst och ingen dialog av synliga rollfigurer).

Citat från: ssimon skrivet  2 augusti 2024 kl. 21:24:43Ett förslag på layout som visar en lösning på problemet med olika namn på samma person. "name_full" kanske gör sig bättre som "name_real".
Ja, med lite manuellt arbete går det absolut att lösa problemet med olika namn på samma person. Men det kommer ta lite tid, för att hitta åt alla sådana eventualiteter och lägga in dessa manuellt.

Ett problem som dock känns i det närmaste helt olösligt är den besvärliga situationen när det finns flera olika skådespelare med exakt samma namn - ingen algoritm i världen kan ju avgöra vem som åsyftas utifrån en textmassa om flera personer har samma namn... Det är dessbättre väldigt sällsynt, men det förekommer.

Exempelvis kan "Jessica Andersson" syfta både på den kända artisten Jessica Andersson (född 1973) och den mindre kända skådespelaren Jessica Andersson (född 1988). Den sistnämnda har varit med i ganska många dubbningar, och den förstnämnda mig veterligen endast i Bambi 2. Sen misstänker vi ju även att "Robin Carlsson" syftar på olika personer i olika sammanhang, då namnet ibland mest troligt syftar på artisten med artistnamnet Robyn och ibland verkar syfta på en manlig barnskådespelare med samma namn (den Robin Carlsson som medverkar i TV-serien Aladdin låter exempelvis definitivt inte som en tonårstjej, som Robyn var när dubbningen gjordes).

Sabelöga

Houba !

DingoPictures2005

Citat från: Daniel Hofverberg skrivet  3 augusti 2024 kl. 01:24:26Exempelvis kan "Jessica Andersson" syfta både på den kända artisten Jessica Andersson (född 1973) och den mindre kända skådespelaren Jessica Andersson (född 1988). Den sistnämnda har varit med i ganska många dubbningar, och den förstnämnda mig veterligen endast i Bambi 2. Sen misstänker vi ju även att "Robin Carlsson" syftar på olika personer i olika sammanhang, då namnet ibland mest troligt syftar på artisten med artistnamnet Robyn och ibland verkar syfta på en manlig barnskådespelare med samma namn (den Robin Carlsson som medverkar i TV-serien Aladdin låter exempelvis definitivt inte som en tonårstjej, som Robyn var när dubbningen gjordes).
Du sa dock att du tror det är Robyn som är pratröst till Ann-Marie......
Vilket inte är särskilt logiskt då Robyn sjöng introt till Sportspegeln vid den tiden och röstbytet i just Änglahund är så tydligt att det är som att få ett isblock slängt i huvudet att bara höra skiten.
Vilket är varför det är helt ologiskt att Per-Arne Ehlin tyckte det var en bra idé om nu inte personen som var pratrösten var hemsk på att sjunga.

ssimon

För nöjes skull skrapade jag en del av sidan med firefox.

Kanske hittade ett par buggar till Daniel:
* Olika tecken-kodning på credits-sidorna. Kan vara firefox som ställde till det. Tror du är ute efter utf-8 eller latin1.
* I ett par filer har <pre> mellanslag istället för tabs.
* Ibland börjar <pre> innehåll med blank rad och ibland med titel.

Verifierar just nu innehållet med imdb och andra källor för att se vad som matchar.