Spring til indhold

Wikipedia:Landsbybrønden/Brug archive.org

Fra Wikipedia, den frie encyklopædi

Brug archive.org

[rediger kildetekst]

Vi kender det alle: Man har brug for et link og så virker det ikke. Øv. Derfor vil jeg gerne opfordre til, at man kopiere linket og går ind på https://archive.org/web/ og indsætter linket og vælger "Save page".

På Commons er der tale om at have en bot til at gå ind og gemme alle eksterne henvisninger og botter kan også lede efter gemte versioner af links. Kunne vi få det her på Wikipedia, så er det skønt, men det kræver, at nogen kan finde ud af det og har tid til det.

Så indtil da kan man gemme links manuelt. Det er desværre lidt tungt, men jeg tænker, at når man tilføjer et link til en artikel, så kunne man gøre det til en vane også lige at gemme det. --MGA73 (diskussion) 6. mar 2020, 11:59 (CET)

I sig selv en god idé, men tror desværre det bliver lidt tungt. I forvejen har vi svært ved bare at få kilder på vores artikler. Måske Dipsacus fullonum eller Steenth ved noget om en bot, for det ville være en knaldgod idé. Tøndemageren 6. mar 2020, 14:29 (CET)
Jeg troede egentlig der kørte en sådan bot, men hvis det ikke er tilfældet bør det om muligt etableres. Forøvrigt findes der browsertilføjelser både til Firefox og Crome der gemmer på archive.org med et enkelt klik. - Nico (diskussion) 6. mar 2020, 15:01 (CET)
@MGA73, Tøndemageren og Nico: Der er en bot, som kan rette url'er til archive.org. Det er diskuteret i Wikipedia:Landsbybrønden/Automatisk bot-kildearkivering, hvor User:InternetArchiveBot tager sig af opgaven med både at tjekke links og ændre til arkivudgaven. Det er et spørgsmål om en optager sig opgaven med at kontakte brugeren bag den bot. Da det blev diskuteret sidste gang, var der opbakning til det. Dog bør vi sikre os det stadig er. --Steen Th (diskussion) 6. mar 2020, 15:16 (CET)

Jeg testede lige på enwiki. Det er ret let på en enkelt side. Men skal det gøres meget så skal vi nok have det automatiseret.

Hvordan slår man det til på dawiki? --MGA73 (diskussion) 6. mar 2020, 16:59 (CET)

Jeg har spurgt på :en:User_talk:Cyberpower678#IABot_in_da.wiki om hvordan vi kommer i gang. Når vi ved det, så kan vi nok hurtigt få tjekket om der stadig er tilslutning. --MGA73 (diskussion) 6. mar 2020, 21:48 (CET)
Det lyder som en rigtig god ide, hvis sådan en automatisk genereret arkivering kan etableres. Økonom (diskussion) 10. mar 2020, 08:15 (CET)
Så har jeg spurgt igen på en:User_talk:Cyberpower678#How_do_we_get_IABot_in_da.wiki?. Må se om det virker denne gang. --MGA73 (diskussion) 22. mar 2020, 14:32 (CET)
@Ysangkok: Tak for rettelsen af linket. Jeg havde ikke set at den var blevet arkiveret allerede. --MGA73 (diskussion) 22. mar 2020, 14:33 (CET)

Så er der kommet svar. Botten er så godt som klar! Den skal bare have et botflag! --MGA73 (diskussion) 24. mar 2020, 23:10 (CET)

Se Wikipedia:Anmodning_om_botstatus#InternetArchiveBot. --MGA73 (diskussion) 24. mar 2020, 23:24 (CET)
@Metalindustrien, Zoizit, Amjaabc, Toxophilus, EileenSanda, Tøndemageren, Nico, Steenth, Økonom og Ysangkok: Blot et ping til de stadigt aktive brugere, som har kommenteret på det foregående og dette opslag. Håber det er ok. Tænkte, at hvis I har input så er det rart at få inden botten går i gang for alvor. --MGA73 (diskussion) 24. mar 2020, 23:35 (CET)
Herligt :-) - Nico (diskussion) 24. mar 2020, 23:46 (CET)
Glimrende tiltalg. Jeg synes dog ikke, at alle URL'er skal erstattes med et arkiv-link. Derimod at lave et ekstra link til den arkiverede url'er på archive.org. Det er også indbygget i kildeskabelonen. Se f.eks., hvad jeg har gjort på Middelaldercentret. Nogle gange synes jeg archive.org kan have en lang loadetid og layoutet er lidt anderledes en "den rigtige side", så for at tilbyde flest muligheder for folk mener jeg, at vi skal have begge dele; original url og arkiv-url. Mvh. Toxophilus (diskussion) 25. mar 2020, 08:06 (CET)
Det kan være at InternetArchiveBot skal lære nogle af de danske skabeloner at kende. De relevante skabeloner bruger allerede den samme kodebase. Arkiv-link er kun relevant, når den originale link er væk. Så som udgangspunkt skal arkiv-linket ikke være der før det er nødvendig. --Steen Th (diskussion) 25. mar 2020, 08:25 (CET)
Jeg er enig i, at vi skal have de oprindelige links, hvis de er i live. Men måske man også burde have linket til en arkiveret version (altså begge links)? Jeg tænker på de tilfælde, hvor linket er i live men hvor de oprindelige informationer er overskrevet og erstattet af noget helt andet. --MGA73 (diskussion) 25. mar 2020, 11:34 (CET)

Vi er vist kørt parallelt med hinanden for det er kun få dage siden jeg oprettede en ticket til at få IAB til dawiki, siden det var det jeg kunne se man havde gjort i nowiki. Så længe den kommer og den virker så er jeg bare glad, da linkråd var en af grundene til at jeg mistede lysten til at redigere Wikipedia da alle mine gamle Children of Bodom-artikler i dag er fulde af døde links :-( --Metalindustrien A/S (tidligere Lhademmor) 25. mar 2020, 11:39 (CET)

Hey Metalindustrien A/S min gamle ven! Det er super ærgerligt med dine gamle artikler, at de nu (ligesom andre artikler) har døde links. Jeg håber at botten kan forhindre det fremadrettet og muligvis finde arkiverede versioner af de gamle link.
Jeg aner ikke om jeg gjorde det rigtige. Jeg forsøgte mig bare frem. Jeg forestiller mig, at botten laver nogle testændringer og så kontrollerer vi om det virker og ellers retter vi skabelonerne eller botten.
Jeg glæder mig i alt fald til at det kommer til at virke! --MGA73 (diskussion) 25. mar 2020, 15:27 (CET)
Jeg fandt et link til en konfiguration her https://iabot.toolforge.org/index.php?page=wikiconfig&wiki=arwiki så jeg tænker at dawiki må have linket https://iabot.toolforge.org/index.php?page=wikiconfig&wiki=dawiki så vi kan jo følge lidt med der (hvis vi har et login). --MGA73 (diskussion) 20. jun 2020, 11:27 (CEST)

Så sker der noget

[rediger kildetekst]

Jeg har lige fået besked på Wikipedia:Anmodning_om_botstatus#InternetArchiveBot om at botten er startet op. P.t. kan jeg ikke se nogle redigeringer, men jeg tænker, at den lige skal tygge sig igennem forskellige oplysninger før den begynder at gøre noget. Derudover er en del af dens arbejde jo at bede internet archive om at arkivere sider og det er jo ikke synligt her på Wikipedia.

Men I må alle gerne hjælpe med at tage godt imod botten. Der opstår sikkert nogle spørgsmål og der sker nok også lidt fejl i starten. Men botten er her for at hjælpe os så håber vi alle kan leve med det hvis der er lidt ekstra arbejde i starten. --MGA73 (diskussion) 11. sep 2020, 07:36 (CEST)

Okay der sker ikke så meget endnu. Status var deaktiveret da jeg tjekkede. Jeg bad botten om at tjekke et par sider og den lavede denne rettelse: af artiklen Danmark. Det giver en fejl "Ugyldig |url-status=live" == UrlStatus or "ok" .
Er der nogen der ved hvad problemet er? Skal vi rette skabelonen? --MGA73 (diskussion) 13. sep 2020, 10:45 (CEST)
Jeg kan se at Kategori:CS1-fejl: Ugyldig parameterværdi sættes og når man se på den engelske kategori: en:Category:CS1 errors: invalid parameter value, at det er en parameter værdi, som ikke i den tilladt sæt af værdier. Det er bot'ten som sætter den værdi. --Steen Th (diskussion) 13. sep 2020, 12:07 (CEST)
Tak Steen Th! Men der er jo så 2 muligheder 1) man får botten til ikke at sætte den værdi, eller 2) man retter skabelonen så værdien bliver tilladt. --MGA73 (diskussion) 13. sep 2020, 12:15 (CEST)
Det ligner at bot-software i det aktuelle tilfælge ikke kan sætte den rigtige. Prøv at rettet nogle andre url'er og sider. Selve de værdier, som sætte der, er nogle bestemte værdier, som er dokumentere. Men den danske dokumentation er nok ikke 100% ajour, men det er den engelske. --Steen Th (diskussion) 13. sep 2020, 18:19 (CEST)

Hvordan går det? --Santac (diskussion) 9. okt 2020, 17:28 (CEST)

@Steenth og Santac: I dag lavede botten en række redigeringer jeg anmodede om for ca. 1 måned siden. Der er et problem med syntaksen. Om det er botten der er dårlig til det eller om det er de danske skabeloner, der er opbygget atypisk ved jeg ikke. --MGA73 (diskussion) 27. okt 2020, 07:54 (CET)
@MGA73: Skabelonerne og modulerne blev frisket for et år siden af Bruger:Weblars og de bruger alle et standard-modul, som er hentet fra enwiki, som let at tilpasse via Modul:Citation/CS1/Configuration. De datoformater, som bruges, er både danske og engelske. De bliver ændret fra archivedate=23. marts 2008 til archivedate=2008-03-23. Dvs har bot-software ikke noget problem med. Så det er relativ let at håndtere. Det er stadig url-status, som status med en værdi, som ikke ser rigtig ud. --Steen Th (diskussion) 27. okt 2020, 11:05 (CET)
@Steenth: Ja det ser lidt skidt ud. Det må være en fejl i opsætningen af botten så, hvis vores skabeloner mv. er en kopi fra en.wiki. --MGA73 (diskussion) 27. okt 2020, 11:57 (CET)
Et af problemerne er vist løst nu, for jeg har tilføjet mulighed for at skrive deadurl=dead i denne redigering.--Weblars (diskussion) 27. okt 2020, 14:41 (CET)
Med hensyn til det andet problem, hvor botten indsætter |url-status=live" == UrlStatus or "ok, så har jeg prøvet at lede i kildekoden og har fundet filen CiteMap.php i mappen Core. Her er en funktion, der hedder "getDeadValues", hvor jeg kan genkende de to lighedstegn som indsættes. Måske hænger fejlen sammen med den forskel der er på vores Modul:Citation/CS1/Configuration og en:Module:Citation/CS1/Configuration. Jg vil forsøge at forstå, hvad der sker. Måske er det bare en lille ting der skal ændres i vores modul.--Weblars (diskussion) 28. okt 2020, 10:55 (CET)
@Weblars: Kodningen af et modul kan ikke direkte have indflydelse på hvordan en bot opfører sig. Det er kun selve wikiteksten som botten har at forholde sig til, og ikke hvordan den færdige HTML-side bliver vist. Jeg forstår derfor ikke meningen med ændringen i Modul:Citation/CS1. Modulets opførsel ændres ikke af at du kalder en funktion i stedet for at lave sammenligningen direkte, men selv hvis noget var ændret, ville en bot ikke se det. --Kartebolle (Dipsacus fullonum) (diskussion) 5. nov 2020, 05:51 (CET)
Jeg har netop afprøvet botten i menupunktet "Kør robot" på IABot-håndteringsgrænseflade vha min sandkasse. Modsat hvad jeg havde forventet ser det ikke ud til at min ændring i Modul:Citation/CS1 har haft nogen effekt (endnu?). Ligesom dig troede jeg ellers heller ikke umiddelbart at en bot kunne påvirkes af indholdet af vores moduler, men efter at have nærlæst koden (nævnt ovenfor) og afprøvet en modificeret version på min egen pc (vha en wamp-server), så troede jeg altså at problemet var løst. Som jeg læser koden, hentes kildekoden til netop dette modul af botten (hvis siden er blevet ændret siden sidst og derefter har været stabil i mindst 15 min). Herefter forsøger man at matche et regulært udtryk som netop er afpasset den engelske version af modulet. I det regulære udtryk er der taget højde for brug af in_array()-funktionen. Derfor ændrede jeg i modulet, og jeg havde som sagt afprøvet det regulære udtryk på min egen pc. Se evt også hvad jeg mener er årsagen til bottens problem i Moduldiskussion:Citation/CS1#Opdatering af modul.--Weblars (diskussion) 5. nov 2020, 09:16 (CET)
OK, tak for svar. De lyder meget underligt, men virkeligheden er nogle gange underlig. --Kartebolle (Dipsacus fullonum) (diskussion) 5. nov 2020, 09:42 (CET)

Fint forslag med archive.org – især for artikler, hvor myndigheder kan fordre offentligjort materiale fjernet – så jeg har prøvet funktionen idag, efter jeg havde fundet et gammel "The Nation (Thailand)"-reflink som var helt væk, men heldigvis arkiveret af den oprindelige skribent, eller kopieret fra enWiki, og med funktionen |deadurl=yes kom fint frem i referencelisten som link. Koderne, fra angiveligt enWiki – |archiveurl= |archivedate= |deadurl= – fungerer fint. Men hvis man har mange referencer i en tekst, er det ret møjsommeligt, grænsende til uoverkommeligt, manuelt at arkivere et link og vente på en arkivadresse. Vil være skønt med en robot-funktion.--Per Meistrup (diskussion) 23. nov 2020, 09:08 (CET)

Overblik og spørgsmål

[rediger kildetekst]

Jeg har stillet nogle spørgsmål til ejeren af InternetArchiveBot. Desuden har jeg prøvet at få overblik over, hvordan botten virker og styres.

  • Der findes en slags dokumentation og en FAQ på Meta-Wiki. Den styres vha. IABot-interfacet, hvor man kan logge ind med med samme brugernavn som på wikipedia. Det kræver dog at man er medlem af en særlig admin-gruppe, for at kunne konfigurere botten. Som udgangspunkt er det kun administatorer fra dawiki, der er i denne admin-gruppe, har bot-ejeren allerede svaret mig.
  • Problemer der ikke kan rapporteres gennem interfacet, kan rapporteres på bot-ejerens diskussionsside en:User talk:cyberpower678.
  • Botten har også sin egen brugerkonto på dansk wikipedia, bruger:InternetArchiveBot, hvor man kan se dens bidrag.
  • Man kan slå botten til eller fra gennem interfacet her (tjek først at der står "dawiki - Danish Wikipedia" oppe til højre ved siden af ens brugernavn). Den er slået fra i øjeblikket. Den skal vel først sættes i gang, når den ikke længere laver unoder.

Der ser i de test vi har lavet ikke ud til at blive repareret døde links vha archive.org, hvilket er hovedformålet med botten. Det regner jeg med kan konfigureres i interfacet. Kun en tredjedel af interfacet er oversat til dansk (interface hedder lige nu "håndteringsgrænseflade" selv om jeg har ændret det på TranslateWiki, men der går noget tid inden det slår igennem). I interfacemenuen "Kør robot" er det bedst at vælge "Ret en enkel side", fordi der er lang ventetid, hvis man vælger at sætte flere sider i kø.--Weblars (diskussion) 13. nov 2020, 20:47 (CET)

Jeg er ikke teknik-specialist og det kan være det har været nævnt tidligere. Min opfattelse har været at alle link, både aktive og døde, blev konverteret til internet-archive, men nu skrives der: "Der ser i de test vi har lavet ikke ud til at blive repareret døde links vha archive.org, hvilket er hovedformålet med botten." Er hovedformålet at reparere døde link eller er hovedformålet at få levende link sikret mod at blive døde? --Santac (diskussion) 23. nov 2020, 11:25 (CET)
Jeg synes det vil være bedst med begge dele. Jeg har netop fået adgang til konfigurationen og vil prøve at teste de forskellige indstillinger i min sandkasse i den næste tid.--Weblars (diskussion) 23. nov 2020, 20:39 (CET)
Super :-) Vi ser hvad der er muligt. --Santac (diskussion) 24. nov 2020, 09:54 (CET)
Status kort sagt
  • Status er at botten stadig har fejl og derfor ikke er sat i gang på dansk wiki. Men i øvrigt kører den heller ikke på andre wikier som fx engelsk wiki. Den kan dog testes på enkelte sider (fx er den afprøvet på en sandkasseside).
  • Jeg har ændret i bottens indstillinger, så den nu forsøger at finde arkiverede sider til alle links som nævnt af bruger:Santac ovenfor.
  • For interesserede er bottens konfiguration i øjeblikket synlig i en sandkasse. Den kan ellers kun ses af brugere i "admin group" eller andre brugere tildelt særlige rettigheder.
Uddybning

Status er lige nu at botten er inaktiv på alle wikier, hvilket den ifølge dens globale bidrag har været siden slutningen af oktober. Det gør ikke så meget for dansk wikipedia (hvor den i forvejen er slået fra), for den indsætter stadig forkert status for de links, der er "live" (ikke døde), se seneste test. Årsagen til at botten er inaktiv er muligvis de mange (>50) tasks, der kan ses i "Phabricator" og måske mere specifikt at den lader til at rapportere et stort antal falske positive, dvs den tror at et link er dødt selv om det faktisk virker (eksempel fra nowiki, der af samme grund har slået botten fra). Ejeren af botten lader i øvrigt ikke til at have foretaget ændringer ("commits") i bottens software på github.com siden slutningen af oktober (min kommentar til hans sidste commit).

Jeg har nu fået adgang til at konfigurere botten vha. rettigheden "configurewiki" takket være bruger:Steenth og har foretaget et par ændringer, der gør at botten nu forsøger at finde arkivsider til alle eksterne links og bruger dansk datoformat. Jeg har kopieret konfigurationen til en sandkasse så alle kan se den. Alt i "interfacet" er efterhånden oversat til dansk bortset fra de dele, der kun er synlige for brugere med særlige rettigheder. Jeg har tænkt mig at "oversætte" resten (347 af i alt 796) ved at lade dem forblive på engelsk, især for derved på en nem måde at slippe af med den orange bjælke øverst, der konstant fortæller at oversættelsen af interfacet er ufuldstændig.

Måske ville det være godt hvis botten blev testet bedre (gennem interfacet) inden den fik lov til at køre på de i øjeblikket 45 aktiverede wikier, der hver især er lidt forskellige hvad angår kildeskabelonerne (fx er dansk {{cite web}} lidt anderledes fra den engelske). Det ville også være praktisk hvis man kunne teste den på test.wikipedia.org og hvis det i højere grad blev de enkelte wikiers ansvar. Det virker som en for stor opgave for en enkelt person som det er nu. Man kan indrapportere fejl vha. interfacet, hvillet jeg har gjort med en enkelt ting, der faktisk allerede nu er blevet rettet med en "commit", en "pull request" og et "merge" på github.com, men der er vist generelt behov for mere hjælp til at løse de mange åbne "tasks".--Weblars (diskussion) 29. nov 2020, 19:36 (CET)

InternetArchiveBot virker tilsyneladende nu

[rediger kildetekst]

InternetArchiveBot, også kaldet IABot, lader til at virke nu, i hvert fald hvis man skal tro den første test, der kan ses her. I denne testartikel findes et referenceafsnit med 101 referencer, hvor botten i testen foretog ændringer i 78 af dem. I mange referencer med eksterne henvisninger tilføjede den et link til en arkivside som fx denne. Jeg har gennemgået alle disse 78 referencer i en tabel og kun fundet to (ref. nr 18 og 24), der nok bør rettes manuelt af en person efter bottes kørsel. Botten kører i øvrigt igen på de andre wikier, og der skete en opdatering af dens software midt i december som måske er grunden til den nu også lader til at virke i testen den 16/12. Hvis man kigger på tabellen nævnt ovenfor, kan man se at der endnu er ting som ikke virker optimalt, og botten bør også testes på artikler som fx USA, inden den slippes løs.--Weblars (diskussion) 21. dec 2020, 22:32 (CET)

Godt nytår! Jeg har netop sat botten i gang som en test. Dens bidrag kan allerede ses.--Weblars (diskussion) 1. jan 2021, 10:45 (CET)
Godt Nytår herfra også, fedt med bottet, der er bare et problem med at dens arbejde (ligesom Listeriagbot) vises i Seneste ændringer, selv om botter er slået fra. Er det mon noget Du kan gøre noget ved? -Nico (diskussion) 1. jan 2021, 10:55 (CET)
I dette tilfælde er det fordi den ikke har bot-flag.
- Sarrus (db) d. 1. jan 2021, 10:57 (CET)
Jeg har stoppet den igen, da den efter 15 min. havde ændret i mere end 130 artikler og oprettet et tilsvarende antal diskussionssider. Dem vil jeg kontrollere, inden den sættes i gang igen.--Weblars (diskussion) 1. jan 2021, 10:58 (CET)
Hvis ellers testen er forløbet tilfredsstillende, kunne man så ikke overveje kun at lade den køre om natten, ind til botflaget er i orden? - Nico (diskussion) 1. jan 2021, 11:02 (CET)
Jo, og det er vel også et spørgsmål om den stadig skal oprette diskussionssider. Teksten skal i hvert fald oversættes til dansk. --Weblars (diskussion) 1. jan 2021, 11:19 (CET)
Vær venlig helt at stoppe notifikationerne. Hvis det her fortsætter, vil tusindvis af diskussionssider lynhurtigt blive spammet til med standardmeddelelser, som ingen tager sig af, og ingen har brug for. Hvad der rettes af links kan ses i artiklernes historik og behøver ikke yderligere bemærkninger. --Dannebrog Spy (diskussion) 1. jan 2021, 12:51 (CET)
Nu er der ændret i de to indstillinger, der hedder "Leave talk page messages" og "Leave archiving errors on talk pages", så de begge er sat til "Nej". Jeg har kigget på nogle af bottens ændringer i bl.a. Simested Å og kan se, at bottens indsættelse af skabelonen {{Webarchive}} medfører, at der ofte kommer et punktum for meget. Hvis ingen protesterer, vil jeg fjerne punktummet i Modul:Webarchive inden næste prøvekørsel af botten. Punktummet bruges i øvrigt ikke af den tilsvarende skabelon {{Wayback}}.--Weblars (diskussion) 3. jan 2021, 14:49 (CET)
Lyder fantastisk godt, mange artikler mister værdi når kilderne dør. Jeg er enig med Dannebrog Spy i at det ikke er godt med botmeddelelser på diskussionssiderne, men fejlmeddelelser er nok vigtige, - kunne man evt sende dem til en skjult kategori? er der noget nyt om botgodkendelse (er det bruger:Kaare vi skal have fat på her?), så den kan skjules i Seneste ændringer? - Nico (diskussion) 3. jan 2021, 15:58 (CET)
@Weblars: Det vil stadig se mærkeligt ud hvor {{Webarchive}}-skabeloner er indsat i eksterne henvisninger hvis punktummet fjernes i fx teksten "Om naturplanen Arkiveret 9. januar 2012 hos Wayback Machine. på naturstyrelsens portal, med henvisninger til kort og dokumenter." (citat fra artiklen Simested Å). Jeg tror det er bedre indsætte hele teksten i parentes og begynde med lille bogstav: "Om naturplanen (arkiveret 9. januar 2012 hos Wayback Machine) på naturstyrelsens portal, med henvisninger til kort og dokumenter." --Kartebolle (Dipsacus fullonum) (diskussion) 5. jan 2021, 10:35 (CET)
Nico: Jeg har prøvet at kigge på de mulige indstillinger af botten (kan i øjeblikket ses her), men der står ikke noget om skjulte kategorier. Man kan måske tilføje lidt ekstra information til redigeringsopsummeringen med de magiske ord {linksarchived} og {linksanalayzed}, der er nævnt som nr 6 og 7 på denne meta-hjælpeside samt anden forklarende tekst, men så bliver opsummeringen måske for lang?
Kartebolle (Dipsacus fullonum): Ja, i tilfældet Simested Å ser det ikke så godt ud (især fordi de efterfølges af ordet "på"), men mange andre steder går det bedre, selv om {{Webarchive}}-skabelonerne altid bliver indsat umiddelbart efter det eksterne link. Nogle gange er det eksterne link ellers del af en større manuelt formateret reference, hvor skabelonen kommer ind før et citat, en besøgsdato eller navnet på et forlag. Meget ofte er problemet dog at to punktummer vises i træk, se fx de mange indsættelser i USA, første del og USA, anden del (USA-artiklen var for stor til det værktøj der findes i IABot-interfacet).--Weblars (diskussion) 5. jan 2021, 23:14 (CET)
Nu er alle bottens 131 redigeringer fra prøvekørslen den 1. januar kigget efter. De fleste af dem var OK og der skulle ikke gøres noget ved dem. De gange hvor jeg efterfølgende har rettet bottens redigering (23 gange), skyldes det oftest, at den som beskrevet ovenfor indsætter {{Webarchive}} midt i en ekstern henvisning, hvis den er manuelt formateret. Jeg har af den grund ofte ændret ordet "på" til et komma, fordi det ser lidt bedre ud (som her). Her er andre typer fejl fra bottens side: Silvia Federici, Silvia af Sverige, Silkevejen og Silkeborg Kommune. Jeg lagde mærke til, at Bruger:Kort til kirken ikke syntes, at der skulle være arkivlink til hjemmesiden KortTilKirken.dk. For at undgå at botten kommer tilbage og genindsætter linket, kan man indsætte skabelon:cbignore som det ses af denne diff.
IABot er i øvrigt et temmelig kompliceret stykke software. Det består af mere end 450 filer, der i alt fylder over 30 MB. Filen ændret i december var på knap 5000 programlinjer (200 kB). Der kigges fx i artiklens historik for at se, hvornår et link blev indsat, når et af flere arkivlink fra archive.org skal udvælges (det ovenfor omtalte arkivlink (nu igen fjernet) for Simested Kirke er det ældst mulige hos archive.org i forhold til indsættelsen i artiklen i sep. 2010). I IABot-interfacet er den indstillet til "Use archives closest to the access date", se min kopi.--Weblars (diskussion) 9. jan 2021, 22:49 (CET)
Er der én herinde der vil forklare mig grunden til, at InternetArchiveBoot er ved at ændre alle links til en altid opdateret hjemmeside "korttilkirken.dk" til links til Wayback Machine, links tilbage til 2015, som om hjemmesiden ikke eksisterer længere. Jeg har skrevet til Steenth om at indsætte en blokering på mine hjemmesidelinks for at hindre en ændring af links. Hvis det er en overordnet beslutning, at links SKAL ændres, er der ingen grund til at jeg fortsætter mit arbejde med kirkeopdateringer på Wikipedia. Med venlig hilsen Preben Gøssing Kort til kirken (diskussion) 20. jan 2021, 18:33 (CET)
Har fået svar fra stenth på mit spørgsmål. Havde overset, at der er to links i samme "sætning"Kort til kirken (diskussion) 20. jan 2021, 19:51 (CET)
Det er ikke særlig smart, at arkivlinket bliver indsat lige efter det originale link. Mange manuelt indsatte kildeangivelser bliver ulogiske på den måde eller direkte misvisende. For eksempel:
Her vil det være væsentligt bedre at indsætte arkivlinket efter den originale kildeangivelse. Det vil også mindske risikoen for forvekslinger mellem de originale links og arkivlinks. --Dannebrog Spy (diskussion) 21. jan 2021, 15:52 (CET)
Jeg er enig med Dannebrog Spy. Jeg tvivler på at en bot kan finde det bedste sted at indsætte {{Webarchive}}. Det var derfor jeg ovenfor foreslog at anbringe skabelontekst i en parentes – så man kan se den oprindelige sætning ved at springe parentesen over når skabelon er placeret midt i en sammenhængende tekst. --Kartebolle (Dipsacus fullonum) (diskussion) 21. jan 2021, 16:37 (CET)

[redigeringskonflikt

Nej, det synes jeg heller ikke er smart, men botten blev sat igang af programmøren harej, da den havde fået botflag. Jeg har netop stoppet botten, så vi får tid til at diskutere det. Nogen kan måske finde en løsning på problemet. Jeg har ikke kunnet, men nævnte det igen overfor bruger harej, da botflaget skulle gives. Botten har på knap 2 døgn redigeret omkring 18.000 artikler. Her er dens Brugerbidrag. Jeg har lavet en søgning, der finder de sider med aller flest indsættelser af skabelon:webarchive i de manuelt indsatte kildeangivelser (altså uden kildeskabeloner).--Weblars (diskussion) 21. jan 2021, 16:49 (CET)

Kartebolle (Dipsacus fullonum), jeg synes parentesen lyder som en god ide. Jeg har helt overset dit forslag, da du kom med det 5. januar ovenfor.--Weblars (diskussion) 21. jan 2021, 17:25 (CET)

Jeg synes nu stadig, at arkivlinket skal placeres til sidst, så det bliver ordenligt adskilt fra det originale link, og kildeangivelserne fortsat kan læses som tiltænkt. Men under alle omstændigheder skal der gøres noget ved de artikler, hvor botten allerede har indsat arkivlinks midt i manuelle kildeangivelser, før den slippes løs igen. For med den hastighed botten arbejder med, kommer problemet meget hurtigt til at berøre mange tusinde artikler. --Dannebrog Spy (diskussion) 21. jan 2021, 23:22 (CET)
Kan man bede om at botten foreløbig kun indsætter arkivlinks i kildeskabeloner og ikke i eksterne links direkte i teksten (kilder og eksterne henvisninger uden brug af skabelon)? Jeg tror at det er uproblematisk og vil være meget nyttigt. Imens kan vi snakke om hvad vi skal gøre med de andre links. Jeg vil foretrække at de flyttes til kildeskabeloner i videst muligt omfang, da linkene så netop vil være nemmere at finde og behandle af botter, lave statistik for og anden maskinel behandling. --Kartebolle (Dipsacus fullonum) (diskussion) 21. jan 2021, 23:44 (CET)
Undertegnede bruger kun kildeskabeloner, når de følger med i oversættelser. Ellers bruger jeg kun manuelle kildeangivelser, fordi det er det nemmeste og hurtigste. Jeg behøver ikke at skulle indkopiere en længere række parametre fra en anden side, sørge for at de relevante parametre udfyldes på den eneste måde kildeskabelonen er indrettet til og fjerne de overflødige parametre, der ellers bare vil stå og fylde op. Andre må da gerne bruge dem til deres egne angivelser, men for mig er det vigtigere, at der er kilder, end at de lige er angivet på en bestemt måde. Dertil kommer så de begyndere vi løbende har, for hvem både kildeangivelser og skabeloner er fremmed land. De skulle nødigt skræmmes væk med endnu flere komplicerede ting. --Dannebrog Spy (diskussion) 22. jan 2021, 00:08 (CET)

Her er Dannebrog Spys eksempler, men hvor Webarchive-skabelonen bruger parentes (Kartebolles forslag) og en forkortet tekst (mit forslag):

Det er desværre heller ikke sikkert for botten at indsætte webarcive-skabelonen til slut, hvis der findes flere eksterne links i samme reference (se eksempel i refence nr 283 i USA). Jeg har tidligere eksperimenteret med bottens indstillinger, men kunne ikke få den til kun at indsætte arkivlinks i kildeskabeloner og ikke i eksterne links direkte i teksten (som Kartebolle spørger om). Problemet findes i øvrigt også på engelsk wiki, se denne diff fra marts 2020. Hvad siger I til dette forslag?--Weblars (diskussion) 22. jan 2021, 22:25 (CET)

Hvis botten kunne nøjes med de døde links, så tror jeg, at det vil hjælpe en del. Det vil for eksempel løse Kort til kirkens problem ovenfor, hvor arkivlinks reelt blot fungerer som dubletter for fuldt aktive links. På sider med mange links vil det også gøre det nemmere at overskue og håndtere, hvis det kun er de døde links, der eventuelt skal tages hånd om. I nogle tilfælde ønskes arkivlinket måske placeret et andet sted i henvisningen, og i andre tilfælde dækker linket måske over en side, der bare er flyttet. --Dannebrog Spy (diskussion) 22. jan 2021, 22:45 (CET)
Ja, nu hvor vi ser hvor hurtig botten er og at det ser ud til, at den kan gennemgå alle dansk wikipedias artikler på under en måned, så synes jeg også det vil være bedst at den koncentrerer sig om de døde links (og først sætter arkivlinks ved de øvrige eksterne links efterhånden som de dør i årene der kommer). For øvrigt spørger en af personerne bag botten, Harej, om der er noget de kan hjælpe med, da de kan se at botten er blevet stoppet, se brugerdiskussion:Weblars#InternetArchiveBot issue.--Weblars (diskussion) 23. jan 2021, 22:31 (CET)
  •  Kommentar Først en KÆMPE ROS til dem der har arbejdet med at få det til at virke. Især Weblars!!!!
Jeg har selv været lidt inaktiv et stykke tid. For det første fordi botten ikke virkede og for det andet fordi jeg ikke kunne finde ud af konfigureringen (jeg har nu fundet ud af, at det med konfigureringen ikke er blevet bedre af, at jeg ikke har rettigheder til at se konfigureringen).
Jeg synes, at det giver god mening først at koncentrere sig om at tilføje henvisninger til døde links. Botten må selvfølgelig meget gerne bede Internet Archive om at arkivere de sider, der stadigvæk er levende, men den skal ikke indsætte et link på Wikipedia så længe siden virker.
Mht. placeringen af skabelonen, så ved jeg ikke om vi kan få en bot til at forsøge at flytte skabelonen. Man kan jo godt søge på "{{webarcive-skabelonen}}<en eller anden tekst>." og så rette det til "<en eller anden tekst>{{webarcive-skabelonen}}." men det er ikke garanteret, at det så bliver korrekt. Jeg vil dog hellere have en henvisning placeret forkert end ingen henvisning. Men andre kan sagtens have det omvendt. Jeg synes i øvrigt, at teksten i () virker ok. Den del bør vi i alt fald kunne få en bot til at ordne (altså til at sætte parentes om skabelonen hvis det ikke kan inkluderes i selve skabelonen). --MGA73 (diskussion) 25. jan 2021, 17:24 (CET)
Vedrørende brug af parentes i Webarchive-skabelonen ser jeg ingen grund til at bruge en bot til det. Hvis der er enighed om det, kan man simpelthen redigere skabelonen til at inkludere parenteser i den tekst som skabelonen laver. --Kartebolle (Dipsacus fullonum) (diskussion) 25. jan 2021, 21:23 (CET)

Indstillinger for botten

[rediger kildetekst]

Neden for vises de væsentligste indstillinger for InternetArchiveBot som de er per 24. jan. 2021. De er kopieret fra IABot-interfacet ved at vælge "Konfigurer bot" under menupunktet "Start/stop af bot m.m.":

Links to scan:

All external links on an article
  • Only links within references

Scanned links to modify:

All links
Only tagged dead links
  • All dead links

Pages to scan:

  • Scan all mainspace pages
Scan only pages containing dead link tags

Archive versions:

Use newest archives (applies to newly searched archives)
  • Use archives closest to the access date (applies to newly searched archives)

Modify existing archives:

  • Nej
Ja

Leave talk page messages:

  • Nej
Ja

Default used date formats:

@default: %e. %B %Y

Opt-out tags:

{{Cbignore}}


Scan for dead links:

Nej
  • Ja

Submit live links to the Wayback Machine:

Nej
  • Ja

Convert archives to long-form format:

Nej
  • Ja

Normalize archive URL encoding:

  • Nej
Ja

Convert plain links to cite templates:

Nej
  • Ja

Edit rate limit

20 per day

Edit summary:

Oprettede eller redigerede {linksrescued} arkivlinks ud af {linksanalyzed} analyserede links, se hjælp

For dem der ikke har adgang til dette interface (man logger ind med det samme brugernavn som her på wikipedia, men skal normalt være Administrator her for at se indstillingerne), kan alle indstillinger ses her. Udgangspunktet var indstillingerne den 24. nov. 2020. Senest er det blevet muligt at indstille bottens maksimale antal redigeringer per dag. Dette tal er sat til kun 20, så der er en chance for st kontrollere botten her i starten. Måske har andre wikipedianere, fx nogle af de oprindelige initiativtagere MGA73, Metalindustrien A/S og Santac, lyst til at tage over nu.--Weblars (diskussion) 25. jan 2021, 16:26 (CET)

Forslag om genstart og yderligere ændringer

[rediger kildetekst]

@Weblars, Dipsacus fullonum, Dannebrog Spy, Kort til kirken, Nico, Santac, Per Meistrup, Steenth, Metalindustrien, Toxophilus, Ysangkok, Økonom og Tøndemageren:

Jeg ved ikke helt hvor det er bedst at kommentere, så derfor laver jeg et nyt afsnit.

Botten er nu ændret til udelukkende at arbejde med DØDE links og der er sat et maksimum på 20 om dagen. Jeg tænker, at det er ok at genstarte botten nu.

Der har været diskussion om hvorvidt der skal bruges en parentes eller ej men det kan rettes i skabelonen i stedet for at blive rettet af InternetArchiveBot eller nogle andre botter.

Er der enighed om at genstarte botten? Er der nogle yderligere ønsker inden botten startes? --MGA73 (diskussion) 31. jan 2021, 14:52 (CET)

Fint at den kun arbejder med døde links, i så fald kan begrænsningen på 20 sikkert hurtigt fjernes (?). Jeg går ud fra, men ved det ikke, om der findes en bot der sikrer at links fra artiklerne også kommer til archive.org? - ellers ville det være en god ting hvis nogen kunne finde ud at at opsætte det også. - Nico (diskussion) 31. jan 2021, 15:51 (CET)
@Nico: hvorfor kun archive.org egentligt? Hvorfor ikke f.eks. en:archive.today? De plejede at crawle Wikipedia for links of arkivere dem, der var et tidspunkt hvor jeg fandt rigtig mange døde links arkiveret hos dem. Jeg ved archive.today plejede at være frarådet hos engelsk Wikipedia, men den politik er nu ændret. --Ysangkok (diskussion) 31. jan 2021, 19:42 (CET)
Det er helt fint at genstarte den. Jeg synes det er alle tiders, at en bot sørger for at få indsat arkiv-links på referencerne. Jeg har dog to spørgsmål (det står ganske givet i den lange diskussions ovenfor, men den er meget lang..)_: 1) hvorfor begrænse den til 20 om dagen og 2) hvorfor kun døde links. For min skyld kunne den lige så godt køre på fuld knald hele tiden, og arkivere alle de links, som den overhovedet kunne nå. Men jeg overser nok noget... Mvh. Toxophilus (diskussion) 31. jan 2021, 20:35 (CET)
Problemet ved det sidste er, at en masse aktive links vil blive efterfulgt af links til arkiverede kopier. Det er både overflødigt og forvirrende. Der kan selvfølgelig godt tages kopi på Internet Archive til senere brug, men det er ikke nødvendigt at linke til kopierne i artiklerne, for det vil bare fungere som dubletter. Hvad angår mængden pr. dag så er det vel et spørgsmål om at holde tingene på et niveau, hvor det stadig kan kontrolleres og stoppes om nødvendigt. Vi har desværre før set før set, hvordan botter er blevet sat til at lave hundreder eller tusindvis af redigeringer uden tanker for behov, fejlmuligheder og oprydning. --Dannebrog Spy (diskussion) 31. jan 2021, 21:06 (CET)
@Ysangkok: Det kan jeg ikke forholde mig til, nu er det InternetArchive der arbejdes med i botten. Jeg tror for øvrigt at MGA73 har ret i at formuleringsproblemerne kan løses på skabelonniveau. - Nico (diskussion) 31. jan 2021, 22:52 (CET)
@Nico: jeg tror også botten sørger for at gemme et link på archive.org ud fra hvad jeg kan se af indstillingerne (Submit live links to the Wayback Machine: Ja). Jeg tænker også de 20 kan ændres når botten har kørt lidt tid og alle har haft en chance for at se at botten opfører sig pænt.
@Toxophilus: enig, men jeg tror bare mange gerne vil have en chance for at se, at botten kører korrekt før grænsen hæves eller fjernes. Jeg tænker også, at man på sigt kunne lade botten arbejde med levende links. Man jeg tænker, at det kan vente indtil den har ordnet alle de døde links.
@Ysangkok: det kræver vist en anden bot at ordne det. Hvis du eller nogen anden kan finde ud af at få arkiveret relevante links, så er det meget velkomment. --MGA73 (diskussion) 1. feb 2021, 16:54 (CET)
Den rettede mere end 20 så jeg stoppede den igen, så vi kan tjekke om vi er tilfredse med redigeringerne. Se Speciel:Bidrag/InternetArchiveBot for redigeringer. --MGA73 (diskussion) 2. feb 2021, 19:21 (CET)
Jeg har nu tjekket ændringerne. Det er ikke alle links, der er lige anvendelige. Men om det er bottens skyld, eller om det er fordi web.archive.org har arkiveret en dårlig side skal jeg ikke kunne afgøre. Jeg har rettet et enkelt link manuelt. Jeg ved ikke om botten overskriver det senere, eller om den ignorer det.
Men vi skal beslutte om vi vil lade botten køre og om der skal være et maks pr. dag eller om den bare skal rette løs, så det bliver ordnet hurtigst muligt. --MGA73 (diskussion) 2. feb 2021, 19:33 (CET)
Jeg kunne se, at botten havde opdateret med archiveurl på nogen af siderne på min overvågningsliste, rigtig fint. Jeg har i en periode forsøgt at anvende archive.org manuelt sideløbende med opdateringer og tilføjelser, jf. åbningsopslaget, så en arvhiveurl er kommet med i ref-linket. Har tjekket om kilden allerede er arkiveret, og ellers har jeg arkiveret den, hvis den er ny. Desværre er WaybackMachine ofte ekstrem langsom, eller helt nede, angiveligt overbelastet i perioder, så det er desværre ofte alt er fra lange ventetider til direkte spild af skrivetid, at tilføje archiveurl, når ref-link indsættes. Jeg er støt på en enkelt, men en hos mig ofte anvendt kilde (Bangkok Post), som ikke tillader arkivering hos archive.org. Andre kilder, som nyheder fra Facebook, der kan være officielle regeringsinformation, går heller ikke an på archive.org, da den ender med at arkivere en log-in side. Vil være skønt, hvis en bot kan komme til at udføre archiveurl-funktionen generelt.--Per Meistrup (diskussion) 14. mar 2021, 06:41 (CET)

Prøvekørsel med 20 ændringer

[rediger kildetekst]

@MGA73: Jeg kan se at botten antager at skabelon:cite web har de parametre den har på den engelske wikipedia, se f.eks. [1] hvor den har brugt "url-status". Udfra dokumentationen på skabelonen ser det ikke ud til at denne parameter eksisterer. Personligt synes jeg det ville give mest mening bare at opdatere cite web, men jeg ved ikke om vi bruger skabelonen på en ikke-forudkompatibel måde. --Ysangkok (diskussion) 12. feb 2021, 07:32 (CET)

@Ysangkok: Den havde jeg overset for den gav ingen synlig fejl på siden. Jeg er enig i, at det giver mening at bruge de samme parametre som på engelsk. Jeg tænker, at de fleste artikler der bliver oversat til dansk kommer fra den engelske Wikipedia og så vil det være lettere hvis man kan kopiere cite web med over. --MGA73 (diskussion) 12. feb 2021, 08:07 (CET)
@MGA73: faktisk lader den til at virke. Hvis du sætter den til "dead" bliver den arkiverede side linket først. Så det er nok bare dokumentation som mangler. Men jeg er mere vandt til "url-status=live" i stedet for "yes", som botten har skrevet. --Ysangkok (diskussion) 12. feb 2021, 09:22 (CET)
@Ysangkok: jeg synes faktisk også at live/dead giver mere mening end fx yes/no. Hvis en.wiki og andre wikier bruger det, så vil det blive en stor opgave at overbevise alle og få det rettet. Så derfor tænker jeg pyt så længe det virker.
Tænker du botten skal have lov at køre igen eller har du nogle forslag? --MGA73 (diskussion) 13. feb 2021, 19:15 (CET)
@MGA73: det ser ud til at den bruger både "ok" og "yes". [2] Det er da forvirrende. Jeg synes det ville være bedst at vi bliver enige om hvordan url-status skal virke før den fortsætter. Jeg synes "ok/dead", "live/dead", "god/død", "online/offline" ville være fine alle sammen. Men "yes" og "ok" på samme tid, hvad skal det betyde? Jeg synes ikke "yes" giver særlig meget mening, faktisk. --Ysangkok (diskussion) 13. feb 2021, 20:24 (CET)
  • @Weblars: Jeg kan se at Modul:Citation/CS1/Configuration indeholder en lang række mulige valg og at du på et tidspunkt har ændret i nogle af dem. Ved du hvorfor der er så mange muligheder? Og hvorfor botten både bruger yes og ok? --MGA73 (diskussion) 13. feb 2021, 21:39 (CET)

@Ysangkok: Jeg har skrevet et forslag på Moduldiskussion:Citation/CS1#Opdatering_2021_pga_IABot om opdatering af konfigureringen. Ping'er lige @Weblars og Steenth: fordi de tidligere har redigeret modulet. --MGA73 (diskussion) 28. apr 2021, 18:26 (CEST)

Har stået stille siden 22. februar

[rediger kildetekst]

Det ser ud til at InternetArchiveBot har stået stille siden 22. februar (eller har den skiftet adresse?). Er der nogen der er i gang med noget, eller kan gøre noget ved det? - Nico (diskussion) 9. mar 2021, 13:19 (CET)

Den er på pause pga. ovenstående diskussion af brugen af "ok" og "yes". Jeg tror ikke lige nogen af os har svaret på hvordan man fikser det og om der er en reel forskel der kan forklares. --MGA73 (diskussion) 10. mar 2021, 16:34 (CET)

Det hører med til historien at den i prøveperioden har kørt næsten 19.000 redigeringer uden de store problemer, men den har garanteret løst en masse. - Nico (diskussion) 10. mar 2021, 17:02 (CET)

Enig! Jeg har kigget på det og kunne desværre ikke lige finde løsningen. Så hvis ingen anden lige kan klare opgaven, så skulle vi måske bare leve med "rodet". Når/hvis vi finder en genial løsning, så vil man kunne sætte en bot til at ensrette de forskellige parametre, så de bliver det, vi nu engang kommer frem til. --MGA73 (diskussion) 10. mar 2021, 18:52 (CET)

Forstår jeg det rigtigt at den har kørt 19.000 succesfulde redigeringer, men den er nu stoppet fordi den nogle gange skrive "yes" og andre gange "OK"? Som MGA73 skriver kan man køre en bot bagefter og rette til hvis nogen på et tidspunkt får den til at fungere bedre end 99,99& korrekt. Jeg synes helt klart den skal sættes i gang igen. Jeg er dog meget langt fra at være kodeekspert. --Santac (diskussion) 14. mar 2021, 07:30 (CET)

Genstartet. Jeg har netop startet botten igen. Det ser ikke ud til at vi kan få fixet problemet med "ok" og "yes" men som flere skriver, så er fordelene større end ulemperne. Hvis nogen er uenige så kan de enten stoppe den på https://iabot.toolforge.org/index.php?page=runpages&action=togglerunpage eller skaffe støtte til at stoppe den igen. --MGA73 (diskussion) 22. apr 2021, 19:31 (CEST)

  • Har lavet 3.688 redigeringer de sidste 24 timer, i alt 26.163 redigeringer :-) - Nico (diskussion) 24. apr 2021, 16:41 (CEST)
    • Jeg har godt set at den er kørt på nogle af "mine" artikler. Dejligt at se. Det giver mig meget mere lyst til at bidrage til wikipedia med tekst og kilder. --Santac (diskussion) 24. apr 2021, 17:23 (CEST)

Manuel tilføjelse af archive.org

[rediger kildetekst]

Jeg har forsøgt at gøre det til en vane, som foreslået i denne tråds indledning, manuelt at tilføje archive.org i ref-links, fx. med Webarchive|url= |date=. Jeg støder dog ofte på problemer med især danske nyhedssider, hvor der forefindes en betalingsmur. Selv om ref-artiklen er udenfor denne, vises den kun kortvarigt på webarchive.org, hvorefter der skiftes til, at den ikke er arkiveret, og at den findes på nettet (This page is available on the web!), samt henvises fx. til Click here to search for all archived pages under https://auth.medielogin.dk/connect/. Det samme gør sig gældende med nyheder delt gennem sociale medier, en del af de nyhedskilder jeg ofte anvender slås fx. op på Facebook af Den Danske Ambassade i Bangkok og regeringskontorer samt nogle journalister. Er det bedst helt at undlade brug af archive.org i sådanne tilfælde, eller bare ignorere, at archive.org skifter til en log-in? --Per Meistrup (diskussion) 19. apr 2021, 20:20 (CEST)

Jeg ved ikke lige hvad der er det rigtige i den situation. Hvis man ikke kan søge på archive.org så er et arkivlink jo ikke til nogen nytte. Men jeg mente, at man kunne gå ind på https://web.archive.org/save og bede dem om at arkivere siden. Jeg mente ikke, at man skulle indsætte Webarchive|url= |date= i artiklen her på Wikipedia. --MGA73 (diskussion) 22. apr 2021, 19:36 (CEST)
@MGA73:, tak for dit svar. Der er tilsynelandende to kodemuligheder for at indsætte archive.org i ref-links, henholdsvis under "cite news (eller web)|url= ... |archiveurl= |archivedate= |deadurl=(no/yes)" og så ovenfor nævnte "Webarchive|url=...". De opfører sig lidt forskelligt, hvor archiveurl= bruger arkivlinket som ref, mens Webarchive|url= tilføjer arkiveringen efter reference-link. Sidstnævnte synes mest logisk på eksisterende links. Eksempler fra artikler: [1] og [2]. Mange af de, især internationale nyhedskilder jeg anvender, er allerede arkiveret hos archive.org, hvor jeg så har brugt en allerede eksisterende arkivering som link. Men skal vi skribenter helst undlade at indsætte archive.org i referencer? Med venlig hilsen --Per Meistrup (diskussion) 22. apr 2021, 21:18 (CEST)
  1. ^ Miklos Bolza (26. november 2012). "Royal Copenhagen Makes Moves into Thailand". ScandAsia (engelsk). Arkiveret fra originalen 29. oktober 2020. Hentet 14. marts 2021. {{cite news}}: Ugyldig |deadurl=no (hjælp); Ukendt parameter |deadurl= ignoreret (|url-status= foreslået) (hjælp)
  2. ^ Ritzau (18. april 2021). "Bestseller vil fremlægge Myanmar-redegørelse senest 10. maj". Finans.dk. Hentet 19. april 2021. Arkiveret 19. april 2021 hos Wayback Machine
@Per Meistrup: Hvis artiklen er arkiveret i archive.org så tænker jeg, at botten på sigt vil fixe det, der skal fixes. Dvs. du behøver ikke indsætte linket selv. Men jeg har ikke 100 % styr på det. --MGA73 (diskussion) 22. apr 2021, 21:23 (CEST)
@MGA73:, mange tak for svar. Så lader jeg fremover botten klare link til archive.org og sparer lidt tid, der (sagtens) kan bruges bedre. Med venlig hilsen --Per Meistrup (diskussion) 23. apr 2021, 06:49 (CEST)

Kan man rette manuelt?

[rediger kildetekst]

Lidt i tråd med ovenstående, så spekulerer jeg over Special:Diff/10723965, hvor botten indsætter "|4=" i artiklen om Lugo. URL'en er død og den findes ikke på archive.org så den burde vel optimalt set markeres som "dødt link".

https://iabot.toolforge.org/index.php?page=manageurlsingle kan man tjekke og rette URL'er manuelt. Men den pågældende URL står allerede som død. Så jeg undrer mig lidt over, at botten ikke kan fixe henvisningen, så den kommer til at fremstå som død.

Jeg må dog også indrømme, at jeg ikke har sat mig helt ind i hvordan {{cite web}} udfyldes helt korrekt.--MGA73 (diskussion) 23. apr 2021, 08:12 (CEST)

@MGA73::En underside i Stilmanualen omtaler det tilsyneladende (jeg er bestemt ikke ekspert i skabeloner):
For de fleste referenceskabeloner, skrives arkivlokationer ind ved brug af archive-url, archive-date og dead-url-parametrene. Den primære henvisning bliver automatisk ændret til arkivet når dead-url|yes. Dette bibeholder den originale henvisningslokation for referencen.
Hvis hjemmesiden nu fører til en fuldstændig anden hjemmeside, sæt dead-url|usurped for at skrive den originale hjemmesidehenvisning i referencen.
Bemærk: Nogle arkiver opererer med en forsinkelse på ~18 måneder før et link bliver offentligt. Som resultat her skal skribenter vente ~24 måneder efter en henvisning første gang er tagget som død, før det erklæres at et web-arkiv ikke eksisterer. Døde URL'er til troværdige kilder skal normalt tagges med {{dead link|date=november 2024}}, så du kan estimere hvor lang tid henvisningen har været død
Link: Wikipedia:Kildeangivelser, der har udførlig beskrivelse af adskillige "cite ...|...". Med venlig hilsen --Per Meistrup (diskussion) 24. apr 2021, 19:27 (CEST)
@Per Meistrup: Tak for det! Jeg har oprettet en post på Wikipedia-diskussion:Kildeangivelser#archive.org, hvor jeg rejser spørgsmålet om det stadig er relevant at vente 2 år før et link erklæres som helt dødt.
For nye link kan man jo undgå at linket dør helt ved at bede archive.org om at gemme en kopi. I alt fald for mange hjemmesider. Så er der selvfølgelig sider som kræver login og andre sider som archive.org ikke kan få adgang til. --MGA73 (diskussion) 25. apr 2021, 09:21 (CEST)
[rediger kildetekst]

Jeg prøver lige med en mere sigende overskrift. Jeg har skrevet et forslag på Moduldiskussion:Citation/CS1#Opdatering_2021_pga_IABot om opdatering af konfigureringen af {{Cite web}}.

P.t betyder alle disse værdier vist at linket er dødt yes;;true;;y;;no;;ja;;nej;;sand;;dead;;død --MGA73 (diskussion) 29. apr 2021, 08:25 (CEST)

Sat på pause 30. april 2021

[rediger kildetekst]

Jeg har sat botten på pause her: https://iabot.toolforge.org/index.php?page=runpages&action=togglerunpage

Botten har nu været igennem artiklerne og er igang med anden runde. Den laver ikke særlig mange redigeringer nu anden gang. Men det er alligevel lidt interessant hvorfor den laver ændringer (igen) og ikke gjorde det første gang.

Jeg har sat botten på pause og alle er velkommen til at hjælpe med at tjekke et par redigeringer fra Speciel:Bidrag/InternetArchiveBot.

Jeg har fx bemærket Special:Diff/10754348 og det ser ud til, at der oprettes en dobbelthenvisning. Dette skyldes muligvis en forkert brug eller kombination. Men uanset hvorfor, så er det jo værd at overveje, om vi kan gøre det bedre, så vi undgår for mange "skæve" redigeringer.

Derudover har jeg startet en diskussion på Moduldiskussion:Citation/CS1#Opdatering_2021_pga_IABot om vi evt. skal ændre på parametrene, så botten bruger andre måder at markere på hvorvidt en URL er død eller levende. --MGA73 (diskussion) 30. apr 2021, 15:03 (CEST)

Jeg spekulerer også på hvornår vi skal bruge {{cite web}} som her Special:Diff/10754054 og hvornår {{Webarchive}} som her Special:Diff/10754310. --MGA73 (diskussion) 30. apr 2021, 16:45 (CEST)

Det kan jeg selv svare på nu. Botten forsøger at konvertere til fx {{cite web}}, men hvis det ikke er muligt fx fordi der står en masse tekst i ref'en, så bruger den {{Webarchive}} eller {{Dødt link}}. --MGA73 (diskussion) 17. feb. 2022, 17:24 (CET)[svar]

Status februar 2022

[rediger kildetekst]

Jf. Wikipedia:Landsbybrønden#Genstart_af_IABot_29._december_2021 er Modul:Citation/CS1 blevet opdateret og IABot er blevet genstartet.

Jeg har spurgt og fået oplyst, at botten IKKE beder archieve.org om at gemme links. Dvs. hvis linket ikke er arkiveret, så skal man selv manuelt gemme.

Der har været lidt forkerte konfigurationer i botten som nu burde være rettet. Nogle kan vi selv redigere jf. File:Konfigurer bot - IABot-interface.pdf men andre skal bot-administratorerne vist rette.

Botten har nogle gange svært ved at håndtere de forskellige varianter af kildehenvisninger vi har på dawiki. Bruger:Steenth har rettet nogle problemer og jeg har også forsøgt at rette nogle.

Jeg synes det kunne være smart på sigt at få rettet simple kildehenvisninger som "[https:..... Titel]" til {{kilde www}} da det formentlig vil reducere fejlmulighederne. Det kan dog være svært at gøre med bot fordi der er så mange varianter. Måske det er lettere med AWB? --MGA73 (diskussion) 17. feb. 2022, 17:20 (CET)[svar]

Sitet dr.dk var whitelistet og det betød at botten i mange tilfælde ignorerede dr.dk. Det er nu ændret. Oplever du at det giver ballade, så sig endelig til. --MGA73 (diskussion) 24. feb. 2022, 16:24 (CET)[svar]
Jeg har bemærket, at botten nu i stigende grad arkiverer links relateret til dr.dk. Det tænker jeg er godt. --MGA73 (diskussion) 25. feb. 2022, 22:15 (CET)[svar]

Jeg har bemærket, at botten nu har været igennem flere gange og den foretager nu færre redigeringer end tilladt i konfigurationen. Så længe der er et maks kan brugerne ikke sætte botten til at opdatere mere end én side ad gangen (jf. m:User_talk:InternetArchiveBot/Archive/2022#dawiki_questions). Jeg kunne derfor godt tænke mig at se hvordan det går uden et maks.

Jeg retter derfor "Edit rate limit:" fra "500 per day" til intet. @Steenth: til info. --MGA73 (diskussion) 11. maj 2022, 18:16 (CEST)[svar]

[rediger kildetekst]

P.t. tilføjer botten link til arkiverede sider hvis originalsiden er død. Hvis originalsiden er levende, så tilføjer botten ikke et link til arkiverede sider. Den kan desværre heller ikke bede archieve.org om at gemme en side.

Det betyder, at hvis der er en levende side, som ikke er arkiveret, så risikerer vi at miste den, hvis siden dør om fx 1 måned. Desværre er det så godt som umuligt at finde levende links som ikke er arkiveret.

En mulighed kunne være, at vi beder botten om at tilføje arkiverede links på sider hvor originalsiden er levende. Det vil nemlig synliggøre hvilke sider der ikke er arkiverede.

Mit spørgsmål er om I synes, at det er en god eller en dårlig idé? --MGA73 (diskussion) 19. feb. 2022, 09:54 (CET)[svar]

Et par kommentarer med forbehold for mine ikkeeksisterende programmeringsevner. Er det muligt at den kan tilføje arkivlinks, uden at aktivere dem før der er brug for det? Jeg synes det er støjende med link til originalen, som så er en død side, ligesom et link til en arkiveret side forvirrer når originalen eksisterer. Jeg troede egentlig der var en bot der gemte nyoprettede referencer, men hvis det ikke er tilfældet, var det så en mulighed at oprette en uafhængig bot, der evt. via https://web.archive.org/save arkiverer de sider der refereres til? Anyway er det et kæmpe fremskridt at der er adgang til så mange døde henvisninger, som teksterne er baseret på. - Nico (diskussion) 19. feb. 2022, 11:14 (CET)[svar]
Som Nico er inde på, er det noget rod at have to link i samme kildeangivelse. Et dødt link har ingen glæde af, mens et arkivlink til en levende side bare vil være en dublet. Derudover er der en del tilfælde, hvor den linkede side er flyttet, og hvor et arkivlink derfor vil være misvisende. Automatisk arkivering af de sider der linkes til vil dog bestemt være en fordel. Men det kræver nok en vis indbygget forsinkelse, så spam, reklamer og andre uvedkommende ting kan nå at blive fjernet, inden det bliver arkiveret. --Dannebrog Spy (diskussion) 19. feb. 2022, 12:47 (CET)[svar]
Enig i at det ville være smart, hvis en bot kunne arkivere links automatisk. Det overstiger dog mine evner at få det til at ske.
Døde links er selv sagt et problem men en side kan jo blive ændret men stadigvæk fremstå som levende. Dvs. selvom siden er levende så er det ikke sikkert, at den stadig er velegnet som kilde. Nogle gange vil en arkiveret version være bedre. Næppe mange tilfælde men i nogle.
Tænker det burde være muligt at skjule arkivversionen hvis "|url-status=live" hvis det ønskes. Eller måske sætte den i parentes. --MGA73 (diskussion) 19. feb. 2022, 22:31 (CET)[svar]

Jeg har fået oplyst, at archive.org på et tidspunkt besluttede at arkivere alle links der er brugt på Wikipedia. Dvs. hvis det ellers virker, så burde de fleste sider være gemt hvis muligt. Det er dog lidt svært at kontrollere om det virker. Men i alt fald kan man gemme manuelt på ovenstående link eller hvis man har mange links da via https://archive.org/services/wayback-gsheets/ --MGA73 (diskussion) 25. feb. 2022, 22:19 (CET)[svar]