Broken Link Checker - WordPress 404

Broken Link Checker voor WordPress

Op het moment van schrijven hebben alle artikel Eenmanierom.nl samen meer dan 8.000 links. Links die ik zorgvuldig heb uitgekozen. Op de websites waar ik naartoe link heb ik geen directe invloed. Regelmatig raken linkjes verbroken of komen op een andere webpagina uit. Dat is voor een websitebezoeker niet fijn. En omdat Google haar bezoekers graag doorstuurt naar een goede website, daalt je pagina in de zoekresultaten.

Google Webmaster Guidelines adviseert “Controleer uw site op verbroken links”. Het linken naar irrelevante pagina’s (bad neighborhood) kan je website zelfs onvindbaar maken (Google penalty).

De WordPress-plugin Broken Link Checker van Jānis Elsts controleert of linkjes vanaf je WordPress-blog nog werken. Je krijgt een melding in het WordPress Dashboard of via e-mail als er iets aan de hand is. Via een widget kun je de link eenvoudig zelf controleren en indien nodig bijwerken. Zonder de pagina of het bericht zelf te bewerken.

Broken Link Checker - WordPress 404
© AKS

De plugin vangt niet alles af. Zo kan een webwinkel ervoor kiezen een webpagina voor een niet-leverbaar artikel te laten staan.

Broken Link Checker voor WordPress

Broken Link Checker is een WordPress-plugin die het controleren van linkjes op je WordPress-blog automatiseert. De plugin is gratis maar als je ‘m serieus gebruikt dan doneer je de auteur met liefde via PayPal. De plugin automatiseert het handmatig controleren van duizenden linkjes en dat is natuurlijk wel wat waard.

Linkjes opsporen in pagina’s, berichten en reacties

Binnen WordPress kun je linkjes op verschillende plekken hebben:

  • Pagina’s (pages);
  • Berichten (posts);
  • Reacties (comments);
  • Links (blogroll);
  • Extra velden (custom fields).

Via de instellingen van Broken Link Checker (Instellingen > Broken Link Checker) stel je precies in welke linkjes jij gecontroleerd wilt hebben (“Zoek Naar Links In”). Je kunt ervoor kiezen om berichten (posts) alleen te controleren als ze Gepubliceerd zijn, of al in een eerder stadium zoals Gepland.

Daarnaast kun je in stellen of je alleen HTML-linkjes wilt controleren of ook “Standaard tekst URLs” en diverse videowebsites. Een standaard tekst URL is een link die je gewoon in de lopende tekst hebt opgenomen. Een bezoeker kan daar niet op klikken. Als je in WordPress zo’n link naar bijvoorbeeld Twitter of YouTube een eigen alinea geeft dan maakt WordPress er een embed van. Gebruik je WordPress op deze manier dan is het handig om deze linkjes wél te laten controleren. Zo niet, dan werkt de plugin iets sneller als je de opties uitschakelt.

In de uitsluitingslijst kun je handmatig URL’s uitsluiten. Sommige websites blokkeren (bewust danwel per ongeluk) automatische handelingen zoals Broken Link Checker uitvoert. Broken Link Checker zal de linkjes steeds als verbroken rapporteren. Je kunt ervoor kiezen om zo’n domein gewoon helemaal uit te sluiten.

Normaliter geven websites een foutmelding “404 Not Found” als link verbroken is. Sommige websites geven echter door dat de link gewoon werkt met “200 OK”. Als je linkt naar websites onder “Protocollen & APIs” dan kun je aangeven dat je die linkjes via de betreffende API wilt controleren. Je krijgt dan als bonus een meer gedetailleerde melding als er iets mis is.

Zodra je een artikel publiceert of wijzigt somt Broken Link Checker alle uitgaande links op. Voor de kenners: De plugin kan overweg met absolute-, relatieve- én protocol relatieve URL’s. Nieuwe linkjes worden snel gecontroleerd.

Vervolgens controleert Broken Link Checker iedere link periodiek – standaard iedere 72 uur. Het controleren van linkjes kost computerkracht van de server. Broken Link Checker controleert linkjes als je het WordPress Dashboard open hebt staan of door ieder uur in de achtergrond te draaien. Via de instellingen is het mogelijk een limiet te stellen aan de serverbelasting en maximale uitvoeringstijd.

Sommige webhosters weren de plugin Broken Link Checker. Naast het initieel controleren van alle links kost het controleren van een grote website met tienduizenden links servercapaciteit. Mijn webhoster Antagonist heb ik er niet over gehoord.

Meldingen van Broken Link Checker

Als er iets mis is dan krijg je daar (optioneel) een melding van in een dagelijkse e-mail. Vanuit het e-mailbericht kun je de link zelf controleren, het artikel bewerken of de lijst met verbroken links openen.

Werk je op je blog samen met andere auteurs? Dan kun je de e-mail ook direct aan de auteur van een artikel richten. Leuk detail: door in het e-mailbericht “Auto-Submitted: auto-generated” op te nemen voorkomt de auteur dat “out-of-office” auto-responders reageren.

Kom je regelmatig in WordPress en/of heb je een hekel aan e-mail? Broken Link Checker heeft een widget voor het WordPress Dashboard. Deze is instelbaar. Zo kun je ervoor kiezen de widget alleen aan een WordPress-beheerder te laten zien, of ook aan redacteuren. De widget neemt weinig ruimte in, standaard is deze alleen uitgeklapt als er daadwerkelijk verbroken links zijn gevonden. De widget linkt dan door naar de lijst met verbroken links.

Broken Link Checker - WordPress Dashboard Widget

Broken Link Checker kan de bezoeker attenderen op een verbroken link door de tekst door te halen. Doorklikken is nog wel mogelijk. Je kunt de zoekmachines vertellen de link niet meer te volgen (nofollow).

Verbroken links bekijken

Broken Link Checker deelt linkjes in op:

  • Verbroken (broken);
  • Omleidingen (redirects);
  • Overgeslagen (dismissed);
  • Alles (All).

Standaard zie je in de lijstweergave hoe lang een link al niet meer werkt en wanneer deze voor het laatst gecontroleerd is. De compacte weergave verbergt deze informatie bij de exacte foutmelding tot je eventueel doorklikt voor details.

Broken Link Checker - WordPress Verbroken Links

Via Scherminstellingen kun je extra kolommen opnemen in de lijst. Het is bij omleidingen bijvoorbeeld handig om direct te zien waar de link naar is omgeleid. De rijen zijn sorteerbaar door te klikken op de kolomkoppen.

Daarnaast kun je het aantal weergegeven links per pagina instellen.Tenslotte kun je ervoor kiezen om linkjes die langer dan x dagen verbroken zijn en HTTP-codes in kleur weer te geven (groen = goed, oranje = verbroken)

Verbroken links en omleidingen bewerken

Door de bank genomen gebeuren er drie dingen:

  1. Het is niet bekend of de link nog werkt, de server reageert te traag;
  2. Een link is verbroken;
  3. Een link verwijst door naar een andere webpagina (redirect).

Trage links kun je later even opnieuw proberen. Eventueel kun je Broken Link Checker geduldiger maken dan de standaard timeout van 30 seconden.

Verbroken links zul je eerst zelf willen zien (Extra > Verbroken Links). Misschien is het al opgelost of weet je zeker dat het goed komt. Dan kun je de link direct als “Niet verbroken” (Not broken) doorgeven aan Broken Link Checker. De plugin behandelt de link als werkend en controleert deze vanzelf weer opnieuw. Je ziet de link pas weer terug als de (http-)status verandert.

Als een link niet meer klopt en je hebt een andere of betere gevonden, dan kun je de link direct bewerken. Je hoeft dus niet eerst naar de pagina of het bericht – al kan dat ook.

Broken Link Checker houdt rekening met linkjes die je op meerdere plekken gebruikt. Als je een link aanpast of ervoor kiest de link te verbreken dan voert de plugin deze wijziging in al je pagina’s, berichten en links door.

Afhankelijk van je instellingen suggereert Broken Link Checker een alternatieve link. De plugin suggereert een link naar Internet Archive, een website die regelmatig een kopie maakt van pagina’s op het web.

Links die niet meer werken kun je “Ontkoppelen” (Unlink) of “Overslaan” (Dismiss). Als je de link ontkoppelt dan verdwijnt de hyperlink – de onderliggende tekst blijft staan. Als je de optie “Speciale formattering toepassen op verwijderde links” inschakelt, dan bewaart Broken Link Checker de URL bij de tekst. Als de bezoeker de muis boven de tekst houdt, dan verschijnt de URL in een tooltip.

Met overslaan blijft Broken Link Checker de link periodiek controleren. Afhankelijk van je instellingen zien bezoekers en zoekmachines dat de link verbroken is (rel=”sponsored”). De link verschijnt weer in je lijstje als de (http-)status verandert.

Fijn om te weten: WordPress maakt voor iedere bewerking een revisie van de pagina of het bericht dus als je iets verkeerd doet dan kun je dat terugdraaien.

Omleidingen zou ik snel oplossen. Misschien heeft een website-eigenaar een nette omleiding verzorgd. De vraag is of dat bij een volgende verhuizing ook gebeurt. Je kunt een redirect ook overslaan. Dat is bijvoorbeeld handig in geval van bitly- of affiliatelinks. Broken Link Checker waarschuwt je dan vanzelf weer als de URL of de http-statuscode verandert.

Via de Scherminstellingen kun je een kolom URL omleiden (Redirect URL) toevoegen zodat je de nieuwe URL gemakkelijk kunt kopiëren of raadplegen. Je kunt meerdere linkjes aanvinken en in het menu kiezen voor “Omleidingen repareren” (Fix redirects) om deze handeling automatisch uit te voeren.

Alle linkjes op je blog doorzoeken

Met de knop “Zoek” in het overzicht van Broken Link Checker doorzoek je de lijsten op:

  • Link tekst (wat de bezoeker leest);
  • URL;
  • HTTP code;
  • Link status (verbroken, omleidingen, overgeslagen);
  • Link type (waar gebruikt en bijvoorbeeld link of afbeelding).

Zo kun je bijvoorbeeld zoeken of je linkjes hebt gelegd met klik hier! en die verduidelijken.

Bij het zoeken naar een URL kun je een sterretje (*) gebruiken. HTTP codes kun je komma-gescheiden opsommen of als een bereik. Bijvoorbeeld “301, 303, 400-500, 501”. Zoekopdrachten kun je bewaren en later weer hergebruiken. Op een lijst met links kun je in één keer een bepaalde actie uitvoeren, zoals “Markeer als niet verbroken” als het een tijdelijke storing betreft.

Contact opnemen met de eigenaar van de website

Misschien weet je zeker dat de website weer online komt. Tijdens het schrijven van dit artikel stond https://www.nu.nl/ in het lijstje en dat komt vast vanzelf goed. Van een dergelijke website verwacht ik dat ze zelf in de gaten houden of de website beschikbaar is. En als dat niet zo is, dan regent het opmerkingen op social media.

Iets minder gangbare websites willen wel eens een tijdje uit het oog verloren raken. Dan kies ik ervoor om contact op te nemen met de eigenaar van de website. Je kunt deze vaak achterhalen door de website op te vragen in Internet Archive. En zo niet, dan kun je de eigenaar van een website achterhalen via Whois of, voor Nederlandse domeinnamen, SIDN. De eigenaar kun je vaak op naam terugvinden op Twitter of LinkedIn.

Sommige artikelen vond ik belangrijk genoeg om, indien mogelijk in overleg met de auteur, te bewaren in Evernote en vanuit daar beschikbaar te stellen. Je kunt de inhoud vaak terugvinden via Google of het Internet Archive.

Redirect jij uitgegeven linkjes?

Er zijn veel redenen waarom linkjes verbroken raken, bijvoorbeeld:

  • De webpagina is verwijderd;
  • Een website verhuist naar een ander domein;
  • Een website krijgt een flinke opfrisbeurt.

Als de eigenaar van de website het netjes regelt dan hoeft dit niet tot een verbroken link te leiden. Je kunt zelfs je website verhuizen naar een ander domein met behoud van positie in Google. Eerder beschreef ik hoe ik artikelen van een gratis Xs4all homepage verhuisde naar Eenmanierom.nl.

Als bij een opfrisbeurt van een website de inhoud beschikbaar blijft dan zou men kunnen doorverwijzen. Vaak zie je dat dat niet gebeurt. Soms is gekozen om alle oude links naar de homepage of de zoekmachine te sturen.

Als een blog of bedrijf blog stopt dan is er geen alternatief. Wel kan de website daarna overgenomen worden. Dan zie je vaak dat je terechtkomt op een pagina met advertenties. Of op termijn op een compleet andere website.

Op Eenmanierom.nl heb ik regelmatig artikelen een andere URL gegeven. Om de pagina korter te maken, naamswijzigingen van producten en diensten door te voeren of artikelen anders in te delen. Misschien hebben mensen wel een bookmark naar het artikel gelegd. Of het artikel via e-mail of social media gedeeld. Of een afdruk gemaakt om later te lezen.

Met een redirect in het bestand .htaccess zorg ik ervoor dat alle oude URL’s blijven werken. Ik heb een korte checklist die ik doorloop als ik het webadres van een artikel wijzig.

Het netjes doorlinken is voor bezoekers fijn. En voor andere websites die linken naar mijn artikelen. Maar ook voor mijzelf: linkjes naar mijn artikelen geven Google het signaal dat het relevante artikelen zijn. Dat signaal wil je niet verloren laten gaan.

Heb jij een nette 404-pagina?

Zelfs als je al je wijzigingen netjes doorvoert blijven mensen terechtkomen op pagina’s die niet bestaan. Al is het maar door een typfout. Wat gebeurt en als iemand op jouw website een niet-bestaande pagina opvraagt?

Apache 404 Not Found

Op sommige website verschijnt er alleen een foutmelding zoals hierboven afgebeeld. De bezoeker kan nergens op doorklikken. De enige manier om er iets van te maken is door de URL in de adresbalk van de webbrowser in te korten. Niet veel bezoekers zullen dat doen. Ze zullen eerder teruggaan naar de vorige website (Google?) en een volgende link aanklikken.

Op Eenmanierom.nl kan een bezoeker doorklikken naar de homepage en het menu gebruiken. Daarnaast voer ik een zoekopdracht uit op de website op basis van de URL. Als dat resultaten oplevert, dan schotel ik die voor.

Hieronder zie je een aantal voorbeelden van creatieve 404-pagina’s.

Via de rapportages van je eigen website kun je nagaan welke aanroepen naar jouw website een 404 hebben opgeleverd.

Op de hoogte blijven van Broken Link Checker

WordPress attendeert je vanzelf op nieuwe versies van Broken Link Checker. De plugin krijgt regelmatig een update.

Zoals gezegd is deze gratis plugin je donatie via PayPal dubbel en dwars waard. Naast regelmatige updates geeft de ontwikkelaar snel antwoord op vragen.

Ideeën, storingen en vragen kun je doorgeven via Support.

Amberlink is een interessante aanvulling op Broken Link Checker. De tool maakt een snapshot van pagina’s waarnaar je linkt. De snapshops kun je lokaal (op je eigen server) bewaren, of op externe locaties zoals WayBack Archive, Perma.cc of Amazon Web Services. Amberlink is er voor WordPress en Drupal.

Heb je geen WordPress? Kijk dan voor soortgelijke functionaliteit naar de tools Screaming Frog of Xenu Link Sleuth. Deze tools moet je op je werkstation installeren en regelmatig handmatig draaien.

Geef een reactie

Je reactie verschijnt pas na goedkeuring. Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *