Compliance
Webarchivering
bewijsbaar, betrouwbaar, binnen Europa
Website-archivering legt vast hoe uw organisatie online communiceerde — inclusief opmaak, content en links, zoals bezoekers die zagen.
Ideaal voor overheden en organisaties die moeten voldoen aan de Archiefwet of aan strenge compliance-eisen — met reproduceerbare WARC-archieven en EU-opslag.
- WARC (ISO 28500)Standaard voor reproduceerbare archieven.
- EU-dataOpslag binnen Europa, privacy voorop.
- TerugkijkenLive door de tijd — zoals het destijds was.
Wat website-archivering vastlegt
Een webarchief is geen back-up. Een back-up helpt u een site te herstellen; een archief legt onweerlegbaar vast hoe uw organisatie online communiceerde — inclusief opmaak, content en links, precies zoals bezoekers het zagen. Wij verzorgen die vastlegging periodiek, leveren reproduceerbare WARC-archieven en bewaren ze veilig binnen Europa.
- Periodieke runsElk uur, dagelijks, wekelijks, maandelijks of jaarlijks — afgestemd op uw beleid.
- Reproduceerbaar (WARC)ISO 28500-archieven, hetzelfde formaat dat nationale archieven en bibliotheken gebruiken.
- Twee crawlersSnelle statische crawl of Browsertrix voor JavaScript-rijke sites en SPA's.
- Bewijsbaar vastgelegdChecksums, een digitale handtekening en een RFC 3161-tijdstempel per archief.
- Opslag binnen EuropaStandaard een EU-datacenter; desgewenst koppelen we uw eigen S3-bucket.
- Terugkijken & offlineLive terugkijkportaal én offline raadplegen met de ReplayWeb-viewer.
Voor wie is dit relevant?
In Nederland zijn overheidsorganisaties verplicht om hun websites te archiveren volgens de Archiefwet. Een goed archief helpt bovendien bij Woo-verzoeken en intern toezicht: u toont aan wat er op een bepaald moment online stond. Ook in gereguleerde sectoren is transparantie vaak verankerd in wet- en regelgeving — denk aan financiële dienstverlening, zorg en onderwijs — waar de bewijsbaarheid van publicaties zwaar weegt.
Hoe het werkt — van crawl tot bewijs
Na uw akkoord richten we per website een workflow in en doorlopen we vijf stappen. Daarna herhaalt het proces zich automatisch volgens de afgesproken frequentie.
- 1 · InventarisatieWe brengen de site in kaart en schatten opslag en rekentijd in.
- 2 · CrawlenStatisch of met Browsertrix leggen we alle pagina's en assets vast.
- 3 · WARC + handtekeningWe bundelen alles in WARC, met checksums, handtekening en tijdstempel.
- 4 · Opslag in de EUHet archief gaat naar een Europees datacenter of uw eigen S3-bucket.
- 5 · Terugkijken & overdrachtU bladert door de tijd, deelt publiek of draagt over aan een e-Depot.
Twee crawlers, één archief
Niet elke site legt u op dezelfde manier vast. Voor reguliere sites volstaat een snelle, lichte statische crawl. Sites met veel JavaScript of een single-page-architectuur leggen we vast met Browsertrix, dat een echte browser aanstuurt en zo ook dynamische onderdelen meeneemt.
| Aspect | Statische crawler | Browsertrix (aanbevolen) |
|---|---|---|
| Techniek | Haalt HTML op en detecteert assets automatisch | Headless Chromium dat JavaScript volledig uitvoert |
| Snelheid & belasting | Snel en licht — circa 5 seconden per 6 pagina's | Grondiger en zwaarder; rendert elke pagina als een browser |
| Geschikt voor | Reguliere HTML-, WordPress- en Drupal-sites | JavaScript-rijke sites en single-page applicaties (SPA's) |
| Gebruikt door | Eenvoudige, stabiele sites | Bibliotheken en professionele archivarissen |
Twijfelt u? We adviseren standaard Browsertrix: het legt ook menu's, interacties en dynamische onderdelen vast die een statische crawl mist. Per website kunt u wisselen.
Social media archivering
Online communicatie stopt niet bij uw website. Ook uw aanwezigheid op social media leggen we periodiek vast — handig voor overheden en organisaties die ook hun berichten op sociale kanalen aantoonbaar moeten bewaren, bijvoorbeeld voor de Archiefwet of Woo-verzoeken.
We leggen de openbare kanalen vast — afgestemd op wat elk platform toelaat — en leveren ze in hetzelfde reproduceerbare archief, met checksums en tijdstempel.
Bewijsbaar en onweerlegbaar
Elk archief leveren we in WARC 1.1 (ISO 28500) — de internationale standaard voor webarchieven, waarin de originele bytes van elke pagina en asset bewaard blijven. Om de integriteit aantoonbaar te maken, verzegelen we elk archief:
- Formaat
- WARC 1.1 (ISO 28500), met behoud van de originele bytes en compressie
- Checksums
- SHA-256 en SHA-512 over elk WARC-bestand en de zoekdata
- Handtekening
- GPG/PGP-ondertekend manifest (manifest.json met losse handtekening)
- Tijdstempel
- RFC 3161, extern verankerd via OpenTimestamps
- Validatie
- WARC-conformiteit gecontroleerd met warcio
- Controle
- Checksums en handtekening zijn op elk moment opnieuw te verifiëren
Eén afwijkende byte en u weet het: de checksums kloppen niet meer en de handtekening valt door de mand. Zo toont u onweerlegbaar aan wat er op welk moment online stond.
Opslag binnen Europa
Privacy en digitale soevereiniteit staan voorop. Standaard bewaren we archieven in een Europees datacenter (Scaleway, EU). Wilt u meer regie? Dan koppelen we uw eigen S3-bucket — AWS, MinIO of een compatibele provider — of bewaren we naar meerdere bestemmingen tegelijk voor extra redundantie. Vervolgcrawls slaan alleen de wijzigingen incrementeel op, zodat de opslag beheersbaar blijft.
Frequentie en fijn-afstemming
Per website stelt u precies in hoe en hoe vaak we vastleggen, zodat het archief aansluit op uw archief- en retentiebeleid.
- FrequentieElk uur tot jaarlijks, of automatisch via een API-aanroep na een wijziging.
- Scope & diepteDe hele site of deelpaden, met instelbare maximale klikdiepte.
- Paden in- of uitsluitenNeem delen gericht mee of sluit ze uit met patronen.
- JavaScript-renderingSchakel rendering per workflow in voor dynamische pagina's.
- Baseline + incrementeelEerste volledige vastlegging, daarna efficiënte updates.
- API & webhooksStart crawls en ontvang signalen in uw eigen systemen.
Overdracht naar een e-Depot
Moet een archief uiteindelijk naar een e-Depot? Dat verloopt via dubbele ondertekening. Zowel u als wij tekenen het manifest; zonder uw handtekening kan er niets worden overgedragen of verwijderd. U houdt zo altijd een ingebouwd vetorecht. Ook een verwijdering — bijvoorbeeld op grond van de AVG — is een aparte, ondertekende en gelogde handeling, zodat er een onweerlegbaar spoor blijft van wat er is gebeurd. Bij overdracht leveren we de metadata MDTO-conform aan — de standaard Metagegevens voor Duurzaam Toegankelijke Overheidsinformatie van het Nationaal Archief — zodat het archief direct in een overheids-e-Depot kan worden opgenomen.
Terugkijken — live door de tijd
Naast de WARC-levering voorzien we in een terugkijkportaal dat u op uw eigen site plaatst. Bezoekers kiezen jaar, maand en dag en zien de site precies zoals die er toen uitzag — alsof ze terugreizen in de tijd. Journalisten en onderzoekers kunnen de WARC-bestanden bovendien downloaden en in hun eigen viewer openen. Bekijk een voorbeeldarchief om te zien hoe dat in de praktijk werkt.
Offline raadplegen
Archieven zijn ook zonder internetverbinding te bekijken met de ReplayWeb-viewer — handig voor audits, dossiers en situaties zonder live verbinding. U opent het WARC-bestand lokaal en navigeert door de gearchiveerde site als vanouds.
Werkwijze en aanvraag
Na uw aanvraag inventariseren we de site, schatten opslag en rekentijd in en ontvangt u een offerte. Na akkoord starten we binnen enkele dagen. Meestal is er geen CMS-toegang nodig: we crawlen de publieke site zoals een bezoeker die ziet. Achter onze dienst draait InnoARCHIVE, ons eigen platform voor webarchivering en governance.
Veelgestelde vragen
Wat is het verschil tussen webarchivering en een back-up?
Een back-up helpt u een site te herstellen. Een webarchief legt onweerlegbaar vast hoe een site er op een bepaald moment uitzag — inclusief opmaak, content en links — in het WARC-formaat, voorzien van checksums en een digitale handtekening. Het is bedoeld als bewijs en voor naleving, niet als herstelpunt.
Moet ik toegang tot mijn CMS geven?
Meestal niet. We crawlen de publieke site zoals een bezoeker die ziet. Alleen voor afgeschermde delen of zware applicaties maken we aanvullende afspraken.
Hoe vaak wordt mijn website vastgelegd?
Van elk uur tot jaarlijks, of automatisch via een API-aanroep na een wijziging. We stemmen de frequentie af op uw archief- en retentiebeleid.
Wat is WARC en waarom is het belangrijk?
WARC (ISO 28500) is de internationale standaard voor webarchieven, gebruikt door nationale bibliotheken en archieven. Het bewaart de originele bytes van elke pagina en asset, zodat het archief reproduceerbaar en toekomstvast is.
Hoe weet ik zeker dat een archief niet is gewijzigd?
Elk archief krijgt een manifest met SHA-256- en SHA-512-checksums, een GPG-handtekening en een RFC 3161-tijdstempel die extern wordt verankerd via OpenTimestamps. Eén gewijzigde byte maakt dat direct zichtbaar.
Waar worden mijn archieven opgeslagen?
Standaard in een Europees datacenter (Scaleway, EU). Desgewenst koppelen we uw eigen S3-bucket (AWS, MinIO of compatibel) of bewaren we naar meerdere bestemmingen tegelijk voor extra redundantie.
Kan ik een archief overdragen aan een e-Depot?
Ja. Overdracht en verwijdering verlopen via dubbele ondertekening: zowel u als wij tekenen het manifest. Zonder uw handtekening kan er niets worden overgedragen of verwijderd — een ingebouwd vetorecht. De metadata leveren we MDTO-conform aan, zodat het archief in een overheids-e-Depot kan worden opgenomen.
Voldoe ik hiermee aan de Archiefwet?
Overheidsorganisaties zijn verplicht hun websites te archiveren. Onze reproduceerbare WARC-archieven, tijdstempels en het terugkijkportaal helpen die plicht — en Woo-verzoeken — aantoonbaar in te vullen. We denken mee over frequentie en retentie.
Kunnen bezoekers het archief zelf inzien?
Ja, optioneel. We leveren een terugkijkportaal dat u op uw eigen site plaatst; bezoekers kiezen jaar, maand en dag. Onderzoekers en journalisten kunnen WARC-bestanden ook downloaden en offline openen met de ReplayWeb-viewer.
Zorgeloos voldoen aan archiefplicht
We denken graag mee over frequentie, retentie, opslag binnen Europa en het inrichten van uw terugkijkportaal of overdracht naar een e-Depot.