Archief is live!

In ruil voor de aangekondigde downtime van enkele dagen geleden staat nu de laatste grote update voor eventjes live. En wat voor eentje: Telenet wilde net zoals wij het 9lives-archief niet verloren zien gaan, en heeft het ons geschonken. Dat heeft de crew (oa @Tyfius en @moonstorm) quasi seamless geïntegreerd naast het huidige forum zonder dat dit de huidige database ook maar enigszins belast. Het is volledig gescheiden van het huidige forum. Je vindt het onder Forums - Archief.

Bij dat archief hoorden wel enkele regels. Onder andere dat het allemaal geanonimiseerd moest worden, en GDPR-proof moest blijven. En dat is gelukt. Alle persoonlijk identificeerbare informatie is weg, geen e-mailadressen, wachtwoorden, IP adressen, namen, geboortedatum, PM's, hobby's en interesses... Het archief is een read-only bibliotheek geworden, niet meer dan tekstvelden met een fancy layout.

Dat houdt ook in dat het archief voorlopig niet doorzoekbaar is. Als we dat wel hadden gedaan via de interne forumsearch, zaten we meteen met één van de hoofdredenen waarom het oude forum zo traag (en vooral duur!) was. Een search in miljoenen posts was niet bepaald efficiënt, en zelfs zo softwareverkrachterlijk dat we geen support kregen. Dan zouden onze hostingkosten net als bij 9lives ook maal 100 gegaan zijn. Letterlijk.

Zodra Google het archief geïndexeerd heeft, kunnen we ook een mooie Google Search implementeren. Maar daarvoor moeten we even geduld hebben. Een paar dagen geleden hebben we Google gepord en een paar honderdduizend links gepusht om te laten indexeren. Dat zal nog een paar dagen tot weken duren, maar zodra dat in orde is, kunnen we ook een mooie Google Search implementeren.

Doorheen het archief hoppen gaat al wel, zeker als je weet wat je moet zoeken:

unknown.png
 
Zoals hierboven staat beschreven, werden de profielen met alle persoonsgegevens door Telenet verwijderd om te voldoen aan de bepalingen van de GDPR. De forumstructuur, threads en posts werden in een (louter raadpleegbaar) historisch archief geplaatst. Men zou zich de vraag kunnen stellen in welke mate, de mogelijk overgebleven persoonsgegevens, nog worden "verwerkt". Wat in ieder geval wel vast staat, is dat de GDPR een uitzondering voorziet voor archivering in het algemeen belang, wetenschappelijk of historisch onderzoek of statistische doeleinden. Dit neemt echter niet weg dat ik steeds bereid ben de aanvraag (via [email protected]) van iemand die kan bewijzen dat het om zijn of haar persoonsgegevens gaat, te onderzoeken.
 
Top! Dikke merci!

Ik wacht hier al een aantal weken op, omdat ik iets moet opzoeken in werk en studie. Natuurlijk heel moeilijk zonder zoekfunctie. Komop Google.
 
Top! Dikke merci!

Ik wacht hier al een aantal weken op, omdat ik iets moet opzoeken in werk en studie. Natuurlijk heel moeilijk zonder zoekfunctie. Komop Google.
Met een beetje handigheid is één en ander nog wel terug te vinden. Bijvoorbeeld door te zoeken op een specifieke zin of woordcombinatie die je je nog herinnert, en dan site:www.9lives.be/forum toe te voegen in Google. Soms komt er dan een cached versie tevoorschijn (door op het pijltje naar onder naast het zoekresultaat te klikken), en als je minder geluk hebt door naar de datum van de post en de thread te kijken. En dan kun je hier in het archief op zoek naar die thread met die datum.

tl;dr: Komop Google 😅
 
Met een beetje handigheid is één en ander nog wel terug te vinden. Bijvoorbeeld door te zoeken op een specifieke zin of woordcombinatie die je je nog herinnert, en dan site:www.9lives.be/forum toe te voegen in Google. Soms komt er dan een cached versie tevoorschijn (door op het pijltje naar onder naast het zoekresultaat te klikken), en als je minder geluk hebt door naar de datum van de post en de thread te kijken. En dan kun je hier in het archief op zoek naar die thread met die datum.

tl;dr: Komop Google 😅
Ik wist dat dus niet, dikke merci voor de tip! :)
 
D
Zodra Google het archief geïndexeerd heeft, kunnen we ook een mooie Google Search implementeren.
Wat is de update hierover?

Ik ben een lid van 9lives sinds 2002. Mag dus mezelf onder de "oude garde" rekenen. Van sommigen(zelfs die die ex-mod waren op 9lives) zijn niet meeverhuisd naar BG. Van sommigen ben ik de nickname kwijt, dus de archief bekijken zou leuk zijn...
 
Voorlopig kan je al redelijk gericht zoeken via google door "site:www.beyondgaming.be/archive" toe te voegen aan je zoektermen.

Bekijk bijlage 3018

Voor zover we op dit moment zien is slechts 16% geïndexeerd (daarom kan je nog niet alles eenvoudig vinden). Geen idee waarom het zo traag gaat, maar Google zal dat niet aan onze neus hangen :headshake:
We bieden Search Console waarmee site-eigenaren gedetailleerd kunnen aangeven hoe Google hun site moet crawlen: ze kunnen gedetailleerde instructies opgeven voor de verwerking van pagina's op hun sites, een nieuwe crawl aanvragen of zich afmelden voor crawlen via een bestand met de naam robots.txt. Google accepteert nooit betalingen om een site vaker te crawlen. We bieden alle websites dezelfde tools om onze gebruikers van de best mogelijke resultaten te voorzien.

Bron
 
We know, zijn we al maanden dagelijks/wekelijks aan het opvolgen :)

Dagelijks worden er up-to-date sitemap.xml bestanden doorgestuurd, alsook voor het ganse archief werden er tientallen (valid) sitemaps opgemaakt/doorgestuurd (want er is een limiet op het aantal urls per sitemap lol). Google neemt gewoon zijn tijd om de in 1 keer doorgestuurde +750k items te indexeren (alles is al geruime tijd "gevonden"/"gecrawled" maar dat is nog net 1 stap te kort van "indexatie") om "de site niet te zwaar te belasten tijdens het proces"...

Al zou dat wel iets sneller mogen gaan :unsure: In het begin duurde het soms tot 4 dagen om 1 url manueel te laten herindexeren, nu kan het soms al tot een maand duren tegen dat de console terugstuurt dat er 1 taak verwerkt is 🤷‍♂️
 
Laatst bewerkt:
Terug
Bovenaan