Archief - Wat is er met google?

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

DGEN

Legacy Member
wie zoekt er nu op google.BE Oo
suggest labs is het waar je moet zijn :p

eniac

Legacy Member
dJeez zei:
Maar dat is het net, als de ontwikkelaars van de betreffende sites zich hadden gehouden aan de regels van de kunst dan was de inhoud niet integraal in de cache terechtgekomen. Je komt pas in de cache als je eerst in de index hebt gezeten. Doorgaans zet geen enkele krant een volledig artikel op zijn homepage, daar staat enkel de summiere samenvatting. Pas na doorklikken krijg je het volledige artikel te zien. Je kan mooi instellen dat je volledige artikels in een aparte (al dan niet virtuele) folder staan en dat die folder niet geïndexeerd mag worden (waardoor alles dat daar staat ook nooit in de cache terechtkomt).

Dat is inderdaad de technische uitleg. Ik had het nu niet direct daarop. Ik weet dat je je ertegen kan beveiligen, ik vraag me gewoon af of dat in de eerste plaats nodig zou moeten zijn. Qua linken vind ik het best normaal, maar niet qua kopiëren.

MilM

Legacy Member
dJeez zei:
Maar dat is het net, als de ontwikkelaars van de betreffende sites zich hadden gehouden aan de regels van de kunst dan was de inhoud niet integraal in de cache terechtgekomen. Je komt pas in de cache als je eerst in de index hebt gezeten. Doorgaans zet geen enkele krant een volledig artikel op zijn homepage, daar staat enkel de summiere samenvatting. Pas na doorklikken krijg je het volledige artikel te zien. Je kan mooi instellen dat je volledige artikels in een aparte (al dan niet virtuele) folder staan en dat die folder niet geïndexeerd mag worden (waardoor alles dat daar staat ook nooit in de cache terechtkomt).

Zoek anders eens wat artikels via Google die op site:standaard.be staan, dan zie je direct hoe het volgens de regels van de kunst werkt.
Messias. zei:
Dat is de waarheid en niets minder dan de waarheid. Een beetje foefelen met robots.txt en Googlebots laten je website met rust. Niet dat het iets garandeerd hoor, dat tekstbestandje, het is eerder een afspraak op basis van goodwill. Maar alle bekende zoekmachines houden zich er toch aan, naar ik weet.

Ik zeg niet dat het een goed idee is van de aanklagers.
Google kan zorgen voor veel clicks op een site en als ze die sites gaan bannen ...

Maar het is hun goed recht om dit te doen.
Het is niet de sites die zich MOETEN aanpassen aan zoekrobots, wel omgekeerd.
Ze kopieren volledige artikels, houden die in hun cache en kunnen die zelfs aanbieden wanneer het artikel op de orginele site niet meer bestaat of een betaald artikel geworden is.

Als een site dit niet wil, is het hun goed recht.
Ik vind het daarom geen goed idee van de aanklagers, maar het probleem zit bij google.
Zij moeten niet aan andere sites gaan opleggen hoe ze hun site moeten beheren. (tenzij ze ergens een standaard zouden ontwikkelen waar iedereen zich aan moe houden om dergerlijke problemen te vermijden)

wlibaers

Legacy Member
Het zou logischer zijn om de auteursrechten op kranten te beperken tot enkele dagen, of gewoon af te schaffen. De meeste winst die die dingen opleveren komt toch op de dag van publicatie.

Messias.

Legacy Member
MilM zei:
Maar het is hun goed recht om dit te doen.
Het is niet de sites die zich MOETEN aanpassen aan zoekrobots, wel omgekeerd.
Ze kopieren volledige artikels, houden die in hun cache en kunnen die zelfs aanbieden wanneer het artikel op de orginele site niet meer bestaat of een betaald artikel geworden is.
Och man, dat heeft niets met aanpassen te maken. Dat is gewoon common sense. Als ge een artikel op het internet publiceert wéét ge dat dat blootgesteld is aan iedereen, ook aan crawlers. Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden. Die kranten hadden gebruik kunnen maken van een bestaande conventie die Google volgt, de oplossing is dan als volgt:

Code:
User-agent: *
Disallow: /articles/

Voilà. Google, Yahoo, MSN en de hele mikmak laten uw site met rust.

MilM

Legacy Member
Messias. zei:
Och man, dat heeft niets met aanpassen te maken. Dat is gewoon common sense. Als ge een artikel op het internet publiceert wéét ge dat dat blootgesteld is aan iedereen, ook aan crawlers. Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden. Die kranten hadden gebruik kunnen maken van een bestaande conventie die Google volgt, de oplossing is dan als volgt:

Code:
User-agent: *
Disallow: /articles/

Voilà. Google, Yahoo, MSN en de hele mikmak laten uw site met rust.
Kan best zijn.
Ik zeg ook niet dat ik de actie steun.
Wel de uitspraak van het gerecht.

Daar rust een auteursrecht op. Google overtreedt dat.
Daarmee zeg ik ook niet dat een idee ala wlibaers slecht is.

Maar je kunt moeilijk zeggen dat het de fout is van de kranten zelf. Zij maken gewoon gebruik van de rechten dat ze hebben.
En ik vind het geen goed idee van hen. (omdat het een slecht imago weer geeft aan belgie denk ik)
Maar is het daarom hun fout ?
Is de uitspraak van de rechter daarom BS ?

Normaal gezien geven de eigenaars van beschermde zaken toelating.
Dus bv een systeem waar sites opgeven dat zoekrobots en dergerlijke wel alles in cache mogen opnemen zou al veiliger zijn.
Alhoewel ik niet weet of ze dan wél juridisch bescherm zouden zijn (de zoekrobots) aangezien dat mss dan officieel moet zijn en vastgelegd worden in de wet.

Messias.

Legacy Member
MilM zei:
Daar rust een auteursrecht op. Google overtreedt dat.
Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.

SilentSpring

Legacy Member
ot: 't is eigenlijk ver gekomen dat we in ne 2talig land leven maar dat da tekstje er enkel in't frans op staat.:sop:

MilM

Legacy Member
Messias. zei:
Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.
Daarop ook dat er best wettelijke afspraken gemaakt zouden worden.
Waarom zou google een uitzondering moeten zijn ?

Redelijkheid mag mss wel op zijn plaats zijn, het is niet genoeg.

Messias. zei:
Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden.
Nochtans werkt het zo bij kranten.
Een krant zou in feite alles kunnen kopieren van andere nieuwssites. Gewoon volledig letterlijk overnemen.

Over auteursrecht kun je discussieren.
Maar kranten steken daar tijd en geld in.
Dus ik vind het wel normaal dat zij willen dat het nieuws op hun site gelezen wordt en dat indien zij willen dat archief nieuws betalend wordt, ze dat ook kunnen doen.

Maar de discussie over dat auteursrecht is een heel andere discussie. Auteursrecht is er nu éénmaal.

Ik denk trouwens niet echt dat die sites (momenteel) veel last ondervinden van die cache van google. Dus over de onredelijkheid ervan kun je zeker discussieren.

EagleEye

Legacy Member
Virz zei:
manmanman toch met jullie communautaire frustraties

ze zijn blijkbaar niet verplicht van het er in 3 talen op te zetten

lees het dan niet he

dJeez

Legacy Member
eniac zei:
Qua linken vind ik het best normaal, maar niet qua kopiëren.
Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.

Ik blijf erbij : die pagina's hadden in de eerste plaats niet in de Google cache gezeten als de techneuten die de site in elkaar staken wisten waar ze mee bezig waren en zich hielden aan de regels van de kunst.

wlibaers

Legacy Member
MilM zei:
Normaal gezien geven de eigenaars van beschermde zaken toelating.
Dus bv een systeem waar sites opgeven dat zoekrobots en dergerlijke wel alles in cache mogen opnemen zou al veiliger zijn.
Alhoewel ik niet weet of ze dan wél juridisch bescherm zouden zijn (de zoekrobots) aangezien dat mss dan officieel moet zijn en vastgelegd worden in de wet.

Als men expliciet toelating geeft (en ik veronderstel dat het opzettelijk plaatsen van code die die toelating geeft wel geldig zal zijn) is er in principe geen probleem.

Het nadeel zou dan wel zijn dat iedereen die die code niet ingeeft, ook niet meer via een zoekrobot gevonden kan worden. De professionele en spamsites zullen er wel zitten, maar van de kleinere amateursites (dikwijls met oudere html editors zoals frontpage) of diegenen die weinig updates doen vallen dan weg.

Messias. zei:
Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.

Inderdaad, want volgens de gebruikelijke conventies is alles wat je schrijft beschermd materiaal. Ook deze forumpost bijvoorbeeld. Maar probeer Telenet daarover geen proces aan te doen, want de rechter zal veronderstellen dat het jouw bedoeling was dat Telenet je berichten hier zou publiceren (anders zou je ze hier niet zetten). De meeste sites maken er dus ook geen probleem van dat zoekrobots hun site indexeren en opslaan, omdat ze net de bedoeling hebben de informatie te verspreiden. Maar in principe kan elke auteur van een pagina die in hun cache zit een klacht tegen Google indienen. Er is trouwens al iets gelijkaardigs gebeurd met eigenaars van pornosites tegen Google Images.
http://news.com.com/Nude-photo+site+wins+injunction+against+Google/2100-1030_3-6041724.html


Dat de tekst op Google alleen in het Frans beschikbaar is, is waarschijnlijk doordat alleen Franstalige publicaties een klacht ingediend hadden bij een Franstalige rechtbank. Niet meteen bedoeld voor wie geen Franstalige kranten leest dus.

grey-turtle

Legacy Member
a242050 zei:
Ja, ik vind van wel. Als die iedere dag 2.000.000 EUR moeten, zijn ze na 50 dagen al 100.000.000 EUR kwijt. En met dat geld kon je heel wat anders doen.

Dan kan de Belgische regering na 400 dagen het begrotingstekort oplossen. :)

Atrox

Legacy Member
dJeez zei:
Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.

Ik blijf erbij : die pagina's hadden in de eerste plaats niet in de Google cache gezeten als de techneuten die de site in elkaar staken wisten waar ze mee bezig waren en zich hielden aan de regels van de kunst.


Mss hebben ze het met opzet gedaan? Om er wat geld uit te halen?

Ge weet nooit :unsure:

^MystiQ

Legacy Member
EagleEye zei:
manmanman toch met jullie communautaire frustraties

ze zijn blijkbaar niet verplicht van het er in 3 talen op te zetten

lees het dan niet he

Zet het dan misschien in het arabisch :ironic:

Sorry hoor, maar het merendeel van het duitse gedeelte van het land zal wel met google.de werken en het waalse gedeelte met google.fr. Het minste da ze dan kunnen doen is het in het nederlands er eens bij zetten hé, vind je ook niet ?

Dit totaal ter zijde hé :)

Messias.

Legacy Member
Math'ke zei:
Zet het dan misschien in het arabisch :ironic:

Sorry hoor, maar het merendeel van het duitse gedeelte van het land zal wel met google.de werken en het waalse gedeelte met google.fr. Het minste da ze dan kunnen doen is het in het nederlands er eens bij zetten hé, vind je ook niet ?

Dit totaal ter zijde hé :)
Maar neen! Ze bekokstoven een duivels plan om nog wat olie op het communautaire vuur te gooien. Ja, zo evil zijn ze daar wel in Mountain View, Californië. Of misschien was het de rechter, die duidelijk in z'n vonnis vermeldde dat Google onder géén beding de tekst in het nederlands mocht publiceren, "om die geagiteerde vlamingen nog wat meer tegen hun schenen te schoppen."

eniac

Legacy Member
dJeez zei:
Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.

Voor de tweede maal op rij: ik weet dat websitemakers daarvoor kunnen zorgen. Voor de tweede maal op rij zeg ik dan ook dat ik eigenlijk vind dat dat niet eens zou moeten.

Darius Craven

Legacy Member
Tijd om google te splitsen!

Google Vlaanderen en Google Wallonië :)

Zet dat maar op uwe politieke agenda...
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan