Volg de onderstaande video om te zien hoe je onze site als web-app op je startscherm installeert.
Opmerking: Deze functie is mogelijk niet beschikbaar in sommige browsers.
dJeez zei:Maar dat is het net, als de ontwikkelaars van de betreffende sites zich hadden gehouden aan de regels van de kunst dan was de inhoud niet integraal in de cache terechtgekomen. Je komt pas in de cache als je eerst in de index hebt gezeten. Doorgaans zet geen enkele krant een volledig artikel op zijn homepage, daar staat enkel de summiere samenvatting. Pas na doorklikken krijg je het volledige artikel te zien. Je kan mooi instellen dat je volledige artikels in een aparte (al dan niet virtuele) folder staan en dat die folder niet geïndexeerd mag worden (waardoor alles dat daar staat ook nooit in de cache terechtkomt).
dJeez zei:Maar dat is het net, als de ontwikkelaars van de betreffende sites zich hadden gehouden aan de regels van de kunst dan was de inhoud niet integraal in de cache terechtgekomen. Je komt pas in de cache als je eerst in de index hebt gezeten. Doorgaans zet geen enkele krant een volledig artikel op zijn homepage, daar staat enkel de summiere samenvatting. Pas na doorklikken krijg je het volledige artikel te zien. Je kan mooi instellen dat je volledige artikels in een aparte (al dan niet virtuele) folder staan en dat die folder niet geïndexeerd mag worden (waardoor alles dat daar staat ook nooit in de cache terechtkomt).
Zoek anders eens wat artikels via Google die op sitetandaard.be staan, dan zie je direct hoe het volgens de regels van de kunst werkt.
Messias. zei:Dat is de waarheid en niets minder dan de waarheid. Een beetje foefelen met robots.txt en Googlebots laten je website met rust. Niet dat het iets garandeerd hoor, dat tekstbestandje, het is eerder een afspraak op basis van goodwill. Maar alle bekende zoekmachines houden zich er toch aan, naar ik weet.
Och man, dat heeft niets met aanpassen te maken. Dat is gewoon common sense. Als ge een artikel op het internet publiceert wéét ge dat dat blootgesteld is aan iedereen, ook aan crawlers. Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden. Die kranten hadden gebruik kunnen maken van een bestaande conventie die Google volgt, de oplossing is dan als volgt:MilM zei:Maar het is hun goed recht om dit te doen.
Het is niet de sites die zich MOETEN aanpassen aan zoekrobots, wel omgekeerd.
Ze kopieren volledige artikels, houden die in hun cache en kunnen die zelfs aanbieden wanneer het artikel op de orginele site niet meer bestaat of een betaald artikel geworden is.
User-agent: *
Disallow: /articles/
Kan best zijn.Messias. zei:Och man, dat heeft niets met aanpassen te maken. Dat is gewoon common sense. Als ge een artikel op het internet publiceert wéét ge dat dat blootgesteld is aan iedereen, ook aan crawlers. Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden. Die kranten hadden gebruik kunnen maken van een bestaande conventie die Google volgt, de oplossing is dan als volgt:
Code:User-agent: * Disallow: /articles/
Voilà. Google, Yahoo, MSN en de hele mikmak laten uw site met rust.
Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.MilM zei:Daar rust een auteursrecht op. Google overtreedt dat.
Daarop ook dat er best wettelijke afspraken gemaakt zouden worden.Messias. zei:Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.
Nochtans werkt het zo bij kranten.Messias. zei:Dus met uw stelling beweert ge dat Google een heel team deskundigen dag en nacht achter pc's moet zetten om na te trekken welke site's wél en welke niet mogen opgenomen worden.
Den Freddie zei:ot: 't is eigenlijk ver gekomen dat we in ne 2talig land leven maar dat da tekstje er enkel in't frans op staat.![]()

manmanman toch met jullie communautaire frustratiesVirz zei:
Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.eniac zei:Qua linken vind ik het best normaal, maar niet qua kopiëren.
MilM zei:Normaal gezien geven de eigenaars van beschermde zaken toelating.
Dus bv een systeem waar sites opgeven dat zoekrobots en dergerlijke wel alles in cache mogen opnemen zou al veiliger zijn.
Alhoewel ik niet weet of ze dan wél juridisch bescherm zouden zijn (de zoekrobots) aangezien dat mss dan officieel moet zijn en vastgelegd worden in de wet.
Messias. zei:Dan overtreedt Google dagelijks ontelbare keren datzelfde auteursrecht door immense hoeveelheden tekst van derden te cachen en doorzoekbaar te maken.
a242050 zei:Ja, ik vind van wel. Als die iedere dag 2.000.000 EUR moeten, zijn ze na 50 dagen al 100.000.000 EUR kwijt. En met dat geld kon je heel wat anders doen.

dJeez zei:Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.
Ik blijf erbij : die pagina's hadden in de eerste plaats niet in de Google cache gezeten als de techneuten die de site in elkaar staken wisten waar ze mee bezig waren en zich hielden aan de regels van de kunst.

EagleEye zei:manmanman toch met jullie communautaire frustraties
ze zijn blijkbaar niet verplicht van het er in 3 talen op te zetten
lees het dan niet he

Maar neen! Ze bekokstoven een duivels plan om nog wat olie op het communautaire vuur te gooien. Ja, zo evil zijn ze daar wel in Mountain View, Californië. Of misschien was het de rechter, die duidelijk in z'n vonnis vermeldde dat Google onder géén beding de tekst in het nederlands mocht publiceren, "om die geagiteerde vlamingen nog wat meer tegen hun schenen te schoppen."Math'ke zei:Zet het dan misschien in het arabisch :ironic:
Sorry hoor, maar het merendeel van het duitse gedeelte van het land zal wel met google.de werken en het waalse gedeelte met google.fr. Het minste da ze dan kunnen doen is het in het nederlands er eens bij zetten hé, vind je ook niet ?
Dit totaal ter zijde hé![]()
dJeez zei:Dan zet je toch gewoon een <META NAME="ROBOTS" CONTENT="NOARCHIVE"> in je HTML pagina. Problem solved.
Da is ni grappig, da is gewoon schandalig!Garrincha zei: