Archief - url rewriting

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

dJeez

Legacy Member
sarnath zei:
Als je bijvoorbeeld in 2008 een titel hebt "audi stelt nieuwe A8 voor" en dit 3 jaar later weer hebt?
Dat zie ik op zovele sites, lijkt mij toch niet fout of ben ik mis?
Dan moet je je eerst de vraag stellen of die informatie van 3 jaar geleden nog relevant is. Indien het antwoord daarop neen is dan kan je die informatie net zogoed verwijderen/vervangen door de nieuwe. Als het antwoord ja is dan kan je de titel ook lichtjes aanpassen zodat die wel uniek is, of vb. suffixen met een getal (-1, -2, ...) om de URI uniek te maken. Persoonlijk zou ik voor een lichtjes gewijzigde versie van de titel gaan als het echt moet.

sarnath

Legacy Member
dJeez zei:
Dan moet je je eerst de vraag stellen of die informatie van 3 jaar geleden nog relevant is. Indien het antwoord daarop neen is dan kan je die informatie net zogoed verwijderen/vervangen door de nieuwe. Als het antwoord ja is dan kan je de titel ook lichtjes aanpassen zodat die wel uniek is, of vb. suffixen met een getal (-1, -2, ...) om de URI uniek te maken. Persoonlijk zou ik voor een lichtjes gewijzigde versie van de titel gaan als het echt moet.

Ik snap wat je bedoelt, ze hebben er in mijn opleiding gewoon altijd op gehamerd dat een id uniek moet zijn en dat dat meestal id's zijn in de vorm van cijfers.
Een string als unieke id is not done, maar dat zal in dit geval mss overboord gegooid moeten worden dan..

Een titel van 3 jaar oud is mss niet meer relevant in dat geval, maar stel zoals hier op het forum, is het toch perfect mogelijk met al die threads dat er een aantal threads met dezelfde titel gaan zijn.
Of reviews van wagens, zo heb je per wagen en per type op vele sites pak 20 reviews met dezelfde titel aangezien het om dezelfde wagen van hetzelfde type en merk gaat.

+ ik stel me nog altijd de vraag of het iets uitmaakt dat er nog een / / voor je url staat met een id in, heb nog nergens gelezen dat dat "slechter" is.

anyway, niemand die een antwoord weet op mjn vraag? dat vind ik op het moment nog belangrijker en ik zou echt blij zijn als dit opgelost zou zijn, der moet toch iemand weten wat de oorzaak is?

Sharpo

Legacy Member

adrianhates

Legacy Member
Sharpo zei:
Om er voor te zorgen dat o.a. Google News artikels juist opneemt, heb je een unieke identifier nodig in je url. Daarom dat vele nieuwssites die ID behouden als ze gebruik maken van url rewrites.

Ik vind nergens een duidelijk artikel omtrent wat wel/niet kan/mag, maar heb wel 'bewijs' gevonden dat het dus wel degelijk er toe doet.
Google News stopped crawling our news articles - Google News Publishers - Troubleshooting | Google Groups


I received a reply telling me that yes, we needed to get that unique
3-
digit number in there. However, shortly thereafter one of my IT folks
noticed that another newspaper's site is being crawled and indexed in
Google News that uses the same URL structure that we are. No unique 3-
or 4-digit number. So...now I'm not sure what the deal is.

een vraag voor matt cutts dus.. Al lijkt het mij heel sterk dat je daarvoor bestraft zou worden.. :(

dJeez

Legacy Member
Sharpo zei:
Ik vind nergens een duidelijk artikel omtrent wat wel/niet kan/mag, maar heb wel 'bewijs' gevonden dat het dus wel degelijk er toe doet.
Google News stopped crawling our news articles - Google News Publishers - Troubleshooting | Google Groups
De reden waarom Google niet langer indexeerde staat in die thread in de laatste post : ze waren van subdomein geswitched... Het heeft dus maw niets met een getal in de URL te maken. De URL op zich is de unieke identifier voor Google (ttz, daar een unieke hash van, maar 't komt op 't zelfde neer, de URL is de basis)...

adrianhates

Legacy Member
sarnath zei:
Ik snap wat je bedoelt, ze hebben er in mijn opleiding gewoon altijd op gehamerd dat een id uniek moet zijn en dat dat meestal id's zijn in de vorm van cijfers.
Een string als unieke id is not done, maar dat zal in dit geval mss overboord gegooid moeten worden dan..

Er is een fundamenteel verschil tussen een unique veld en een primary key.

Je kan gerust alletwee hebben.

Simpel voorbeeld:

Code:
CREATE TABLE `users` (
`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY ,
`username` VARCHAR( 16 ) NOT NULL ,
`password` VARCHAR( 32 ) NOT NULL ,
UNIQUE (
`username`
)

Waarbij de id simpelweg de primary identifier is
en de username in alle records uniek moet zijn.

sarnath zei:
+ ik stel me nog altijd de vraag of het iets uitmaakt dat er nog een / / voor je url staat met een id in, heb nog nergens gelezen dat dat "slechter" is.is?

KISS :) Google dat maar eens

edit : Blijkbaar niet zo simpel te google'e maar het betekent dus Keep It Short & Simple

sarnath zei:
anyway, niemand die een antwoord weet op mjn vraag? dat vind ik op het moment nog belangrijker en ik zou echt blij zijn als dit opgelost zou zijn, der moet toch iemand weten wat de oorzaak is?

nog steeds niet een direct antwoord, maar probeer eens volgende dingen :
* Clear je cache van je browser
* Herstart apache

sarnath

Legacy Member
adrianhates zei:
Er is een fundamenteel verschil tussen een unique veld en een primary key.

Je kan gerust alletwee hebben.

Simpel voorbeeld:

Code:
CREATE TABLE `users` (
`id` INT NOT NULL AUTO_INCREMENT PRIMARY KEY ,
`username` VARCHAR( 16 ) NOT NULL ,
`password` VARCHAR( 32 ) NOT NULL ,
UNIQUE (
`username`
)

Waarbij de id simpelweg de primary identifier is
en de username in alle records uniek moet zijn.



KISS :) Google dat maar eens

edit : Blijkbaar niet zo simpel te google'e maar het betekent dus Keep It Short & Simple



nog steeds niet een direct antwoord, maar probeer eens volgende dingen :
* Clear je cache van je browser
* Herstart apache

lol idd, had slecht gelezen, natuurlijk niet als primary key, maar als uniek veld.
K ga er zeker werk van maken de id te bannen indien mogelijk.
Nu, met nieuws zou ik dat mss nog snappen, maar met het voorbeeld wat ik aanhaalde met bijvoorbeeld reviews?
Je kan perfect 5 reviews hebben over http://www.website.com/reviews/audi-a8.html
Of gebruik je in dit soort situaties wel een id? dat is eigelijk waarom ik globaal id's gebruik.


Over mijn probleem.
De cache, het resetten enz heb ik al zovele malen gedaan, maar zonder resultaat.

Dit is mijn script nogmaals, daar is toch niets fout aan verzonderstel ik:

RewriteEngine On
RewriteBase /
RewriteRule ^nieuws/$ nieuws.php
RewriteRule ^nieuws/(.*)/$ nieuwsbericht.php?id=$1
RewriteRule ^nieuws/([0-9]+)/([a-zA-Z0-9_-]+)\.html$ nieuwsbericht.php?id=$1

Online werkt het dus perfect, lokaal op twee testconfigs totaal niet.

Zolang het bestand "nieuws.php" aanwezig is gaat hij altijd hiernaar navigeren, indien in dit bestand tijdelijk hernoem gaat hij wel naar nieuwsbericht.php

Drone

Legacy Member
Het is raar maar ik een ID in url rewriting zie denk ik ook altijd van "is dit nu zoveel beter als querystrings?". Aan de andere kant als ik een titel of zo gebruik als ID dan denk ik altijd van "ja, maar wat als?". Dit is vooral iets dat je uit je hoofd moet zetten (all is well, all is well, all is well).

Ik denk dat het vooral afhangt van wat voor type website je hebt. Als het een persoonlijk blog is dan is het niet zo moeilijk om unieke titels te schrijven. Je kan voor jezelf wat regels opleggen van hoe je een titel gaat invoeren.

bv: "audi stelt nieuwe A8 voor" dan maak je daar van "Nieuwe audi A8 voor het jaar 2008"(ok, niet zo een geweldige voorbeeld maar ik neem aan dat je begrijpt wat ik bedoel).

Voor een forum is dit iets anders vermits je geen controle hebt over wat gebruikers gaan invoeren. Een fout melding als "de titel van jouw post is niet uniek" is ook niet erg gebruiksvriendelijk.

Zoals adrianhates het zegt is dit niet zo moeilijk te maken. Je kan soms zelf een string als PK gebruiken maar alles hangt af van de website die je maakt.

sarnath

Legacy Member
[drone]-[1.05];12753573 zei:
Het is raar maar ik een ID in url rewriting zie denk ik ook altijd van "is dit nu zoveel beter als querystrings?". Aan de andere kant als ik een titel of zo gebruik als ID dan denk ik altijd van "ja, maar wat als?". Dit is vooral iets dat je uit je hoofd moet zetten (all is well, all is well, all is well).

Ik denk dat het vooral afhangt van wat voor type website je hebt. Als het een persoonlijk blog is dan is het niet zo moeilijk om unieke titels te schrijven. Je kan voor jezelf wat regels opleggen van hoe je een titel gaat invoeren.

bv: "audi stelt nieuwe A8 voor" dan maak je daar van "Nieuwe audi A8 voor het jaar 2008"(ok, niet zo een geweldige voorbeeld maar ik neem aan dat je begrijpt wat ik bedoel).

Voor een forum is dit iets anders vermits je geen controle hebt over wat gebruikers gaan invoeren. Een fout melding als "de titel van jouw post is niet uniek" is ook niet erg gebruiksvriendelijk.

Zoals adrianhates het zegt is dit niet zo moeilijk te maken. Je kan soms zelf een string als PK gebruiken maar alles hangt af van de website die je maakt.

yeps het is dat wat ik bedoel, ik snap jullie punt en voor sommige dingen werkt het, voor andere dingen dan weer niet (of niet geweldig).

Nu mijn prob nog opgelost krijgen en ik ben tevreden ;)



Edit, wat me net opvalt is hetvolgende:
als ik in productie http://www.mijnsite.com/nieuws intypt zegt hij page not found.
als ik dit in mijn test doe krijg ik de nieuwspagina
Hiervoor heb ik de .htaccess volledig leeg gemaakt.

Is er nog ergens een instelling aan de server fout ofzo?
Ik hoop dat het iemand iets zegt.
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan