JohnBeton
Legacy Member
Hi,
ik heb een aantal (html) teksten waaruit ik automatisch de URLs (<a ... href="..." ...>...</a>) wil halen. (geen zoveelste vB code vraag dus
)
Tot nu to gebruikte ik 2 regexps:
$matches werd dat terug ge-de-arrayed
, en door deze regexp gehaald:
Deze combo werkt in 99% van de gevallen. Enkel wannneer de link een aanklikbare image is, lijken er problemen te zijn. Anyway, alles voor efficientie, dus probeerde ik bovenstaande te combineren in 1 regexp:
Resultaat:
Verre van goed dus... Nu is mijn vraag:
kan iemand me assisteren bij het opstellen van een 100% waterproof regexp om mijn doel te bekomen??
Alvast bedankt!
ik heb een aantal (html) teksten waaruit ik automatisch de URLs (<a ... href="..." ...>...</a>) wil halen. (geen zoveelste vB code vraag dus
)Tot nu to gebruikte ik 2 regexps:
PHP:
$result=preg_match_all('#(<a(.*)href=("|\')(.*)("|\')(.*)>(.*)</a>)#Ui', $contents,$matches);
, en door deze regexp gehaald:
PHP:
$result=preg_match_all('#(<a href=("|\')(.*)((\.html|\.php|\.htm)(.*)|(\?)(.*)|(/))("|\')#Ui',$contents,$matches);
Deze combo werkt in 99% van de gevallen. Enkel wannneer de link een aanklikbare image is, lijken er problemen te zijn. Anyway, alles voor efficientie, dus probeerde ik bovenstaande te combineren in 1 regexp:
PHP:
$result=preg_match_all('#(<a(.*)href=("|\')(.*)((\.html|\.php|\.htm)(.*)|(\?)(.*)|(/))("|\')(.*)>(.*)</a>)#Ui',$contents,$matches);
Resultaat:
Code:
f="http://www.pixmania.nl/nl/nl/112186/art/canon/mvx35i.html">MVX35i</a
kan iemand me assisteren bij het opstellen van een 100% waterproof regexp om mijn doel te bekomen??
Alvast bedankt!
:
.