Ahh, benim günlük DOM uygulamadır. HTML ve bu html nitelikleri gibi dizeleri ayrıştırmak için regex ayrıştırmak için DOM kullanmak gerekir.
Not: Ben elbette bazı sihirbazlar tarafından üzerine geliştirilmiş olabilir bazı temel Regexes var :)
# Not 2: ekstra yükü olabilir rağmen size href bir HEAD isteği gönderme ve Content-Type bakarak gerçek bir görüntü olup olmadığını iyice kontrol etmek kıvrılma gibi bir şey kullanabilirsiniz, ancak bu vakaların% 80-90 çalışacak .
<?php
$content = '
<a href="http://www.domain.tld/any/valid/path/to/imagefile.ext">This will be ignored.</a>
<br>
<a href="http://col.stb.s-msn.com/i/43/A4711309495C88F8CD154C99FCE.jpg">this will not be ignored</a>
<br>
<a href="http://col.stb.s-msn.com/i/A0/8E9A454F701E4F5F89E58E14B532C.jpg">bah</a>
';
$dom = new DOMDocument();
$dom->loadHTML($content);
$anchors = $dom->getElementsByTagName('a');
$i = $anchors->length-1;
$protocol = '/^http:\/\//';
$ext = '/([\w+]+)\.(?:gif|jpg|jpeg|png)$/';
if ( count($anchors->length) > 0 ) {
while( $i > -1 ) {
$anchor = $anchors->item($i);
if ( $anchor->hasAttribute('href') ) {
$link = $anchor->getAttribute('href');
if (
preg_match ( $protocol , $link ) &&
preg_match ( $ext, $link )
) {
//echo 'replacing this one.';
$image = $dom->createElement('img');
if ( preg_match( $ext, $link, $matches ) ) {
if ( count($matches) ) {
$altName = $matches[1];
$image->setAttribute('alt', $altName);
}
$image->setAttribute('src', $link);
$anchor->parentNode->replaceChild( $image, $anchor );
}
}
}
$i--;
}
}
echo $dom->saveHTML();