Benim anti XSS yöntemi PHP kullanıcı HTML izin verdiği için iyi mi?

4 Cevap php

Bu durumda, kullanıcı verilerini gönderilen yapmak için iyi bir yol bulmaya çalışıyorum izin HTML ve o kadar güvenli ve hızlı olabildiğince olmak var.

Ben bu sitede HER KİŞİ http://htmlpurifier.org cevabı burada olduğunu düşünüyorum görünüyor biliyorum. Ben kısmen katılıyorum. htmlpurifier filtreleme kullanıcı sunulan HTML için orada iyi açık kaynak kodu vardır ama çözümü çok hantal ve yüksek trafik sitede performans için iyi değil. Hatta birgün orada çözümü kullanmak olabilir ama şimdi benim hedef daha hafif bir yöntem bulmak.

Ben herhangi bir sorun ile şu anda yaklaşık 2 buçuk yıl için aşağıdaki 2 fonksiyonları kullanarak edilmiştir henüz ama onlar bana yardımcı olacak eğer burada yanlısı yıllardan itibaren bazı giriş almak zamanı olduğunu düşünüyorum.

İlk fonksiyon kullanıcı verileri bir mysql veritabanına kaydedilir önce FilterHTML($string) o koştu denir. İkinci fonksiyon format_db_value($text, $nl2br = false) çağırdı ve ben kullanıcı verilerini teslim göstermeyi planlıyoruz bir sayfada kullanmak edilir.

2 fonksiyonlar Aşağıda http://ha.ckers.org/xss.html bulunan ve ben o zaman benim kod duygulanım nasıl görmek için bu 2 fonksiyonlar onları koştu XSS kodları bir demet, ben biraz memnunum Sonuçlar, onlar denedim her kod bloke yaptım ama ben açıkçası hala% 100 güvenli olmadığını biliyoruz.

Siz üzerinden bakmak ve bana kodunun kendisi hatta tüm html filtre kavramına için herhangi bir tavsiye verebilir misiniz.

Ben bir gün bir beyaz liste yaklaşım yapmak istiyorum ama htmlpurifier Bunun için kullanarak değer bulduk tek çözümdür ve bahsettiğim gibi ben istiyorum gibi hafif değildir olacaktır.

function FilterHTML($string) {
    if (get_magic_quotes_gpc()) {
    	$string = stripslashes($string);
    }
    $string = html_entity_decode($string, ENT_QUOTES, "ISO-8859-1");
    // convert decimal
    $string = preg_replace('/&#(\d+)/me', "chr(\\1)", $string); // decimal notation
    // convert hex
    $string = preg_replace('/&#x([a-f0-9]+)/mei', "chr(0x\\1)", $string); // hex notation
    //$string = html_entity_decode($string, ENT_COMPAT, "UTF-8");
    $string = preg_replace('#(&\#*\w+)[\x00-\x20]+;#U', "$1;", $string);
    $string = preg_replace('#(<[^>]+[\s\r\n\"\'])(on|xmlns)[^>]*>#iU', "$1>", $string);
    //$string = preg_replace('#(&\#x*)([0-9A-F]+);*#iu', "$1$2;", $string); //bad line
    $string = preg_replace('#/*\*()[^>]*\*/#i', "", $string); // REMOVE /**/
    $string = preg_replace('#([a-z]*)[\x00-\x20]*([\`\'\"]*)[\\x00-\x20]*j[\x00-\x20]*a[\x00-\x20]*v[\x00-\x20]*a[\x00-\x20]*s[\x00-\x20]*c[\x00-\x20]*r[\x00-\x20]*i[\x00-\x20]*p[\x00-\x20]*t[\x00-\x20]*:#iU', '...', $string); //JAVASCRIPT
    $string = preg_replace('#([a-z]*)([\'\"]*)[\x00-\x20]*v[\x00-\x20]*b[\x00-\x20]*s[\x00-\x20]*c[\x00-\x20]*r[\x00-\x20]*i[\x00-\x20]*p[\x00-\x20]*t[\x00-\x20]*:#iU', '...', $string); //VBSCRIPT
    $string = preg_replace('#([a-z]*)[\x00-\x20]*([\\\]*)[\\x00-\x20]*@([\\\]*)[\x00-\x20]*i([\\\]*)[\x00-\x20]*m([\\\]*)[\x00-\x20]*p([\\\]*)[\x00-\x20]*o([\\\]*)[\x00-\x20]*r([\\\]*)[\x00-\x20]*t#iU', '...', $string); //@IMPORT
    $string = preg_replace('#([a-z]*)[\x00-\x20]*e[\x00-\x20]*x[\x00-\x20]*p[\x00-\x20]*r[\x00-\x20]*e[\x00-\x20]*s[\x00-\x20]*s[\x00-\x20]*i[\x00-\x20]*o[\x00-\x20]*n#iU', '...', $string); //EXPRESSION
    $string = preg_replace('#</*\w+:\w[^>]*>#i', "", $string);
    $string = preg_replace('#</?t(able|r|d)(\s[^>]*)?>#i', '', $string); // strip out tables
    $string = preg_replace('/(potspace|pot space|rateuser|marquee)/i', '...', $string); // filter some words
    //$string = str_replace('left:0px; top: 0px;','',$string);
    do {
    	$oldstring = $string;
    	//bgsound|
    	$string = preg_replace('#</*(applet|meta|xml|blink|link|script|iframe|frame|frameset|ilayer|layer|title|base|body|xml|AllowScriptAccess|big)[^>]*>#i', "...", $string);
    } while ($oldstring != $string);
    return addslashes($string);
}

Gösteren kullanıcı bir web sayfasında kodu gönderdiniz zaman fonksiyonu aşağıda kullanılır

function format_db_value($text, $nl2br = false) {
    if (is_array($text)) {
    	$tmp_array = array();
    	foreach ($text as $key => $value) {
    		$tmp_array[$key] = format_db_value($value);
    	}
    	return $tmp_array;
    } else {
    	$text = htmlspecialchars(stripslashes($text));
    	if ($nl2br) {
    		return nl2br($text);
    	} else {
    		return $text;
    	}
    }
}


The codes below are from ha.ckers.org ve hepsi benim fonksiyonları üzerinde başarısız gibi görünüyor yukarıdaki

I did not try everyone on that site though there is a lot more, this is just some of them.
The original code is on the top line of each set and the code after running through my functions is on the line below it.

<IMG SRC="javascript:alert(\'XSS\');"><b>hello</b> hiii
<IMG SRC=...alert('XSS');"><b>hello</b> hiii

<IMG SRC=JaVaScRiPt:alert('XSS')>
<IMG SRC=...alert('XSS')>

<IMG SRC=javascript:alert(String.fromCharCode(88,83,83))>
<IMG SRC=...alert(String.fromCharCode(88,83,83))>

<IMG SRC=&#106;&#97;&#118;&#97;&#115;&#99;&#114;&#105;&#112;&#116;&#58;&#97;&#108;&#101;&#114;&#116;&#40;&#39;&#88;&#83;&#83;&#39;&#41;>
<IMG SRC=...alert('XSS')>

<IMG SRC=&#0000106&#0000097&#0000118&#0000097&#0000115&#0000099&#0000114&#0000105&#0000112&#0000116&#0000058&#0000097&#0000108&#0000101&#0000114&#0000116&#0000040&#0000039&#0000088&#0000083&#0000083&#0000039&#0000041>
<IMG SRC=F  MLEJNALN !>

<IMG SRC=&#x6A&#x61&#x76&#x61&#x73&#x63&#x72&#x69&#x70&#x74&#x3A&#x61&#x6C&#x65&#x72&#x74&#x28&#x27&#x58&#x53&#x53&#x27&#x29>
<IMG SRC=...alert('XSS')>


<IMG SRC="jav&#x0A;ascript:alert('XSS');">
<IMG SRC=...alert('XSS');">

perl -e 'print "<IMG SRC=javascript:alert("XSS")>";' > out
perl -e 'print "<IMG SRC=java\0script:alert(\"XSS\")>";' > out

<BODY onload!#$%&()*~+-_.,:;?@[/|\]^`=alert("XSS")>
...

<iframe src=http://ha.ckers.org/scriptlet.html <
...

<LAYER SRC="http://ha.ckers.org/scriptlet.html"></LAYER>
......

<META HTTP-EQUIV="Link" Content="<http://ha.ckers.org/xss.css>; REL=stylesheet">
...; REL=stylesheet">

<IMG STYLE="xss:...(alert('XSS'))">
<IMG STYLE="xss:expr/*XSS*/ession(alert('XSS'))">

<XSS STYLE="xss:...(alert('XSS'))">
<XSS STYLE="xss:expression(alert('XSS'))">

<EMBED SRC=" A6Ly93d3cudzMub3JnLzIwMDAvc3ZnIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcv MjAwMC9zdmciIHhtbG5zOnhsaW5rPSJodHRwOi8vd3d3LnczLm9yZy8xOTk5L3hs aW5rIiB2ZXJzaW9uPSIxLjAiIHg9IjAiIHk9IjAiIHdpZHRoPSIxOTQiIGhlaWdodD0iMjAw IiBpZD0ieHNzIj48c2NyaXB0IHR5cGU9InRleHQvZWNtYXNjcmlwdCI+YWxlcnQoIlh TUyIpOzwvc2NyaXB0Pjwvc3ZnPg==" type="image/svg+xml" AllowScriptAccess="always"></EMBED>

<EMBED SRC=" A6Ly93d3cudzMub3JnLzIwMDAvc3ZnIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcv MjAwMC9zdmciIHhtbG5zOnhsaW5rPSJodHRwOi8vd3d3LnczLm9yZy8xOTk5L3hs aW5rIiB2ZXJzaW9uPSIxLjAiIHg9IjAiIHk9IjAiIHdpZHRoPSIxOTQiIGhlaWdodD0iMjAw IiBpZD0ieHNzIj48c2NyaXB0IHR5cGU9InRleHQvZWNtYXNjcmlwdCI+YWxlcnQoIlh TUyIpOzwvc2NyaXB0Pjwvc3ZnPg==" type="image/svg+xml" AllowScriptAccess="always"></EMBED>


<IMG
SRC
=
"
j
a
v
a
s
c
r
i
p
t
:
a
l
e
r
t
(
'
X
S
S
'
)
"
>

<IMG
SRC
=...
a
l
e
r
t
(
'
X
S
S
'
)
"
>

4 Cevap

İşte dört alternatifleri olduğunu:

Emin olmak için tek yol etiketleri beyaz listeye olduğunu ve niteliklerin izin değerlerini doğrulamak için sıkı İfadelerinin kullanımı ve yazabilirsiniz bağlıyor. Bu tür "tarzı" olarak özelliklerini izin vermek istiyorsanız o zaman ek karmaşıklık var.

Sadece fişliyor zor bazı insanlar için saldırı yapmak olabilir ama bunu henüz duymamış tekniği kullanan kişi için herhangi zor yapmaz.

Kullanıcıların girilen ne eksik kapanış etiketleri ekleyebilir ve <br> <br /> ile yerine regexpi kullanmayı deneyin ve böylece, daha sonra SimpleXML kullanarak ayrıştırmak istiyorum, daha sonra herhangi bir etiketi üzerinde yineleme ve kaldırmak Bu izin verilenler, verilen etiketi için beyaz listesinde olmayan herhangi bir öznitelik, ve bu özellik için kesin regexp uygun bulunmamış bir değeri olan herhangi bir öznitelik değildir. Sonuçta ben geri metni almak için asXML () kullanmak istiyorum. Ben etiketler ve öznitelikler minimum seti ile başlar ve url içerebilir şey özellikle dikkatli olmak gerektiğinde yenilerini eklemek istiyorum.

Etiketleri ve nitelikleri için yalın, hızlı, tam HTML kapsama, en esnek ... Siyah veya beyaz liste - htmlawed iyi IMHO. Güvenli? Defeats tüm ha.ckers XSS kodları

Nasıl PHP'nin HTML çözümleyici kullanmaya ne dersiniz?

Ben merak ediyordum, bu yüzden (PHP 5.3.6 + gerektirir) test için bazı kod yazmıştım:

$badHtml = file_get_contents('badHtml.txt');
$html = sprintf('<div id="input">%s</div>', $badHtml);

// tidy is no required, but may fix invalid markup
$tidy = new \tidy();
$tidy->parseString($html, array(), 'utf8');
$tidy->cleanRepair();

$dom = new \DomDocument('1.0', 'UTF-8');
libxml_use_internal_errors(true);
$dom->loadHtml($tidy);
$input = $dom->getElementById('input');

// tag as key, attributes as values
$allowed = array(
  'table'  => array('border'),  
  'tbody'  => array(),
  'tr'     => array(),
  'td'     => array(),
  'th'     => array(),
  'img'    => array('src', 'alt'),
  'p'      => array(),
  'ul'     => array(),
  'ol'     => array(),
  'li'     => array(),
  'a'      => array('href', 'title'),
  'strong' => array(),
  'em'     => array(),
  'sub'    => array(),
  'sup'    => array(),
);

$walk = function(\DomNode $node) use($allowed, &$walk){

  // only check tags
  if($node->nodeType !== XML_ELEMENT_NODE)
    return;

  if(!isset($allowed[$node->nodeName]))
    return $node->parentNode->removeChild($node);

  foreach($node->attributes as $key => $attr){
    if(!in_array($key, $allowed[$node->nodeName], true))
     $node->removeAttribute($key);

    // expect URLs here
    if(!in_array($key, array('href', 'src'), true))
      continue;

    if(!filter_var($attr->value, FILTER_VALIDATE_URL))
      return $node->parentNode->removeChild($node); 

  }

  array_map($walk, iterator_to_array($node->childNodes));  
};

// convert DOMNodeList to array because this way the bad stuff
// can be removed within the loop
array_map($walk, iterator_to_array($input->childNodes));

// export HTML
$sanitized = $dom->saveHtml($input);

Düzenli çalışan olmadan çıkış:

enter görüntü açıklaması here

Seems ok. Or did it remove too much? :) Should be way faster than HTMLPurifier, theoretically more secure since it's less permissive, and probably faster than the regexes too.