Mantıklı ya da değil - Google CAPTCHA doğrulaması atlamasına izin?

2 Cevap php

Benim web sitesi veritabanı arama vardır; bir CAPTCHA doldurarak size arama 5 dakika zaman verir. Herhangi bir otomatik komut algılamak için bazı özel kodları var. Ben sitemde madencilik birisi verileri istemiyorum ben bunu.

Sorun benim sitenizi bir Google arama sonuçlarını görmek olmamasıdır. Birisi bir arama sonucu bulunan bir dize arıyor, ben onlara Googling bu sayfayı bulmak istiyorum.

Benim için açık bir çözüm Google botlar için CAPTCHA ve özel güvenlik kodunu atlamak için PHP değişkeni $_SERVER['HTTP_USER_AGENT'] kullanmaktır. Benim sorum bu mantıklı olup olmadığıdır.

İnsanlar o CAPTCHA doldurmak zorunda kalmadan arama sonuçlarını görüntülemek için Google'ın önbelleğini kullanabilirsiniz, ama Google'ın kendi komut algılama yöntemleri bu sayfaları madencilik verilere engellemek istiyorsunuz?

Ya da insanlar Google güvenlik önlemleri bypass gibi $_SERVER['HTTP_USER_AGENT'] görünmesi için bazı yolu var olurdu?

Şimdiden teşekkürler.

2 Cevap

Veya Google güvenlik önlemleri bypass olarak ['HTTP_USER_AGENT'] görünen insanlar $ _SERVER yapmak için bazı yolu var olurdu?

Kesinlikle. Kullanıcı aracısı kurma gülünç kolaydır. Örneğin bkz User Agent Switcher for Firefox. Bir spam bot Google bot kendi kullanıcı aracısı başlığını ayarlamak için de kolay.

Hala rağmen, bir çekim değer olabilir. Ben sadece denemek ve sonuçları görmek söyleyebilirim. Eğer sorun alırsanız, başka bir şekilde düşünmek zorunda kalabilirsiniz.

Google bot tanımak için ek bir şekilde could IP aralığı (ler) olabilir o kullanır. Ben bot tanımlanan IP aralıklarını kullanan olup olmadığını bilmiyorum - bu böyle değil ki olabilir, öğrenmek gerekiyor.

Update: onun IP analiz ederek Google Bot doğrulamak mümkün görünmektedir. Dan Google Webmaster Central: How to verify Googlebot

Bir vaka-by-case bazında doğrulamak için DNS kullanmak yöneticileri söylüyorum gitmek için en iyi yol gibi görünüyor. Ben, önerilen teknik, bir ters DNS araması yapmak olacak isim googlebot.com etki alanında olduğunu doğrulayın ve sonra ileri gelen DNS-> IP arama olduğunu googlebot.com adını kullanarak yok diye düşünüyorum; örneğin:

host 66.249.66.1 1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

host crawl-66-249-66-1.googlebot.com crawl-66-249-66-1.googlebot.com has address 66.249.66.1

Bir parodi-abcd.googlebot.com tarama işaret ters DNS kurmak çünkü ben, sadece bir ters DNS araması yaparak yeterli olduğunu sanmıyorum.

$_SERVER['HTTP_USER_AGENT'] parametresi insanlar sahte onlar gerçekten sonuç almak istiyorsanız eğer, güvenli değildir. karar bir iş bir, temelde güvenlik düşürmek ve potansiyel insanlar / botlar sitenizi kazımak için izin istiyor musunuz, yoksa google gizli Sonuçlarınızı istiyorsun olduğunu.