Öğenin süresi dolduğunda Google'dan Eklenmiştir Dosyaları Çıkarma

2 Cevap php

Biz Google CSE (Custom Search Engine) kullanarak konum sitemizde dizin içerik hizmeti ödedi. Site dosyalarını içerir ile monte edilir çoğunlukla PHP sayfaları inşa, ancak tek bir sayfa şablonu (örneğin yeni sürümler) bir veritabanından bilgi çekin bazı dinamik sayfalar vardır edilir. Elimizdeki sorunu ben çok "id = 2" a "Bu içerik süresi dolmuş" haber getirecektir söylüyorlar veritabanındaki içeriği bir sona tarihini ayarlayabilirsiniz olduğunu. ID 2 ona bağlı bir tarih PDF olsaydı Ancak, PDF dosyası arama indeksi kalır.

Ben bir temizleme senaryo yazmak ve cron db bakar koşmak var, dolmuş içerik bulur olabileceğini biliyorum, herhangi yüklenen dosyalar takılı olup olmadığını görmek için denetler ve onları adlandırır ya kaldırır ya, ama (umarım daha iyi bir çözüm olmak zorunda .)

Eğer geçmişte bu karşılaştı varsa bana bildirin ve ne tavsiye edin.

Thanks, D.

2 Cevap

Yaptığımız sona erdi o anki yükleme tamamlandıktan sonra, eski dosyalar "bağlantısız" olduğunu ve DB kayıtları silinmiş olduğunu yükleme komut için bir onay komut bağlama oldu.

Biz bir yuvarlanma sırayla görünmesini öğelerin bir dizi numarası istediğiniz bir "tane eklemek / birini kaldırmak" durumun tür çünkü bizim için, bu işleri.

Bu seferde düz bir cevap vermek için hiçbir yolu maalesef yok: biz PDF'leri sayfalarınıza için "bağlı" ya nasıl DB nasıl yapılandığını hiçbir bilgiye sahip.

En iyi çözüm oluşturmak için olacak bir robots.txt dosya olduğunu kaldırmak istediğiniz belirli PDF dosyaları için bloklar URL'ler. Google (genellikle yaklaşık bir saat içinde) bir sonraki geçişte dizin onları düşecek.

http://www.robotstxt.org/