Benim web uygulaması geliştirme üzerine bir sorunla karşı karşıyayım, burada açıklaması:
(Boyları oldukça büyük ekran yaklaşık dörtte biri haline rağmen genelde kısa haberler) Bu webapp (hala alpha) kullanıcı tabanlı içerik oluşturulan her kullanıcı bu maddelerin en az 10 gönderir, böylece sayı oldukça hızlı büyümek gerekir. Doğası gereği, makalelerin yaklaşık% 10 çoğaltılamaz olacak, bu yüzden onları almak için bir algoritma gerekir.
Ben aşağıdaki adımlarla geldi:
- Sunulması üzerine fetch a length of text ve ayrı bir tabloda depolamak (
article_id
, uzunluk), problem makaleleri PHP special_entities () fonksiyonu kullanılarak kodlanmış ve kullanıcılar (hafif değişiklikler ile içerik göndermek Bazı biri) virgül, vurgu kaçırmak hatta bazı kelimeleri atlar - % 5 (? Ben makale gönderme ile ilgili akılda insan faktörünü tutarak, başka bir eşiği kullanmalısınız) - Sonra uzaklığı aralığı =
new_post_length
+ / ile veritabanındaki tüm girdileri almak - Ilk 3 anahtar kelimeleri alıp 2. adımda getirilen makaleleri karşı bunları karşılaştırmak
- En muhtemel maçları ile son bir dizi PHP'nin Levenstein () işlevini kullanarak yeni girdiyi karşılaştırmak olması
Bu süreç cron kullanarak değil, makale gönderme idam edilmelidir. Ancak bu sunucu üzerinde ağır yükler oluşturabilir şüpheli.
Eğer herhangi bir fikir verebilir misiniz lütfen?
Thank you! Mike