Şu anda similar_text nedeniyle karşılaştırmalar sayısına çok yavaş olmasına rağmen çalışır ~ 50.000 listesine karşı bir dize karşılaştırmak için kullanıyorum. Bu ~ 500 eşsiz dizeleri karşılaştırmak için yaklaşık 11 dakika sürer.
Bu çalıştırmadan önce ben bu kadar her açmasının çalıştırdıktan sonra o anlık yakın geçmişte işlenmiş olup olmadığını görmek için veritabanlarını kontrol edebilirim.
Ben kılavuzda yayınlanan LevenshteinDistance fonksiyon birisi ilginç görünüyor levenshtein biraz daha hızlı olacağını kullanırken ve eminim. Ben önemli ölçüde daha hızlı bu yapabilirdiniz bir şey eksik?