İyi, güvenilir oynatıcılar bulmak için algoritma

8 Cevap php

Ben oyuncuları takip, her değer verilen bir oyun doğru cevap yüzdesi bir sonuca tekabül ettik.

$players = array
(
    'A' => array(0, 0, 0, 0),
    'B' => array(50, 50, 0, 0),
    'C' => array(50, 50, 50, 50),
    'D' => array(75, 90, 100, 25),
    'E' => array(50, 50, 50, 50),
    'F' => array(100, 100, 0, 0),
    'G' => array(100, 100, 100, 100),
);

Ben iyi oyuncuları almak mümkün olmak istiyorum ama ben de bir oyuncu (daha az entropi = daha güvenilir), şimdiye kadar, aşağıdaki formül ile geldim nasıl güvenilir dikkate almak istiyorum:

average - standard_deviation / 2

Ancak bu optimal bir formül olup olmadığından emin değilim ve ben sizin bu konudaki düşüncelerinizi duymak istiyorum. I've been thinking some more on this problem and I've come up with a slightly different formula, here it is the revised version:

average - standard_deviation / # of bets

This result would then be weighted for the next upcoming vote, so for instance a new bet from player C would only count as half a bet.

Ben burada ayrıntılarına girmeyeceğim ama bu bir project related with the Wisdom of Crowds theory ve Delphi method ve Amacım birkaç itibaren geçmiş bahis ağırlıklandırılarak en iyi mümkün olduğunca sonraki sonuçlarını tahmin etmek oyuncular.

Ben, teşekkürler katkılarınıza teşekkür ederiz.

8 Cevap

Veri dizileri sadece birkaç girdileri varsa Öncelikle, ben Standart Sapma kullanmak olmaz. Medyan Mutlak Sapma (MAD) gibi daha sağlam istatistiksel ölçümler kullanın, aynı şekilde yerine Ortalamasının Medyan kullanarak test etmek isteyebilirsiniz.

Bu oyuncuların bahisleri sizin "bilgi" sadece birkaç örnekle sınırlı ise, veri oyuncu şanssız / şanslı olmak, yani aykırı hakim olacak, bu gerçeği nedeniyle. İstatistiksel araçlar bu koşullar altında tamamen uygunsuz olabilir ve sezgisel bir yaklaşım çeşit kullanmak isteyebilirsiniz.

"A" dayalı "A" tartarak cevapları "C" doğru kümesini tahmin etmek istiyorum da aslında en iyi oyuncu almak niyetinde değilim ki, senin bağlantıların varsayalım değil cevapları kümesi sonraki oyuncu dayalı oyuncuların önceki sicili.

Bu soruna iyi bir çözüm olsaydı elbette ki, borsa ;-) (kimse yok olması, böyle bir çözümün varlığına dair bir gösterge olmalıdır) bir öldürme yapabilir.

Ama geri futbolcuları sıralamasında alıyorum. % 100 - Sizin asıl sorun (? Var) gibi eşit 0 dağıtılan doğru cevapların yüzdesi almak olduğunu. Test birden fazla soru varsa, bu kesinlikle böyle değil. Ben test ne tamamen rastgele bir oyuncu "R" puanları bakmak ve verilen gerçek oyuncu ne kadar iyi / "R" daha kötü dayalı göreli güven numarası kurmak istiyorsunuz.

Oyunun her turda bir milyon rasgele oyuncu oluşturmak ve puan dağılımına bakmak için, söylüyorlar. Oyuncuların gerçek puanları için bir ağırlık olarak dağılımını kullanın. Zaten önerilen gibi, MAD / bir numara - Sonra MAD kullanılarak ağırlıklı puanları birleştirmek ve Medyan hesaplamak.

Daha iyi ne sayısal değil varsa optimal formülü alınamıyor. Eğer ortalama karşı tutarlılık tartmak istiyorum nasıl anlamaya gerekir. Örneğin bir seçenek oyunculu oyunlar belirli bir yüzdesini vuracaktır skoru tahmin etmek olacaktır. Bu skor oyuncuların olasılık dağılımı modeli çeşit gerektirir. Biz oyuncuların puanları normal bir dağılım izleyin varsayalım Örneğin, ardından verilen formül oyuncu zaman yaklaşık% 70 aşacak puan ne hesaplar.

Bir Bayesian Probablity Formula tasarıyı uygun olur?

Ben zannettiğiniz. İşte bu konuda biraz daha matematiksel bir başka siteye bir link: http://www.experiment-resources.com/bayesian-probability.html

Esasen her oyuncu bir sonraki turda en yüksek atar olasılığını tahmin ediyorlar. Bu bayesian olasılıklar kahvaltıda ne yemek olduğunu.

Sadece bu gibi şeyleri belirlemek için: Bayes olasılıkları video games (. Doc dosyası uyarısı) zaten kullanılıyor.

Hm. Bu (85,85,85,85) oyuncudan daha kötü puan olarak a (100,100,100,60) player yapmak istiyorum. Neden de dikkate toplam puanın% almaz?

Gibi: yüzde toplam puanları (örn. 0 .. 1) mevcut hesaplama ile çarpılır.

Sadece medyan kullanarak düşündünüz mü? Bir daha robust statistic (daha az aykırı etkilenen) ortalama daha kabul edilir. 0, 25, 50, 82.5, 50, 50, 100: senin veri, size medyanları olsun.

Bu sezgisel istediğini gibi görünüyor mu? Ben "doğru cevap" Burada var olduğunu başkalarıyla katılıyorum.

Ben size iki faktörün doğrusal kombinasyonu çeşit istediğiniz doğru olabilir düşünüyorum, ama biz senin gerçek sabitler ne olacağını bilmek ne yaptığını hakkında daha fazla bilmek gerekir diye düşünüyorum ...

Peki, "basit bir uzantısı" bir ağırlık ve bir sınırların sadece ektir:

ortalama (oyuncu) - min (üst, ağırlık * entrophy (oyuncu))

Bu bir seçenek ise, ancak, mevcut veri seti verildi, ben, puan farkı bakarak gibi çok "doğru cevap yüzdesi" per game ile ilgili olabilir.

Çıkış http://blog.stackoverflow.com/2009/10/alternate-sorting-orders/

Orada formül oylama sıralamak, ancak skor oyuncuların daha tutarlı yüksek puanlama hangi hesaplamak için kullanmak gerekir (0-ne olursa olsun) oylama benzer olarak düşünün.