Wikipedia JSON veya PHP ile XML veri ayıklanıyor

3 Cevap php

Ben Vikipedi sayfalarında veri ayıklamak için (muhtemelen Curl / XPath ile?) PHP kullanmak istiyorum. Ne bu konuda gitmek için en iyi yol olacağını? Sadece bu ilk çalışma almak için nasıl anlamaya ihtiyacımız rağmen, bu proje için CakePHP'ye kullanarak olacak.

3 Cevap

Sen CURL kullanan bu PHP fonksiyonu ile bazı verileri getirebilir:

http://www.barattalo.it/2010/08/29/php-bot-to-get-wikipedia-definitions/

Bu önce, http://stackoverflow.com/questions/627594/is-there-a-wikipedia-api bir kaç seçenek Wikipedia ile etkileşim için listelenen nerede görmek istedi olmuştur.

Sen wikipedia veritabanı anlık indirmek ve kendini diskspace içine bu işleme yapabilirsiniz. Bu alternatif, belki daha iyi bir çözüm ile yapmak.

Vikipedi veritabanı anlık adreste bulabilirsiniz: http://dumps.wikimedia.org/