Üzgünüm beyler, ben bütün fikirler çalışıyor ve biraz vazgeçerek oldum gibi benim uygulamasına wikipedia verileri entegre etmek ve açıkçası benim ucunda herhangi bir başarı yaşadım sanmıyorum nasıl bir sahte soru sorabilecek çalışan oldum Ben bir çıkmaz ya da engel okurken. Ben burada yapmak çalışıyorum tam olarak ne anlatmaya çalışacağım.
Ben şehir ve ülkeleri gibi yerlerde basit bir dizin var. Benim uygulama bir arama ile basit bir php tabanlı ajax tabanlı uygulama ve tesis göz atın. İnsanlar kaydolmak ve bir şehir ile kendilerini ilişkilendirmek ve bir kullanıcı şehirler attığında - o / o bizim sistemin bir parçası olduğunu kim yani o şehirde insanların ve şirketlerin görebilirsiniz.
O kısmı biraz rahatlıkla kendi kurmak ve iyi çalışıyor. Şey Beijing Diyelim Benim arama sonuçları bazı biri aramalarda yani biçiminde olacağını olmasıdır. Bu üç sekmeli arayüz kutusu dönecekti:
- İlk Tab Pekin için bir infobox içeren ürünlerin, kent bilgi olurdu
- Seond Çin'den ülke bilgileri bir bilgi kutusu tutan bir ülke sekme olacak
- Üçüncü sekme Pekin tüm temasların Kayıtları olurdu.
Bunu nasıl yapabilirim ve bu tür onun oldukça olun - ilk iki sekmeler için içeriği tamamen bu yapılır ve ayrıca bir kez daha sonra bir metodoloji üzerinde karar almak için en iyi yolu ne olurdu ile kaybettim Wikipedia.Now gelmelidir sağlam.
Fikirlerin bir çift iyi ve sindirmek mümkün olmuştur kadar kötü o kadar uzaktır:
Wikipedia doğrudan kıvırmak isteği çalıştırın ve arama yapılan her dönen verileri ayrıştırmak. Wikipedia verilerin bu durumda yerel bir kopyasını tutmak için herhangi bir gerek yoktur. Diğer konu olduğunu da uzak bir üçüncü yerden veri ve bunu temel bilgileri almak için wikipedia bir istek her şey yapmak için uygun olduğu şüphe tamamen güvenmek. Artı wikipedia verileri dikkate her talebi ayrıştırılması gerekir - şu olacak .. ağır sunucu yüklerine aşmak ya da ben burada spekülasyon duyuyorum.
Wikipedia dökümü Dosyaya almak ve sorgulamak. Peki ben tüm veritabanını indirdiğiniz ama onun olacak xml dökümü tüm tabloları almak için sonsuza dek sürebilir. Dökümü bilgilerin sürü bana hiçbir faydası yoktur - Ayrıca ben sadece ülkeleri ve şehirleri ve onların bilgi kutularının listesini çıkarmak istediğiniz gerçeğini düşünün.
Kendi yerel tabloları yapmak ve bir şekilde tüm teh ülkeleri ve wikipedia üzerinde şehirler sayfaları ayrıştırmak ve benim tablolarda kullanabileceğiniz bir biçime dönüştürmek olacağını senaryoyu [ben neden cron işi burada anlatacağım] cron oluşturun. Ancak dürüst olarak ben sadece bile infoboxes temel biçimlendirme alabilir infact olduğu gibi infoboxes içinde tüm bilgileri gerekmez konuşan - bu benim için fazlasıyla yeterli olacaktır. Gibi:
Ülke başlık | Infobox Raw metin
İstersem ben şahsen koordinatları ve diğer ayrıntılar gibi şeyler elde edebilirsiniz.
Hatta infochiumps ve dbpedia üçüncü parti veri setlerini indirerek denedim ama infochimps gelen veri kümesi eksik ve ben göstermek istedim tüm bilgileri içermiyordu - artı dbpedia ile ben infoboxes indirilecek csv dosyası ile ne hiçbir fikrim yok ve aynı zamanda tam olmayabilir korkuyorum.
Ama burada sorunun sadece bir parçasıdır. Ben wikipedia bilgilerini göstermek için bir yol istiyorum - tüm bağlantıları wikipedia işaret yanı sıra wikipedia güzel bir bilgi çevresinde düzgün görüntülenen olacak ANCAK sorunu ben periyodik ben var bilgilerini güncellemek bir yol gerekir olduğunu wikipedia atleast ben tamamen modası geçmiş veri yok. Gibi iyi kontrol edebilir ve yeni bir ülke veya yeni bir konum varsa o bilgiyi ayrıştırmak ve her nasılsa onu almak bir sistem Diyelim ki. Ben burada bunun için wikipedia ülkelerin ve şehirlerin kategorilerine dayanarak ediyorum ama açıkçası tüm bu fikirler kağıt üzerinde, kısmen kodlu ve büyük bir karmaşa.
PHP ve MySQL programlama ve benim son hızla yaklaşıyor kulüpler - Yukarıdaki durum ve takip ve uygulamak için en iyi ve en pratik yöntem nedir gereksinimleri verilmiştir. D: Ben fikirlere tamamen açığım - - uygulamalı örnekler herkes benzer bir şey yapmış ise ben duymak isterdim