PHP cURL kullanarak Wikipedia API paragraflar Özü

1 Cevap php

Burada Wikipedia (MediaWiki) API kullanarak yapmak için çalışıyorum ne - http://en.wikipedia.org/w/api.php

  1. Http://en.wikipedia.org/w/api.php?format=xml&action=opensearch&search bir GET yapmak = anahtar kelime için önerilen sayfaların bir listesini almak için [anahtar kelime]

  2. Önerilen her sayfası üzerinden döngü http://en.wikipedia.org/w/api.php?format=json&action=query&export&titles = bir GET kullanarak [sayfa başlık]

  3. Bir diziye sayfasında bulunan herhangi paragraflar Özü

  4. Do something dizisi ile

Ben 3. üzerinde şaşırıp. Ben paragraflar arasında "\ n \ n" içeren JSON veri bir sürü görebilirsiniz, ancak PHP patlayabilir nedense () fonksiyonu çalışmaz.

Esasen ben sadece her Wikipedia sayfası "et" (değil başlıkları veya herhangi bir biçimlendirme, sadece içeriği) yakala ve bir diziye paragraf bunu kırmak istiyoruz.

Herhangi bir fikir? Teşekkürler!

1 Cevap

\n\n, kelimenin tam anlamıyla bu karakterler değil linefeeds vardır. Emin patlayabilir dizesinde tek tırnak kullandığınızdan emin olun:

$parts = explode('\n\n', $text);

Çift tırnak kullanmayı tercih ederseniz bunu gibi \ karakter kaçmak gerekir:

$parts = explode("\\n\\n", $text);

Bir yan not: Neden iki farklı formatta veri almak mı? Neden sadece JSON veya sadece XML için gitmek değil mi?