PHP ile dağınık bir html web sitesi Kazıma

0 Cevap php

Ben şu durumda değilim. Ben bir güzel ve düzgün xml yapısı dağınık kazınmış html kodu dönüştürmek çalışıyorum.

A partial HTML code of the scraped website:

<p><span class='one'>week number</span></p>

<p><span class='two'>day of the week</span></p>
<table class='spreadsheet'>
table data
</table>

<p><span class='two'>another day of the week</span></p>
<table class='spreadsheet'>
table data
</table>

<p><span class='one'>another week number</span></p>

ETC

Şimdi php ile aşağıdaki xml yapısı oluşturmak istiyorsanız:

<week number='week number'>
 <day name='day of the week'>
  <data id='table data'>table data</data>
 </day>

 <day name='another day of the week'>
  <data id='table data'>table data</data>
 </day>
</week>
<week number='another week number'>
 ETC
</week>

Basit html dom yöntemi deneyerek, ancak sonraki kardeş almak ve vb haftanın yeni bir gün, yeni bir tablo veri veya yeni bir hafta wether kontrol nasıl hiçbir fikrim yok olmuştur.

Ben de, tabii ki, diğer çözümlere açığım.

Teşekkürler.

Cheers, Dandoen

0 Cevap