Ben bir diziye bir web sayfasından tüm HTML etiketlerini ayıklamak gerekir without the data inside the tags. Bu gibi bir şey olur ...
Ben PHP kullanarak ediyorum
Array
{
html =>
Array
{
head =>
Array
{
title,
meta name='description' content='bla bla'
meta name='keyword' content='bla bla'
....
},
body =>
Array
{
div id='header' =>
Array
{
div class='logo',
div class='nav'
},
div id='content' =>
Array
{
h1,
p class='first-para',
p,
p,
div id='ad'
},
div id='footer' =>
Array
{
ul =>
Array
{
li =>
Array
{
a href='link.htm'
},
li =>
Array
{
a href='link.htm'
},
li =>
Array
{
a href='link.htm'
}
}
}
}
}
}