Parsear una página

Hola necesito tomar un contenido especifico dentro de una página en un dominio y colocarla en otro dominio, en especifico se trata de una página XHTML y lo que quiero capturar viene encerrado entre etiquetas <div id="contenido"> ... </div> ... Creo que debo poder resolverlo con expresiones regulares o sacando los nodos como xml pero no tengo idea de como hacerlo o si es mejor hacerlo en JavaScript

1 respuesta

Respuesta
1
Creo que este código PHP te puede ayudar:
<?
$data = file_get_contents('http://sports.yahoo.com/');
list(, $data_split) = explode('<div id="contenido">', $data,
2);
list($data2, ) = explode('</div>', $data_split, 2);
$data2 = strip_tags($data2);
echo $data2;
?>
Siendo "'http://sports.yahoo.com/" un ejemplo de la página que quieres tomar los datos.
Bueno esta seria una solución perfecta si se incluyeran en el código que quiero capturar solo esas dos etiquetas ... <div>...</div> pero es que dentro hay muchas más entradas <div>...</div> y su cantidad es variable por lo que no puedo usar el explode con un limite de elementos a cortar, claro yo podría antes que eso contar primero en la cadena cuantos "<div></div>" hay y a partir de eso saber cual es exactamente el que corresponde al que me sirve de inicio y cortar ahí pero pensé que podría usar el ID de la etiqueta para sacarla de una sola vez con todo su contenido. ... ¿Se te ocurre alguna idea?
Sinceramente, no se me ocurre otra alternativa que la que mencionas, la de contar los divs y hacer un explode por esta cantidad.

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas