Extraer datos de una web

Quiero saber como extraer datos de una página. He obtenido el código fuente y lo almaceno en un archivo de texto. Ahora quiero sacar ciertas partes de ese texto para guardarlo en la base de datos mysql.
Debo sacar 8 datos, incluida una dirección http....  de cada uno de los registros mostrados.
¿Me pueden indicar por donde lo puedo hacer?

1 respuesta

Respuesta
1
Yo creo que la mejor manera es utilizar expresiones regulares para extraer la información. Como la web va a tener una estructura posiblemente predecible, puedes utilizar una regexp para obtener los trozos de información que quieras, por ejemplo
'^
<li>(.+)</li>
$'
Es una expresión regular que obtiene el contenido de una tag "<LI>". Con la función preg_match puedes sacar ese contenido a un string.
Más información:
PHP: preg_match, PCRE en PHP, ejemplos, sintaxis...
+info en expresiones regulares: http://www.regular-expressions.info (en inglés)

Añade tu respuesta

Haz clic para o

Más respuestas relacionadas