Extraer datos de una página externa ¿Tecnología?
Tengo una megapagina muy antigua con mucha información en diferentes categorías, la cual es estática, es decir no esta almacenada en ninguna base de datos, simples htmls puros y duros,, más de 3500 htmls, algunos docs y algunos pdfs.
Mi idea es hacer un proyecto para recuperar solo la información que quiero y añadirla a una base de datos, sin tener que andar copiando y pegando por que son muchos htmls.
Lo bueno es que todos tienen más o menos la mismos tags, aunque con alguna que otra variación.
Mi idea es generar un formulario y poder añadir las etiquetas de apertura y de cierre que contenga el texto que quiero y que muestre ese texto e insertarlo en una base de datos.
Lo que no se es como extraer los datos. Había pensado usar ajax con jquery pero por lo que tengo entendido ajax no funciona con otros dominios o páginas externas a la hora de extraer información. Es por ello que había pensado en laravel.
¿Cuál seria la solución más idónea?