Sobre este proyecto
it-programming / web-development
Abierto
Se requiere el desarrollo de un web scraper robusto y eficiente para extraer información específica de productos de la página web de Home Depot México. El objetivo principal es obtener datos detallados de productos a partir de una lista de URLs proporcionadas en una hoja de cálculo de Excel y actualizar la misma hoja con la información extraída. El scraper deberá ser capaz de manejar la estructura del sitio web de Home Depot México y extraer los siguientes puntos de datos por cada producto:
-Nombre del producto.
- Precio del producto.
- Disponibilidad física en una sucursal específica, incluyendo la ubicación detallada dentro de la tienda (pasillo, área y bahía).
- Descripción corta del producto (sección "Acerca de este producto").
- Descripción larga del producto (sección "Información adicional").
- Fotografías del producto.
El freelancer deberá desarrollar una solución que lea las URLs de los productos desde una columna en un archivo Excel, navegue a cada página de producto, extraiga la información solicitada y la escriba de vuelta en las columnas correspondientes de la misma hoja de cálculo. Es crucial que el scraper permita especificar una sucursal de Home Depot México para la consulta de disponibilidad y ubicación. Se valorará la capacidad de la solución para ser mantenible y adaptable a posibles cambios menores en la estructura del sitio web, así como la implementación de mecanismos para evitar bloqueos por parte del sitio web (ej. Manejo de CAPTCHAs, rotación de proxies si es necesario).
Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Bug o cambio pequeño
Plazo de Entrega: No definido
Habilidades necesarias