Se busca un desarrollador con amplia experiencia en web scraping para automatizar la extracción de datos de productos de diversas webs de proveedores. El objetivo principal es obtener información detallada de productos y sus imágenes, para luego importarlos de manera eficiente en una tienda WooCommerce. Los proveedores no facilitan archivos CSV, por lo que la automatización es crucial.
Requisitos de Extracción de Datos:
- SKU/Referencia
- Descripción corta
- Descripción larga
- Precio PVP
- Precio con descuento
- Soporte para productos variables: Se requiere la extracción de atributos y sus valores, así como la asignación de precios específicos por cada variación.
- Fichas técnicas: Descargar y adjuntar las fichas técnicas proporcionadas por el proveedor para cada producto.
Requisitos de Imágenes:
- Descarga de imagen principal y galería de imágenes por producto.
- Adaptación para web: Las imágenes deben ser redimensionadas a un tamaño exacto de 878x979 píxeles.
- Formato: Preferiblemente webp o jpg.
- Optimización: Las imágenes deben estar optimizadas en cuanto a peso y calidad para un rendimiento web óptimo.
- Nomenclatura: Se necesita una nomenclatura consistente para las imágenes, utilizando el SKU del producto (ejemplo:
SKU_01.webp,
SKU_02.webp).
- Enlace en CSV: El archivo CSV de importación debe contener los enlaces (rutas o URLs) de cada imagen con su producto o variación correspondiente.
Entregables del Proyecto:
1. Archivo CSV/Excel: Un archivo perfectamente estructurado y listo para importar productos simples y variables en WooCommerce.
2. Carpeta de Imágenes: Una colección organizada de todas las imágenes descargadas y adaptadas según las especificaciones.
3. Script Reutilizable y Documentado: Un script robusto desarrollado en Python, utilizando herramientas como Playwright, Selenium o Scrapy. El script debe incluir:
- Manejo de paginación para recorrer todas las páginas de productos.
- Detección y gestión de duplicados para evitar entradas redundantes.
- Sistema de logs para el seguimiento de la ejecución y errores.
- Capacidad para manejar sitios web que requieran inicio de sesión (las credenciales serán proporcionadas).
Fase Piloto:
El proyecto comenzará con un proveedor piloto para asegurar que la metodología y los resultados sean los esperados. Una vez validado el piloto, se procederá con la ampliación al resto de proveedores. Se valorará la experiencia previa en proyectos similares, la tecnología propuesta, el presupuesto estimado y el plazo de entrega para esta fase inicial.
Delivery term: Not specified