Sobre este projeto
it-programming / others-5
Aberto
Contexto Geral do Projeto
Contexto Necesitamos obtener URLs de imágenes de productos ya identificados. Hay limitaciones con ciertas fuentes y requisitos de calidad de imagen. (Más abajo se detalla la exclusión de dominios de “Thomann”.) Objetivo Para cada producto, recolectar mínimo 3 URLs de imágenes; deseable 7; óptimo 7+ (todas las disponibles y válidas por producto). Insumos disponibles Disponemos del listado completo de productos (brand, model, descripción, ficha técnica, y imágenes de referencia internas que NO pueden usarse, pero sí sirven para validar que las imágenes halladas correspondan exactamente al producto). Alcance / qué se necesita Búsqueda y recolección de URLs directas a imágenes del producto correcto (mismo brand/model y specs). Validación de correspondencia usando la info provista (texto + imágenes de referencia). Edición opcional solo si es necesario para cumplir requisitos de tamaño y formato (ver criterios). Fuentes a excluir: ninguna URL puede provenir de dominios de Thomann (por ej. Thomann.de, thomannmusic.com, thomann.es, .fr, .it, .se, .pl, .ie, etc. Lista no exhaustiva; el entregable no debe contener ningún dominio de Thomann). Entregables Archivo maestro (xlsx o csv) con columnas mínimas: product_id, sku, brand, model image_url_1 … image_url_n (n ≥ 3 por producto) origen_1 … origen_n (dominio de cada url) ancho_1, alto_1 … (si es posible) validaciones (ej.: “Match por nombre/modelo/specs + match visual con referencia”) observaciones (si hubo edición o recorte) (Opcional) Carpeta con versiones cuadradas si hubo que editar para cumplir requisito F. Importante: No necesitamos un script. Buscamos la solución completa con el listado final de URLs (y, si corresponde, las imágenes cuadradas procesadas). Criterios de aceptación A) Cantidad: mínimo 3 URLs válidas por producto; deseable 7; óptimo 7+. B) Origen: ninguna URL puede ser de Thomann (ninguno de sus dominios). C) Limpieza: imágenes sin textos ni marcas de agua. D) Tamaño: ≥ 600 × 600 px. E) Fondo: blanco o transparente (alineado con requerimientos de Google). F) Formato: cuadradas; si no lo están, pueden editarse (no es bloqueo mientras se cumpla el resto). G) Verificación de producto: debe haber controles claros que corroboren que cada imagen corresponde específicamente a ese producto (cruce por brand/model/specs y comparación con imágenes de referencia provistas). Volumen y hitos sugeridos Piloto: 500 productos para afinar criterios. Lote 1: 1.000 productos. Lote 2: 10.000 productos. Full: ~100.000+ productos. Perfil buscado No nos importa si el proceso es manual, semiautomático o automatizado: lo clave es el resultado. Valorable experiencia en scrapeo/adquisición de datos, curación visual y control de calidad a gran escala. Cómo postular Describí tu enfoque (cómo garantizarás A–G y cómo evitarás dominios del "Thomann"). Indicá tiempos por hito y capacidad diaria/semanal. Enviá una muestra sobre 100 productos (te compartimos set de prueba) con el formato de salida propuesto. Cotizá por hito y por total. Importante: Este es simplemente uno de varios módulos que forman parte de un proyecto mas grande que estamos desarrollando. Si tenes conocimientos de escrapeo web, uso de tecnologías de automatiación de procesos (N8N por ejemplo), uso y aplicación de herramientas de IA, están las puertas abiertas para continuar trabajando juntos!
Categoria TI e Programação
Subcategoria Outros
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Prazo de Entrega: Não estabelecido
Habilidades necessárias