Sobre este proyecto
it-programming / web-development
Abierto
Se busca un desarrollador con experiencia comprobable en n8n para diseñar e implementar un sistema automatizado de generación de leads B2B. El objetivo principal es extraer información de empresas de la Facebook Ads Library y sus páginas de Facebook, para luego consolidar y limpiar los datos en Google Sheets. Este sistema será crucial para nuestras campañas de prospección.
Las funcionalidades clave del sistema incluyen:
1. Extracción de datos de la Facebook Ads Library:
* El sistema deberá scrapear la Facebook Ads Library utilizando una URL específica que será proporcionada.
* Se requiere extraer el nombre de la página, la url de la página, el id del anunciante y, opcionalmente, el texto del anuncio.
2. Extracción de datos de las páginas de Facebook de los negocios:
* Utilizando la URL de la página obtenida en el paso anterior, el sistema deberá scrapear la página de Facebook de cada negocio.
* Se extraerán datos públicos como número de teléfono, correo electrónico, enlace de WhatsApp, sitio web, nombre de la empresa y dirección (si están disponibles).
3. Extracción opcional de datos del sitio web:
* Si la página de Facebook del negocio tiene un sitio web asociado, el sistema idealmente debería acceder a este sitio.
* El objetivo es extraer información de contacto adicional que pueda encontrarse en el footer, la página de contacto o la sección "Acerca de" del sitio web.
4. Limpieza y validación de la información:
* Es fundamental implementar procesos para eliminar duplicados en los datos extraídos.
* Se requiere validar los números telefónicos para asegurar su formato correcto y utilidad.
* Los nombres de empresas y correos electrónicos deben ser normalizados para mantener la consistencia en la base de datos.
5. Almacenamiento automático en Google Sheets:
* Toda la información procesada debe guardarse automáticamente en una hoja de cálculo de Google Sheets.
* Las columnas de la hoja de cálculo incluirán: Página, Empresa, URL, Teléfono, Correo, Sitio web, País y Fecha de extracción.
6. Configuración de ejecución y manejo de errores:
* El sistema debe configurarse para una ejecución automática, ya sea diaria o semanal, según se defina.
* Es imprescindible incluir un robusto manejo de errores y un sistema de reintentos para asegurar la fiabilidad de la extracción de datos.
Se busca un profesional con experiencia sólida en n8n, técnicas de scraping web, uso de expresiones regulares (regex) para la manipulación de texto y la integración con Google Sheets. La capacidad de entregar un sistema eficiente y confiable es clave para el éxito de este proyecto.
Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Bug o cambio pequeño
Plazo de Entrega: No definido
Habilidades necesarias