Evaluando propuestas

Carga de Base de Datos de Autos desde Pdf Oficial

Publicado el 04 Mayo, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

📌 Descripción del proyecto:
Buscamos un profesional para extraer y estructurar información vehicular desde un archivo pdf oficial publicado por acara (argentina), que contiene una guía de precios de vehículos por marca, modelo, versión y años de fabricación.

🎯 Objetivo:
Convertir el PDF en una base de datos limpia en formato Excel, con las siguientes columnas:

Marca

Modelo

Versión

Año desde

Año hasta

📥 Archivo fuente:
Formato: PDF oficial

Longitud: más de 200 páginas

Características: estructura visual jerárquica (marca en azul, modelo en gris oscuro, versión sin color)

🔍 Requisitos clave:
Experiencia con OCR (Tesseract, ABBYY, etc.)

Dominio de herramientas de limpieza y estructuración de datos (Excel, Python, etc.)

Capacidad de respetar jerarquías visuales del documento (color de celda determina el tipo de dato)

No se deben omitir modelos, versiones ni años visibles

✅ Entregables esperados:
Archivo Excel con todas las marcas y modelos sin omisiones

Organización por bloques (por letra inicial, ej: audi, bmw, etc.)

Archivo final unificado o dividido por letra, según preferencia

💼 Modalidad:
Proyecto puntual

Idealmente con entregas parciales por bloque (ej: letras A–C, D–F, etc.)

🕒 Plazo estimado:
Máximo 5 a 7 días hábiles para la base completa

Entregas parciales progresivas a partir de las primeras 48 horas

💲 Presupuesto:
Ofrecer precio por bloque, por página procesada o por proyecto completo

Se valorarán propuestas con ejemplos previos o demo breve

Contexto general del proyecto

Estoy buscando una persona detallista y ordenada para digitalizar información desde un archivo PDF oficial (de más de 200 páginas) que contiene marcas, modelos y versiones de vehículos. La estructura del PDF es visual, con jerarquías que deben respetarse (por ejemplo: marca en celda azul, modelo en gris oscuro, versión sin color, y años marcados con “X”). 👉 El trabajo consiste en convertir eso a un Excel limpio con las columnas: Marca Modelo Versión Año desde Año hasta

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Cambio mediano
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo una idea
Disponibilidad requerida Según se necesite
Roles necesarios Otro
Otros roles necesarios data entry

Plazo de Entrega: No definido

Habilidades necesarias