Sobre este proyecto
it-programming / others-5
Abierto
Contexto general del proyecto
1. Objetivo del Desarrollo Diseñar y programar una solución automatizada (bot o script) para la consulta y extracción de causas judiciales en el portal del Poder Judicial de Chile (https://oficinajudicialvirtual.pjud.cl/), enfocada en causas civiles y de familia. El objetivo final es obtener una base de datos estructurada en formato CSV o Excel, que pueda actualizarse periódicamente, y que contenga los datos detallados de las causas disponibles públicamente en dicha plataforma. 2. Funciones que debe cumplir la solución 2.1. Scraping de causas nuevas (sin RUT previo) Automatizar la búsqueda por fecha desde la Oficina Judicial Virtual: Acceder a: https://oficinajudicialvirtual.pjud.cl/indexN.php Parámetros configurables: Fecha (inicio y término del período) Competencia: Civil Corte de Apelaciones Tribunal específico Flujo esperado: Filtrar causas por letras “C” (Civiles) y “E” (Exhortos). Ingresar al detalle de cada causa desde la vista resumen. Descargar el ebook de la causa (PDF con escritos y resoluciones). Extraer los siguientes datos desde el contenido visible y/o el PDF (si disponible): Nombre completo del demandado RUT Domicilio Monto de la deuda Acreedor (demandante) Rol de la causa Juzgado Fecha de ingreso de la demanda Exportar toda la información a un archivo CSV (o equivalente tabular). Excluir causas asociadas a la Tesorería General de la República. 2.2. Scraping por RUT (prospectos ya identificados) Automatizar la búsqueda por RUT desde la opción “Depósito Judicial”: Acceder a: https://oficinajudicialvirtual.pjud.cl/ Ingresar en sección “Consulta por RUT” Parámetros: Competencia: Civil RUT (con dígito verificador separado) Corte de Apelaciones Juzgado Captcha (obligatorio en cada consulta) Requisitos técnicos: Búsqueda iterada en múltiples Cortes y Juzgados (si no se conoce a priori). Resolución de CAPTCHA (preferentemente con servicios de terceros como 2Captcha, Anticaptcha o similares). Extracción de datos por rut: rit nombre interviniente carátula competencia tribunal corte de apelaciones fecha de ingreso de la causa 3. Entregables Script o aplicación funcional documentada (Python, Node.js u otro lenguaje de automatización moderno). Archivo de resultados en formato CSV o Excel, con columnas limpias y estandarizadas. Posibilidad de reejecutar el script con nuevas fechas o nuevos RUTs. Instrucciones claras para instalación y ejecución (README). (Opcional pero ideal): Contenedor Docker o entorno virtual preconfigurado. 4. Criterios adicionales Robustez ante errores: El sistema debe manejar caídas del sitio, cambios menores en el html o captcha fallidos. Escalabilidad: La solución debe permitir iterar sobre cientos de RUTs y/o múltiples fechas. Velocidad razonable: No se requiere ejecución en tiempo real, pero sí un rendimiento aceptable para procesar volúmenes medianos de causas. Legalidad y responsabilidad: Toda la información extraída debe ser pública. No se debe automatizar el acceso a zonas protegidas por credenciales.
Categoría Programación y Tecnología
Subcategoría Otros
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Integraciones de API Otros (Otras APIs)
Plazo de Entrega: No definido
Habilidades necesarias