Evaluando propuestas

Automatización de Búsqueda de Causas Judiciales

Publicado el 09 Julio, 2025 en Programación y Tecnología

Sobre este proyecto

Abierto

Este proyecto tiene como objetivo automatizar la recolección de causas judiciales publicadas en el sitio del Poder Judicial de Chile, específicamente en materias civiles y de familia. La información disponible en la Oficina Judicial Virtual es de acceso público, pero requiere navegación manual, filtros por fecha, jurisdicción y tipo de competencia, además de pasos adicionales para acceder a los detalles de cada causa.

Se busca desarrollar un sistema que permita extraer de manera continua datos clave de las causas ingresadas recientemente —como el nombre del demandado, RUT, domicilio, monto adeudado, acreedor, tribunal, fecha y rol del caso— y consolidarlos en una base de datos estructurada. El resultado esperado es un archivo en formato CSV (u otro formato tabular estándar) que pueda ser actualizado periódicamente. En etapas más avanzadas, esta información se enriquecerá con datos de contacto (correo electrónico y número celular), permitiendo usarla con fines de seguimiento o contacto estratégico.

Contexto general del proyecto

1. Objetivo del Desarrollo Diseñar y programar una solución automatizada (bot o script) para la consulta y extracción de causas judiciales en el portal del Poder Judicial de Chile (https://oficinajudicialvirtual.pjud.cl/), enfocada en causas civiles y de familia. El objetivo final es obtener una base de datos estructurada en formato CSV o Excel, que pueda actualizarse periódicamente, y que contenga los datos detallados de las causas disponibles públicamente en dicha plataforma. 2. Funciones que debe cumplir la solución 2.1. Scraping de causas nuevas (sin RUT previo) Automatizar la búsqueda por fecha desde la Oficina Judicial Virtual: Acceder a: https://oficinajudicialvirtual.pjud.cl/indexN.php Parámetros configurables: Fecha (inicio y término del período) Competencia: Civil Corte de Apelaciones Tribunal específico Flujo esperado: Filtrar causas por letras “C” (Civiles) y “E” (Exhortos). Ingresar al detalle de cada causa desde la vista resumen. Descargar el ebook de la causa (PDF con escritos y resoluciones). Extraer los siguientes datos desde el contenido visible y/o el PDF (si disponible): Nombre completo del demandado RUT Domicilio Monto de la deuda Acreedor (demandante) Rol de la causa Juzgado Fecha de ingreso de la demanda Exportar toda la información a un archivo CSV (o equivalente tabular). Excluir causas asociadas a la Tesorería General de la República. 2.2. Scraping por RUT (prospectos ya identificados) Automatizar la búsqueda por RUT desde la opción “Depósito Judicial”: Acceder a: https://oficinajudicialvirtual.pjud.cl/ Ingresar en sección “Consulta por RUT” Parámetros: Competencia: Civil RUT (con dígito verificador separado) Corte de Apelaciones Juzgado Captcha (obligatorio en cada consulta) Requisitos técnicos: Búsqueda iterada en múltiples Cortes y Juzgados (si no se conoce a priori). Resolución de CAPTCHA (preferentemente con servicios de terceros como 2Captcha, Anticaptcha o similares). Extracción de datos por rut: rit nombre interviniente carátula competencia tribunal corte de apelaciones fecha de ingreso de la causa 3. Entregables Script o aplicación funcional documentada (Python, Node.js u otro lenguaje de automatización moderno). Archivo de resultados en formato CSV o Excel, con columnas limpias y estandarizadas. Posibilidad de reejecutar el script con nuevas fechas o nuevos RUTs. Instrucciones claras para instalación y ejecución (README). (Opcional pero ideal): Contenedor Docker o entorno virtual preconfigurado. 4. Criterios adicionales Robustez ante errores: El sistema debe manejar caídas del sitio, cambios menores en el html o captcha fallidos. Escalabilidad: La solución debe permitir iterar sobre cientos de RUTs y/o múltiples fechas. Velocidad razonable: No se requiere ejecución en tiempo real, pero sí un rendimiento aceptable para procesar volúmenes medianos de causas. Legalidad y responsabilidad: Toda la información extraída debe ser pública. No se debe automatizar el acceso a zonas protegidas por credenciales.

Categoría Programación y Tecnología
Subcategoría Otros
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Integraciones de API Otros (Otras APIs)

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por I. L.