Se requiere el desarrollo de un script en Python para automatizar la búsqueda y extracción de información de expedientes en el portal web del gobierno de la provincia de Santa Fe. El objetivo principal es recorrer un rango específico de números de expediente, extraer datos clave y generar un informe en formato PDF con capturas de pantalla de los expedientes que cumplan con ciertos criterios.
Detalles del proyecto:
- El script debe interactuar con el portal:
https://www.santafe.gov.ar/expedientes-web/expediente-timbo/
- Deberá iterar a través de un rango de números de expediente, comenzando desde 00032615 y retrocediendo en lotes de 100 expedientes.
- Para cada expediente, el script debe extraer los siguientes campos: "Iniciador", "Tema" y "Concepto".
- Se debe implementar una lógica de búsqueda para identificar coincidencias con las palabras clave "Rais", "ascenso" y "extraordinario" dentro de los campos extraídos.
- Como resultado, el script generará un archivo PDF que contenga capturas de pantalla de todos los expedientes que contengan alguna de las palabras clave especificadas. El formato del PDF debe permitir una revisión manual sencilla mediante scroll.
- Consideraciones técnicas importantes: El servidor del portal puede tener un tiempo de respuesta lento, por lo que el script debe manejar un timeout de al menos 20 segundos. No se permite el uso de proxies públicos, ya que el portal los bloquea.
Plazo de Entrega: No definido