Completed

Script en Python que convierte Texto sin formato en Json

Published on the June 08, 2018 in IT & Programming

About this project

Open

Ya tenemos un scrip que lee pdf y los convierte a texto, luego identifica patrones dentro del texto.
Necesitamos depurar y mejorar el script actual


# Requerimientos
1. El script debe detectar cuando el archivo no es un PDF exportado de Linkedin y retornar un error diciendo. No es archivo de linkedin.

2. Debe detectar que sea pdf, y si no lo es, tambien, decir, este no es un pdf.
3. No todos tienen mail, no extraer el mail entonces.
4. Debe reconocer toda la información posible de los archivos que si son PDF de Linkedin.
    - Ejemplo de archivo con problemas 'pdf/rob.pdf' no importa nada.
    - Reconocer los bullets o listas que la gente pone en su descripción.

Category IT & Programming
Subcategory Web development
What is the scope of the project? Small change or bug
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
API Integrations Other (Other APIs)
Roles needed Developer

Delivery term: Not specified

Skills needed

Other projects posted by L. M. S.