Analisando propostas

Creacion de algoritmo de procesamiento de texto no estructurado

Publicado em 31 de Maio de 2022 dias na TI e Programação

Sobre este projeto

Aberto

Necesitamos desarrollar un algoritmo que sirva para procesar texto no estructurado sobre el Diario Oficial, documentos que contienen la información de conformación de empresas, esto la idea es tenerlo en formato de tabla, para poder armar diferentes bases de datos relacionales.
Existen 2 fuentes:
1. Fuentes escritas: https://www.diariooficial.interior.gob.cl/versiones-anteriores/
En este caso se necesitan descargar todos los documentos desde el año 1980 y procesar los textos, no importa si se procesan de forma manual ya que no posee tanta calidad como la versión digital. Lo que importa en este caso es poder armar una base de datos con las versiones anteriores.

2. Versión digital: https://www.diariooficial.interior.gob.cl/edicionelectronica/empresas_cooperativas.php?date=30-05-2022&edition=43265
En este caso la idea es poder generar un algoritmo de procesamiento de texto no estructurado ya sea en Python o R de modo que se pueda ejecutar y vaya extrayendo quienes son los socios de las empresas, fechas de creación , etc

Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Grande
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário

Prazo de Entrega: 25 de Junho de 2022

Habilidades necessárias

Outro projetos publicados por N. T.