Sobre este projeto
it-programming / data-science-1
Aberto
INTRODUCCIÓN:
Se trata de crear un bucle que consta de un árbol de decisión con la siguiente métrica:
Criterio: gini index
Máxima profundidad: variable
Minimo de datos para dividir: variable
Cualquier otra metrica consultar
PROCESO:
Paso 1
Los datos se dividen en tres ventanas temporales . Is –os-os2 variable
el árbol de decisión se entrena solo con los datos de la ventana is con un numero de indicadores variable aleatorios y se tiene que predecir una de las dos labels variable.
Se analizan todas las hojas creadas del árbol de decisión y se debe de devolver en un archivo txt el ¨camino¨ recorrido con los indicadores correspondientes de todas las hojas que cumplan los siguientes criterios (ver archivo a1 como ejemplo):
criterios para las hojas:
minimo % predictivo is os os2 variable.
Minimo datos is os os2 variable.
Minimo datos nuevos debe aportar al nuevo csv is os os2 variable.
Minimo K ratio is os os2 variable.
Nota: observese que para calificar a una hoja apta hay que comprobar los criterios de los indicadores en las 3 ventanas is-os-os2
se tienen que repetir la creación de árboles y el análisis de las hojas hasta que se cumpla el criterio de parada
criterio parada bucle: minimo datos is os os2 variable.
Una vez se termina este bucle se tiene que crear un nuevo csv con los datos filtrados por todos los ¨caminos¨ así como un txt con todas las métricas en is os os2 que han sido variables.
Paso 2
Se hace un bucle que repite el paso 1 pero tomando el archivo CSV creado en el paso anterior .
Las variables del paso 1 cambian al paso 2 por lo que se debe de poder elegir nuevos valores de antemano
PARA TERMINAR IMPORTANTE:
Poder poner una cola de ordenes con el mismo CSV o distinto CSV para poder dejar el ordenador trabajando
Contexto Geral do Projeto
Se trata de un único proyecto pera realizar un programa que sea capaz de analizar los datos de un archivo .csv
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Pequeño
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: Não estabelecido
Habilidades necessárias