uma tÉcnica de aprendizagem de mÁquina baseada em Árvores de decisÃo: um estudo de caso em...
DESCRIPTION
Apresentação de trabalho de conclusão de curso sobre a utilização de técnicas de aprendizagem de máquina no processo de manejo avícula.TRANSCRIPT
Banco de Dados IUTFPR - Campus Pato Branco – PR
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE
DECISÃO: Um Estudo de Caso em Processos Avícolas
Acadêmico: André L. Wirth
Prof. Orientador: Dr. Richardson Ribeiro
Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas
Trabalho de Conclusão de Curso
Banco de Dados IAgenda
1. INTRODUÇÃO
2. PROBLEMA E MOTIVAÇÃO
3. OBJETIVOS:
3.1 Objetivo Geral;
3.2 Objetivos Específicos;
4. HIPÓTESES
5. REFERÊNCIAL TEÓRICO
6. MATERIAIS
7. METODOLOGIA
8. CONCLUSÃO
9. EXPERIMENTOS
10. TRABALHOS FUTUROS
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
3
INTRODUÇÃO
A avicultura de corte é uma atividade que está em expansão desde seu início, sofrendo constantes modernizações, atraindo novos avicultores em razão de sua rentabilidade;
O sucesso de um lote depende do manejo;
Proporcionar suporte as tomadas de decisões necessárias no decorrer de um manejo, utilizando técnicas de aprendizagem de máquina.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
4
PROBLEMA E MOTIVAÇÃO
A criação de aves para o abate apresenta uma boa rentabilidade dispensando grandes quantidades de terra, atraindo novos avicultores;
Avicultores com pouco conhecimento na atividade têm dificuldades em realizar o manejo;
Como é possível auxiliar esses avicultores?
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
5
OBJETIVOS
3.1 Objetivo Geral
Desenvolver um sistema computacional que auxilie os avicultores no processo de manejo avícola utilizando aprendizagem de máquina.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
6
OBJETIVOS
3.2 Objetivos Específicos
Realizar um estudo teórico sobre os processos do manejo avícola;
Realizar de maneira in loco a coleta dos dados de manejos avícolas;
Empregar, no sistema computacional, um classificador utilizando um algoritmo de árvores de decisão;
Realizar o acompanhamento dos lotes utilizando o protótipo computacional;
Comparar os manejos propostos pelo protótipo com os manejos realizados por um especialista humano;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
7
HIPÓTESES
Conhecidas as atividades de manejo avícola, assim como as regras sugeridas por especialistas do domínio, um sistema computadorizado pôde ser desenvolvido com o uso de técnicas de aprendizagem de máquina.
Informações armazenadas de lotes anteriores podem ser usadas para a seleção das melhores atividades encontradas no manejo.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
8
REFERÊNCIAL TEÓRICO
Avicultura no Brasil– Criação da sociedade brasileira de avicultura(1913);– 1961, início do abate na forma industrial;
Sistema de Apoio a Decisão– Software com o propósito de auxiliar no processo de tomada
de decisões;
Aprendizagem de máquina– Prover ao software a capacidade de aprender;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
9
REFERÊNCIAL TEÓRICO
Tipos de aprendizagem:– Simbólica: aprendizagem através de exemplos e contra
exemplos, geralmente resultando uma árvore de decisão;– Indutiva: aprendizagem supervisionada e não supervisionada:
• Supervisionada: utilização de exemplos previamente classificados;
• Não supervisionada: atribui uma classe através de uma análise de similaridade;
Raciocínio Baseado em Casos(RBC).– Utiliza como base o conceito de que problemas similares irão
possuir soluções similares.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
10
REFERÊNCIAL TEÓRICO
Árvores de decisão– Similares as regras “se-então”;– Boa performance como classificador;– Algoritmo C4.5.
Algoritmo C4.5– Proposto por J. R. QUINLAN em 1993;– Sucessor ao algoritmo ID3;– Algoritmo de árvore de decisão, capaz de trabalhar com dados
contínuos;– Poda;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
11
MATERIAIS
Astah Community – foi utilizado para a documentação do sistema através de diagramas de UML;
Spring Roo – para criação dos cadastros;
framework Spring Securrity – como controle de acesso do sistema;
WEKA – como um framework para utilizar técnicas de aprendizagem de máquina;
MYSQL – como sistema gerenciador de banco de dados;
JSF – para criação das páginas de consulta;
CSS – para alteração do layout;
Spring Tool Suite – como IDE de desenvolvimento;
JAVA – linguagem de desenvolvimento;
JSTL – integração JSF e JAVA.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
12
MATERIAIS
WSO2 Data Service Server – Serviços de acesso ao banco de dados;
Arduino UNO R3 e Sensores (shilds) – Coletor de temperatura/umidade;
Amazon EC2 – Servidor;
TOMCAT – Servidor de aplicação.
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
13
MODELO DE NEGÓCIO
Modelo de negócio:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
14
METODOLOGIA
Realizado estudo sobre processos avícolas; Realizado a coleta dos dados do manejo através de um
planilha de acompanhamento e um coletor construído utilizando Arduino;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
15
METODOLOGIA
Atributos Classe
Dia Estação Altura Comprimento Largura Núm. Bebedouros
Linhagem 1
Linhagem 2
Linhagem 3
1 0 3 125 14 3000 0 312 324 C143
2 0 3 125 14 3000 0 312 324 C144
3 0 3 125 14 3000 0 312 324 C145
Classe Atributos
Nebolisou Tamanho pinteira
Ventilação Mín.Ligada
Ventilação Mín. Deligada
Temperatura desejada
C143 0 60 50 140 31
Conjunto de dados
Composição da classe
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
16
METODOLOGIA
Interação dos componentes:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
17
METODOLOGIA
Interação dos componentes:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
18
METODOLOGIA
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
19
METODOLOGIA
Interação dos componentes:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
20
METODOLOGIA
Árvore de decisão:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
21
METODOLOGIA
Interação dos componentes:
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
22
METODOLOGIA
Amostra Atributos Alvo
Dia Estaçã
o
Altura Comprime
nto
Núm.
Bebedouros
Linhagem
1
Linhagem
2
Linhagem
3
Largura ?A1 1 0 3 125 3000 0 312 314 14
Classe Atributos
Nebolisou Tamanho pinteira
Ventilação Mín.Ligada
Ventilação Mín. Deligada
Temperatura desejada
C143 0 60 50 140 31
Sugestão de manejo
Instância
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
23
EXPERIMENTOS
Experimentos :
Treinamento X Teste Número de
instâncias
Percentual
Instâncias classificadas
corretamente120 83,33
Instâncias classificadas
incorretamente24 16,66
Total de instâncias 144 100
Treinamento X Manejo empírico Número de
instâncias
Percentual
Instâncias classificadas
corretamente18 70
Instâncias classificadas
incorretamente8 30
Total de instâncias 26 100
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
24
CONCLUSÕES
Como forma de disseminar os conhecimentos necessários para o manejo, as técnicas de raciocínio baseado em casos e árvores de decisão podem ser uma alternativa para o domínio de problema proposto;
Comprovação da possibilidade da utilização de um sistema computacional para auxiliar avicultores no manejo avícola;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
25
TRABALHOS FUTUROS
Experimentos com outros cenários;– Utilização por diferentes avicultores;– Utilização em diferentes regiões;
Realizar experimentos para validar se o sistema pode influenciar a conversão alimentar;
Desenvolvimento de uma interface com o usuário similar a interface do painel de controle;
Automação do processo de coleta de dados sobre todo o manejo realizado, utilizando sensores integrados com o sistema computacional;
Geração de relatórios e gráficos demonstrando os resultados do manejo realizado;
Curso: Análise e Desenvolvimento de softwareUTFPR - Pato Branco
26
TRABALHOS FUTUROS
Ampliação dos atributos utilizados pelo classificador;
Redução do período de sugestões de diárias para cada hora;
Aumento do número de informações coletadas durante o manejo para que seja possível fornecer um maior número de informações para o algoritmo no momento da extração do classificador, e um maior número de informações sobre o manejo a ser seguido;
Integração do sistema computacional com o painel de controle do aviário.
Banco de Dados IUTFPR - Campus Pato Branco – PR
UMA TÉCNICA DE APRENDIZAGEM DE MÁQUINA BASEADA EM ÁRVORES DE
DECISÃO: Um Estudo de Caso em Processos Avícolas
Acadêmico: André L. Wirth
Prof. Orientador: Dr. Richardson Ribeiro
Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas
Trabalho de Conclusão de Curso