trabajo final tesis dataminig

56
Universidad Tecnológica Del Perú filial Arequipa Facultad De Ingeniería Carrera Profesional Ingeniería de Sistemas e Informática Análisis e implantación de un Sistema de Producción que emplea una herramienta Data Mining para el pronóstico de producción en la empresa de calzados DUKE S.A.C.Arequipa, 2015 Presentado por: Ventura Mamani Wily Curso: Seminario de Tesis I Décimo Ciclo Profesor asesor: Ing. Adin Sánchez Sánchez Arequipa Perú 2015

Upload: wily-ventura

Post on 09-Sep-2015

13 views

Category:

Documents


0 download

DESCRIPTION

Esta tesis va orientado...

TRANSCRIPT

  • 1

    Universidad Tecnolgica Del Per filial Arequipa

    Facultad De Ingeniera

    Carrera Profesional

    Ingeniera de Sistemas e Informtica

    Anlisis e implantacin de un Sistema de Produccin que emplea una

    herramienta Data Mining para el pronstico de produccin en la empresa de

    calzados DUKE S.A.C. Arequipa, 2015

    Presentado por:

    Ventura Mamani Wily

    Curso: Seminario de Tesis I

    Dcimo Ciclo

    Profesor asesor: Ing. Adin Snchez Snchez

    Arequipa Per 2015

  • 2

    Dedicatoria

    A DIOS

    A NUESTROS PADRES

  • 3

    Agradecimiento

    A todas las personas que de

    uno u otro modo colaboraron

    en la realizacin de este

    trabajo, en especial a la

    Empresa donde se hizo el

    estudio, que accedi y

    cooper del mismo.

  • 4

    Resumen

    El proyecto que se presenta en este documento tiene como objetivo exponer el flujo de

    procesos o serie de pasos que se realiza en un proceso de implantacin de un ERP y

    en un proceso algortmico de Data Mining; se realiza lo antes mencionado porque la

    empresa a la que se aplicar ambos conjuntos de procesos necesita ordenar su

    informacin en el rea de ventas y obtener informacin que beneficie a la empresa

    respecto a cmo se comportan sus clientes cuando compran en todo un periodo de

    tiempo. Para que el objetivo final del proyecto se cumpla, se usaron herramientas de

    software, herramientas de planificacin y de organizacin, estas ltimas se usaron

    porque son herramientas estandarizadas y aceptadas internacionalmente en sus

    respectivos campos; adems, sirvieron eficientemente para su propsito porque son

    una gua de pasos detalladas y especficas para cada actividad que se necesitaba en

    el proyecto. Con respecto a las herramientas software usadas, estas fueron

    seleccionadas mediante una comparacin de criterios, las cuales eran necesarias por

    los requerimientos y necesidades planteadas en la justificacin y viabilidad del

    proyecto.

    La planificacin y el planteamiento de objetivos generales y especficos con sus

    respectivos mtodos y actividades, ayudaron a mantener una idea clara y concisa de

    lo que se pretenda realizar desde los inicios del proyecto.

  • 5

    ndice

    Introduccin ...................................................................................................................................... 9

    Captulo I: Planteamiento del problema ..................................................................................... 10

    1.1 Descripcin del problema ............................................................................................. 10

    1.2 Formulacin del Problema ........................................................................................... 10

    1.3 Objetivos de la Investigacin ....................................................................................... 11

    1.3.1 Generales ............................................................................................................... 11

    1.3.2 Especficos ............................................................................................................. 11

    1.4 Justificacin y Delimitacin del problema de investigacin .................................... 11

    1.4.1 Justificacin ............................................................................................................ 11

    1.4.2 Delimitacin de la investigacin .......................................................................... 12

    1.5 Hiptesis ......................................................................................................................... 13

    1.6 Variables de estudio ...................................................................................................... 13

    1.6.1 Variable Dependiente ........................................................................................... 13

    1.6.2 Variable Independiente ......................................................................................... 13

    1.6.3 Indicadores ............................................................................................................. 13

    Captulo II: Marco Terico ............................................................................................................ 14

    2.1 Marco de referencia de la Investigacin .................................................................... 14

    2.2 Data Minig ....................................................................................................................... 15

    2.2.1 Concepto ..................................................................................................................... 15

    2.2.2 KDD, Descubrimiento de Conocimiento en Bases de Datos (Knowledge

    Discovery Database) ................................................................................................................. 20

    2.2.3 Herramientas utilizadas ............................................................................................ 21

    Captulo III: Planteamiento Operacional .................................................................................... 27

    3.1. Planteamiento Metodolgico ....................................................................................... 27

    3.2. Tipo de estudio .............................................................................................................. 27

    3.3. Poblacin ........................................................................................................................ 28

    3.4. Muestra ........................................................................................................................... 28

    3.5. Tcnica de recoleccin de datos ................................................................................. 28

    3.6. Estudio de Factibilidad .................................................................................................. 29

    3.6.1. Factibilidad Tcnica ................................................................................................... 29

    3.6.2. Factibilidad Operativa ............................................................................................... 30

    3.6.3. Factibilidad Econmica ............................................................................................. 30

  • 6

    3.6.3.1. Determinacin del costo del sistema .................................................................. 30

    3.6.3.2. Determinacin del costo del sistema .................................................................. 35

    3.6.3.3. Desarrollo del VAN y TIR ..................................................................................... 36

    3.7. Proceso de rea de Produccin ................................................................................. 39

    3.8. Cronograma de Actividades ......................................................................................... 40

    Captulo IIII: Resultados ............................................................................................................... 41

    Parte estadstica e interpretacin de la produccin de calzados DUKE durante el ao

    2014. ............................................................................................................................................ 41

    Comparacin de Datos estadsticos tanto de produccin como de ventas de todos los

    modelos durante el ao 2014 .................................................................................................. 50

    Conclusiones .................................................................................................................................. 52

    Bibliografa ...................................................................................................................................... 53

    Anexos.............................................................................................................................................. 54

    Matriz de Consistencia56

  • 7

    ndice De Figuras

    Figura 1 Proceso de Dataminig (Usama, Piatetsky, & Smyth, 1996) .................................... 16

    Figura 2. Tipo de estudio .............................................................................................................. 27

    Figura 3. Esquema Costo beneficio ........................................................................................... 36

    Figura 4. Proceso De produccin de calzados ......................................................................... 39

    Figura 5. Diagrama de Gantt ....................................................................................................... 40

    Figura 6. Modelo DJ001 confeccionados durante un ao ..................................................... 41

    Figura 7. Modelo DJ002 confeccionados durante un ao ...................................................... 42

    Figura 8. Modelo DJ003 confeccionados durante un ao ...................................................... 42

    Figura 9. Modelo DJ004 confeccionados durante un ao ...................................................... 43

    Figura 10. Modelo DJ005 confeccionados durante un ao .................................................... 44

    Figura 11. Modelo DJ001 vendidos durante un ao ................................................................ 45

    Figura 12. Modelo DJ002 vendidos durante un ao ................................................................ 46

    Figura 13. Modelo DJ003 vendidos durante un ao ................................................................ 47

    Figura 14. Modelo DJ004 vendidos durante un ao ................................................................ 48

    Figura 15. Modelo DJ005 vendidos durante un ao ................................................................ 49

    Figura 16. Modelos producidos durante el ao ........................................................................ 50

    Figura 17. Modelos vendidos durante el ao ............................................................................ 50

  • 8

    ndice de Tablas

    Tabla 1 Comparacin entre herramientas data minig.............................................................. 26

    Tabla 2. Requerimiento de Hardware ........................................................................................ 29

    Tabla 3. Requerimiento de Software .......................................................................................... 30

    Tabla 4. Personal desarrollo del proyecto ................................................................................. 31

    Tabla 5. Costo de Hardware ........................................................................................................ 32

    Tabla 6. Costo de Software para la implementacin .............................................................. 32

    Tabla 7. Costo de Software para el funcionamiento ................................................................ 33

    Tabla 8. Costos de Suministro .................................................................................................... 33

    Tabla 9. Costos de Servicios ....................................................................................................... 34

    Tabla 10. Valor de desecho del Equipo ..................................................................................... 34

    Tabla 11. Resumen de Costos .................................................................................................... 35

    Tabla 12. Costo del sistema .............................................................................................................. 35

    Tabla 13. Cuadro Resumen Costo Beneficio o Flujo de caja ................................................. 36

    Tabla 14. Cuadro VAN y TIR ....................................................................................................... 38

  • 9

    Introduccin

    Cuando se plantea el realizar un trabajo de investigacin sobre Anlisis e implantacin de

    un Sistema de Produccin que emplea una herramienta Data Mining para el pronstico

    de produccin en la empresa de calzados DUKE S.A.C., se debe tener en cuenta el

    hecho de que hablar de dicha investigacin implica tener que adquirir ciertos

    conocimientos sobre el dominio de Minera de Datos (Data Mining), para obtener un

    modelo provechoso para el pronstico de produccin de calzados.

    El presente trabajo tiene por objetivo mostrar el enfoque de implementacin de Data

    Minig para la mejora los niveles de eficiencia, productividad y que en realidad, las

    experiencias as denominadas no obedecen a los preceptos de dicho enfoque, sino que

    de hecho tienen ms parecido con una solucin organizativa ya madura denominada

    diseo de sistemas de informacin, cuyos fundamentos se basan, en suma, en una

    filosofa que promueve el aprovechar la experiencia y conocimiento del personal e

    integrarlo con los nuevos desarrollos tecnolgicos.

    El siguiente trabajo de investigacin est estructurado de la siguiente manera: Como

    primer captulo trataremos el planteamiento del problema en lo cual sealaremos la

    descripcin, Interrogantes, objetivos, justificacin, hiptesis de la investigacin y variables

    de estudio. Como segundo captulo que consta del marco terico en este captulo se

    menciona los antecedentes de investigacin y definicin de marco terico. Seguidamente

    trataremos el tercer captulo que consta del planteamiento operacional, en este captulo

    se tratara la metodologa de Investigacin, poblacin y muestra, tcnicas e instrumentos

    de recoleccin de datos y el estudio de factibilidad. Finalmente se dar a conocer los

    resultados de la investigacin.

  • 10

    Captulo I: Planteamiento del problema

    1.1 Descripcin del problema

    En la actualidad, muchas de las empresas que elaboran calzado utilizan un sistema

    transaccional, pero el uso de un software no siempre es suficiente para alcanzar los

    objetivos del negocio, la automatizacin de procesos mediante sistemas de informacin

    puede ayudar a agilizar muchos procesos. Pero, algunos procesos no pueden ser

    completamente automatizados, ya que por naturaleza dependen de decisiones tomadas

    por personal de la empresa. Se han identificado dos problemas en torno a los cuales se

    buscarn soluciones:

    Manejo ineficiente de la informacin de produccin.

    El pronstico de produccin que la empresa realiza es segn a fechas del ao

    haciendo que sus pronsticos no sean certeros teniendo como consecuencia

    que la produccin se realice de forma desordenada.

    En el primer problema, la empresa posee un registro de produccin en documentos

    (Orden de produccin). El pronstico que la empresa realiza es segn a fechas del ao lo

    que hace que sus pronsticos no sean certeros produciendo ms de lo que se debe o en

    ocasiones fallando en sus pronsticos produciendo perdidas. Segn Andrs Paye

    Huanca, quien trabaja en el rea de produccin y realiza el planeamiento de la

    distribucin de la materia prima, se debe realizar anualmente un pronstico de produccin

    para ms de mil productos. Lo cual se hace un poco difcil por la cantidad de modelos

    que produce dicha empresa.

    1.2 Formulacin del Problema

    - Qu criterios de negocio usa la empresa para realizar su produccin?

    - Cul es la probabilidad de que la produccin de calzados sea aceptable

    aplicando data minig?

    - Cmo aplicar la herramienta data ming en la empresa de calzados DUKE?

  • 11

    1.3 Objetivos de la Investigacin

    1.3.1 Generales

    Analizar, disear e implantar un sistema de produccin en la empresa de calzados

    DUKE S.A.C que emplee herramientas Data Mining para el pronstico de produccin.

    1.3.2 Especficos

    o Seleccionar e implantar un software de cdigo abierto para controlar la

    informacin en el rea de produccin.

    o Identificar los criterios de negocio que la empresa usa para realizar su

    produccin.

    o Realizar una limpieza de datos de la base de datos (Data Cleaning), con el fin

    de que el proceso de Data Mining pueda tener datos de entrada adecuados.

    o Adaptar un algoritmo de rboles de Decisin que pueda pronosticar la

    produccin de calzados.

    1.4 Justificacin y Delimitacin del problema de investigacin

    1.4.1 Justificacin

    A medida que la empresa de calzados Duke S.A.C va progresando, siempre busca

    mejoras que ayuden a facilitar el pronstico de produccin, mediante un estndar. Para

    orientar los cambios deseados al xito y mejora de la empresa es necesario evaluar el

    proceso de trabajo que se cuenta o se ha implementado hasta el da.

    Los problemas planteados en el proyecto son: manejo ineficiente de la produccin que se

    realizan y el pronstico de produccin que la empresa realiza. Para el primer problema, el

    rea de produccin requiere que muchos de sus procesos sean automatizados, para la

    implantacin del software de dichas reas. Se pudo haber seleccionado cualquier

  • 12

    herramienta del mercado actual que permita automatizar muchos de los procesos; sin

    embargo, un software como el ERP permite una prospeccin a futuro, porque se puede

    llegar a automatizar otros procesos de la empresa que en un futuro requieran un cambio

    y que este se pueda dar de manera integrada; es decir, que la empresa llegar a usar un

    solo software, evitando conflictos por el uso de distintas herramientas de software. Para

    el segundo problema mencionado, estos se puede solucionar, con los resultados que se

    obtendrn del proceso algortmico de Data Mining y una adecuada gestin de produccin

    (esto ltimo depende netamente de la empresa).

    La eleccin e implementacin de un mtodo adecuado de pronsticos siempre ha sido

    un tema de gran importancia para la empresa. Se utilizan los pronsticos de forma

    emprica. Un error en el pronstico de produccin podra dejar a la empresa sin

    productos necesarios para su posterior venta, o podra generarle un inventario demasiado

    grande. En ambos casos, el pronstico errneo disminuye las utilidades de la empresa.

    Con lo expuesto en el presente proyecto, se puede realizar otras investigaciones para

    pronosticar la produccin con diferentes herramientas como data marth o big data, que

    esta relacionada con Data Mining.

    1.4.2 Delimitacin de la investigacin

    La presente investigacin se realizara acerca de la demanda del sector de produccin de

    calzados deportivos, especficamente para una empresa de produccin localizada en la

    ciudad de Arequipa, el pronstico de produccin se llevara a cabo para la lnea de

    calzados deportivos. La empresa donde se desarrollara el estudio y sus respectivas

    pruebas es DUKE SAC en un tiempo estipulado de mayo a diciembre del ao 2015.

  • 13

    1.5 Hiptesis

    Ser posible obtener un pronstico de produccin de calzados analizando e

    implementando un sistema de produccin que emplea una herramienta data Mining

    aplicando la tcnica rbol de decisin.

    1.6 Variables de estudio

    1.6.1 Variable Dependiente

    Pronostico de Produccin

    1.6.2 Variable Independiente

    Data Minig

    1.6.3 Indicadores

    Variable Dependiente Indicadores

    Criterios de negocio

    Pronostico de produccin Criterios de produccin

    Procesos de produccin

    Compradores o Consumidores

    Venta de productos

    Variable Independiente Indicadores

    Recoleccin de datos iniciales

    Data Minig Descripcin de los datos

    Exploracin de los datos

    Verificar la calidad de los datos

    Limpieza y construccin de nuevos datos

    Evaluacin de Resultados

  • 14

    Captulo II: Marco Terico

    2.1 Marco de referencia de la Investigacin

    Ttulo: implementacin de un sistema de ventas que emplea una herramienta de data

    ming

    Autor: Ing. Miguel ngel Berrospi Ramrez.

    Ao: 2012

    Procedencia: Pontificia Universidad Catlica del Per, Per.

    Fuente: Tesis

    Resumen: El proyecto que se presenta en este documento tiene como objetivo

    exponer el flujo de procesos o serie de pasos que se realiza en un proceso de

    implantacin de un ERP y en un proceso algortmico de Data Mining; se realiza lo

    antes mencionado porque la empresa a la que se aplicar ambos conjuntos de

    procesos necesita ordenar su informacin en el rea de ventas y obtener informacin

    que beneficie a la empresa respecto a cmo se comportan sus clientes cuando

    compran en todo un periodo de tiempo.

    Para que el objetivo final del proyecto se cumpla, se usaron herramientas de software,

    herramientas de planificacin y de organizacin, estas ltimas se usaron porque son

    herramientas estandarizadas y aceptadas internacionalmente en sus respectivos

    campos; adems, sirvieron eficientemente para su propsito porque son una gua de

    pasos detalladas y especficas para cada actividad que se necesitaba en el proyecto.

    Con respecto a las herramientas software usadas, estas fueron seleccionadas

    mediante una comparacin de criterios, las cuales eran necesarias por los

    requerimientos y necesidades planteadas en la justificacin y viabilidad del proyecto.

    Ttulo: Data ming aplicado al marketing y comportamiento de consumo

    Autor: Ing. Santiago Gonzlez Tortosa.

  • 15

    Ao: 2008

    Procedencia: Universidad Politcnica de Madrid, Espaa.

    Fuente: Tesis

    Resumen: El proyecto surge, en la empresa MDS Boole, por la necesidad de explorar

    y desarrollar el conocimiento individual de los consumidores, el cual, se ha convertido

    en uno delos principales objetivos en la mayora de las empresas que desean orientar

    sus actividades de marketing de forma ms eficaz y rentable.

    La falta de informacin sobre nuestros propios clientes, y sobre los consumidores en

    general, es un importante obstculo que impide saber ms acerca de los potenciales

    consumidor es a nivel individual. En el mejor de los casos, aquellas empresas que

    desarrollan sus actividades directamente con el consumidor, disponen de una

    informacin transaccional muy importante pero, en la mayora de los casos,

    desconocen los aspectos descriptivos de cmo son sus clientes. Por el contrario, las

    empresas que desarrollan sus actividades a travs de un canal de distribucin sobre

    el que no tienen control directo, la transaccin es annima y el conocimiento sobre el

    transaccional de los clientes a nivel individual es inexistente.

    2.2 Data Minig

    2.2.1 Concepto

    Es un proceso no trivial que tiene como entrada datos y como salida Informacin, en este

    proceso se hace un anlisis detallado a travs del uso de algoritmos para descubrir

    patrones o comportamiento de los datos. (Weiss & Davison, 2010)

  • 16

    Figura 1 Proceso de Dataminig (Usama, Piatetsky, & Smyth, 1996)

    El Proceso de Data Mining de la Figura 1.2 es el que se defini en 1996 por

    Fayyad, Piatetsky- Shapiro y Smyth, como se puede apreciar consta de 4

    subprocesos: Seleccin, Pre-procesamiento, Transformacin y la parte

    algortmica. (Weiss & Davison, 2010).

    Para poder hacer el proceso de dataming Gary M. Weiss y Brian D. Davison

    toman en cuenta que:

    Los datos son ingresados al proceso de Seleccin, bsicamente para poder

    seleccionar solo los datos tiles que sirven para el siguiente proceso,

    Preprocesamiento de la data.

    Luego los datos entran al proceso de transformacin, donde se eleva la calidad de

    los datos para que queden listos para entrar en el proceso final del algoritmo; si

    bien no muchos toman al proceso de transformacin como relevante, este es

  • 17

    sumamente importante en todo el proceso de Data Mining, ya que sin estos no se

    obtienen datos de alta calidad.

    Finalmente, tenemos el ltimo proceso, el cual incluye el uso de algoritmos

    computacionales para hallar patrones en la data y finalmente generar

    conocimiento.

    El proceso de Data Mining utiliza algoritmos; sin embargo, para poder usarlos

    correctamente se requiere de la definicin de variables para hallar el

    comportamiento de patrones.

    El proceso de Data Mining es comparado con KDD (Knowledge Discovery in

    Databases), muchas de estas comparaciones establecen que ambos trminos so

    lo mismo y otros establecen que son diferentes; es decir, que KDD este

    superpuesto a Data Mining. (Usama, Piatetsky, & Smyth , 1996).

    Data Mining es usado usualmente por los estadsticos, analistas y por los

    administradores de sistemas de informacin como el proceso de descubrimiento;

    mientras, que el trmino KDD es utilizado por los especialistas en inteligencia

    artificial. (Usama, Piatetsky, & Smyth , 1996).

    Data Mining puede ser realizado sobre un Data Warehouse o sobre una base de

    datos transaccional (para el presente proyecto se realizar sobre una base de

    datos transaccional). En el primer caso, los datos estn pulidos por los procesos

    anteriores del Data Warehouse; sin embargo, en el segundo caso, no se presenta

    un proceso previo de limpieza de datos, por lo cual es indispensable.

    Valores Perdidos

    Se llaman as porque son un conjunto de datos guardados en una base de datos,

    la cual posee un registro incompleto de algunos o todos los campos necesarios

  • 18

    para el Data Mining; es decir, se posee atributos en blanco ya que no fueron

    llenados. (Han & Kamber, 2006).

    Segn (Han & Kamber, 2006) para combatir este problema deberemos de tomar

    en cuenta:

    Ignorar el registro de datos, este mtodo no es muy efectivo; adems solo

    puede ser aplicable cuando la cantidad de datos en el registro es muy

    baja, si es el caso contrario no se recomienda su uso, porque se llegara a

    perder gran cantidad de datos valiosos. (Han & Kamber, 2006)

    Rellenar los datos faltantes manualmente, consume mucho tiempo y no es

    recomendable para registros con gran cantidad de datos faltantes. (Han &

    Kamber, 2006)

    Uso de una constante global para rellenar los valores faltantes, reemplazar

    los valores de los atributos sin datos con etiquetas, Desconocido, este

    mtodo puede afectar el proceso de Data Mining, ya que el algoritmo

    puede darle otro significado a estas etiquetas. (Han & Kamber, 2006)

    Usar el valor ms probable para rellenar el valor faltante, hacer uso de

    regresin, formalismo de Bayes y rbol de decisiones para predecir los

    valores faltantes en los registros de datos. (Han & Kamber, 2006).

    Datos Ruidosos

    Se define como un error aleatorio o en varianza para un valor medible; es decir

    que si el precio de un producto oscila entre 10 dlares y 20 dlares y hay uno que

    esta fuera de ese rango, este ltimo es considerado dato ruidoso; se puede

    combatir suavizando los datos, para esto existen tcnicas. (Han & Kamber, 2006)

    Algunas de estas son:

  • 19

    Binning, este mtodo ordena los datos con consultas a los vecinos ms

    cercanos, luego son separados en grupos llamados bins o buckets de

    igual tamao y luego los valores medios de los grupos son reemplazados

    por el valor ms significativo del grupo, por valores de los extremos o por

    l, valor que se encuentre en el medio del grupo; mientras ms grande sea

    el grupo hay una mejor aproximacin. (Han & Kamber, 2006)

    Regresin: este mtodo consiste en encontrar la mejor lnea que une a

    dos atributos, del resultado se puede predecir el comportamiento de los

    siguientes atributos, los que estn muy dispersos del comportamiento de la

    lnea de regresin lineal son aislados. (Han & Kamber, 2006)

    Clustering, este mtodo consiste en agrupar datos en conjuntos o

    clusters clasificados por la similitud de los datos, los valores que caen

    fuera del rango de los clusters son aislados. (Han & Kamber, 2006)

    Limpieza de datos (Data Cleaning)

    Segn (Han & Kamber, 2006) la limpieza de datos:

    Es un proceso muy grande, abarca Valores Perdidos y datos ruidosos; sin

    embargo, estos dos problemas no son los nicos que se presentan en este

    proceso; el primer paso para poder realizar una limpieza de datos es identificar las

    discrepancias, estas pueden ser causadas por un pobre diseo de datos, errores

    deliberados, decaimiento de data (datos no actualizados), etc. (HAN & KAMBER,

    2006)

    Para poder analizar estos problemas, se requiere tener conocimiento de metadata

    (estructura de datos); es decir, se requiere el dominio de los tipos de datos,

    valores aceptables de los atributos, si alguno de los valores de los atributos cae

    fuera del rango aceptable, existen dependencias entre los atributos, etc. (HAN &

    KAMBER, 2006) A partir de esto, se puede realizar scripts para procesar estos

  • 20

    problemas; luego, con los datos ya procesados se deben crear reglas para poder

    ver los detalles de la estructura de los datos; es decir, formatos de fechas,

    monedas, etc.

    (HAN & KAMBER, 2006)

    El segundo paso es la transformacin de los datos, en este paso se debe

    transformar los datos segn las reglas definidas en el paso anterior, para poder

    tener as formatos uniformes de datos y el proceso de algoritmia pueda procesar

    datos limpios. (HAN & KAMBER, 2006).

    2.2.2 KDD, Descubrimiento de Conocimiento en Bases de Datos

    (Knowledge Discovery Database)

    Segn (Usama, Piatetsky, & Smyth , 1996) el KDD es un proceso no trivial para

    identificar patrones de datos vlidos, originales, potencialmente usables y

    entendibles y Hand (1998) lo defini como un proceso secundario de anlisis de

    datos de una gran base de datos.

    Entonces se puede definir al KDD como un proceso no trivial de extraccin de

    informacin a partir de datos. (Maimom & Rokach, 2010). Este proceso de

    extraccin conlleva al uso de algoritmos para el anlisis de los datos, tambin

    conocido como Data Mining; es decir, Data Mining es una de las fases del KDD.

    (Maimom & Rokach, 2010)

    EL KDD tiene varias fases las cuales se mencionan a continuacin:

    Desarrollo y entendimiento del dominio de la aplicacin, el conocimiento

    relevante y lo objetivos del usuario final.

    Seleccin del conjunto de datos a ser procesados.

  • 21

    Realizar el Pre - procesamiento de datos, en esta fase se realizan las

    operaciones de Reduccin de Dimensiones, limpieza de datos y

    transformacin de datos.

    Escoger la apropiada tarea de Data Mining: clasificacin, regresin,

    agrupacin y resumen de los datos; segn la eleccin hecha se podr

    escoger el algoritmo en la siguiente fase.

    Escoger el algoritmo de Data Mining, esto consiste en escoger el mtodo

    adecuado para buscar patrones en los datos.

    Evaluacin e interpretacin de los patrones a usar.

    Consolidacin del conocimiento descubierto, lo cual consiste en incorporar

    el conocimiento en el funcionamiento del sistema para prever una accin

    futura y finalmente documentar el conocimiento adquirido en el proceso.

    Las fases definidas anteriormente sirven para una gua adecuada en cualquier

    proyecto que est relacionado con Knowledge Discovery in Databases, el cual a

    veces es confundido y es relacionado al Data Mining como el mismo proceso.

    (Maimom & Rokach, 2010).

    2.2.3 Herramientas utilizadas

    Para el presente proyecto se utilizan dos tipos de herramientas; por un lado, un

    software que facilite y automatice el proceso de produccin; por otro lado, una

    herramienta de software que facilite el proceso de Data Mining.

    Las herramientas presentadas a continuacin no estn hechas a la medida exacta

    de la empresa de calzados; por esto, se realizar una adaptacin de estas

    herramientas al modelo produccin de calzado de la empresa, esto permitir que

    la comunicacin entre ambas herramientas pueda ser mucho ms fluida y as

    puedan cumplir con el objetivo principal del proyecto.

  • 22

    Herramientas de Software para produccin

    El proyecto necesita una herramienta de software que permita realizar las

    operaciones de produccin; adems, debe ser de fcil uso, y que permita el

    manejo de costos de produccin; adicionalmente a todo esto, el software debe ser

    de cdigo abierto, a continuacin se detallan los productos que se evaluaron:

    ADempiere

    Es un ERP completo, que integra todas las funciones de una empresa:

    Administracin de la Cadena de Suministros, Logstica, produccin, Ventas,

    Anlisis de Rendimiento, Administracin de relaciones con Clientes, Contabilidad

    y produccin. (ADEMPIERE, 2012) A continuacin se detallan algunas de sus

    principales caractersticas:

    ADempiere est diseado en los procesos de negocio y no en la

    arquitectura contable y departamental tradicional, lo que hace ms fluida la

    interaccin entre los procesos y por ende ms dinmica.

    Es de cdigo abierto (open source).

    Permite administrar costos de produccin.

    Es un ERP y CRM, lo que permite un manejo de relaciones con los clientes

    para poder satisfacer sus necesidades.

    Sviw32

    Es un software de Punto de Venta, lo que permite el registro con cdigo de barras

    (ALBARRAN, 2012), a continuacin se presentan algunas de sus principales

    caractersticas:

    Toma un control completo del inventario.

    Registra las actividades de cada empleado.

  • 23

    Trabaja con sistemas operativos: Unix, Linux y Windows.

    Openbravo

    Es uno de los ERP ms conocidos en la actualidad, mejora los procesos de

    negocio e incrementa la productividad y la agilidad del negocio(OPENBRAVO,

    2012); a continuacin se detallan algunas caractersticas de este ERP:

    Posee un diseo multi-tabla (muestra diferentes tipos de datos en una sola

    tabla; es decir, cruza informacin de diferentes tipos de datos) que permite

    una interaccin ms amigable con el usuario.

    Posee una arquitectura acondicionada para trabajar con Servidor, Base de

    datos y clientes.

    OpenERP

    Es el ERP open source lder en la actualidad; adems permite la integracin de

    los procesos de las reas de mayor demanda en empresa. (OpenERP, 2012)A

    continuacin se detallan algunas caractersticas:

    Permite un seguimiento de campaas de produccin.

    Permite gestionar almacenes de forma fcil e intuitiva, mediante grficos y

    tablas dinmicas.

    Luego de revisar los productos existentes, se opt por el software Open ERP

    como sistema transaccional para el rea de produccion, ya que es una

    herramienta de cdigo abierto que permite administrar de manera ptima los

    productos y hacer un registro de produccion actualizado, y adems brinda una

    interaccin ms amigable al usuario al realizar una produccion. Este ltimo

    aspecto permite un fcil aprendizaje y manejo de la herramienta software por

  • 24

    parte de los usuarios del rea de produccion, y es el factor determinante para la

    eleccin del OpenERP sobre el resto de herramientas de software presentadas

    Herramientas de Data Mining

    SQLServer Data Mining 2008

    La familia de SQLServer es una de las ms usadas en la actualidad y en la familia

    de productos para Inteligencia de negocios se integr una herramienta para Data

    Mining (MICROSOFT, 2012), a continuacin se presentan algunas de sus ms

    resaltantes caractersticas:

    de decisiones,

    redes neuronales, regresin lineal, regresin logstica, etc.

    Permite visualizar los modelos de Data Mining para optimizar la

    representacin de datos.

    Provee herramientas ETL para la limpieza y transformacin de datos.

    Permite una interaccin con la interfaz grfica agradable para el usuario,

    de modo que pueda entender la informacin procesada de manera rpida.

    Pentaho Data Mining (Weka)

    Esta herramienta se integra con las otras soluciones de la plataforma Pentaho, lo

    que la hace an ms inteligente (PENTAHO, 2012); tambin posee soporte para

    integracin de datos, anlisis, dashboards y reportes; a continuacin se detallan

    algunas caractersticas:

    Motor poderoso para manejo de grandes volmenes de datos.

    Posee una gran coleccin de algoritmos confiables y robustos.

    Relaciones eficientes y capacidad de descubrir patrones de datos.

    Integracin simple y acelerada de datos.

  • 25

    Knowledge Seeker

    Es un producto de inteligencia de negocios con Data Mining para poder predecir y

    anticipar escenarios; adems posee funcionalidad de diseo de estrategia

    (ANGOSS, 2012), entre sus principales caractersticas se tiene:

    Es flexible, una herramienta poderosa que permite interactuar los usuarios

    de forma fcil; adems, posee arboles de decisin, arboles de estrategias

    (comparacin de estrategias con mltiples variables de decisin).

    Permite importar y exportar datos de Excel, SAS, SPSS y otros sistemas

    de bases de datos.

    Permite la transformacin de datos usando expresiones SQL.

    dVelox Enterprise

    Permite automatizar los procesos de toma de decisiones de sus procesoscrticos,

    ofrece a los usuarios de negocio predicciones precisas de forma sencilla (APARA,

    2012); a continuacin se presentan algunas de sus caractersticas:

    Analiza escenarios complejos como la prevencin de fraude, retencin de

    clientes y encuentra patrones de comportamiento y determina

    probabilsticamente la mejor opcin para dicho escenario.

    No requiere conocimientos avanzados de matemticas, ni estadstica para

    obtener el mximo rendimiento.

    MicroStrategy Data Mining Services

    Es una componente de la plataforma MicroStrategy BI que brinda resultados de

    modelos predictivos; adems, brinda reportes dinmicos (MICROSTRATEGY,

    2012); a continuacin se detallan algunas caractersticas de esta solucin:

  • 26

    Predice clculos usando funciones analticas, las cuales incluyen:

    Regresin lineal, Regresin lgica, rbol de decisiones, reglas de modelos

    asociados y modelo de series.

    Crea reportes predictivos, flexibles, organizados para que el usuario los

    pueda entender fcilmente y tambin para que las presentaciones sean

    profesionales.

    Implementa un esquema de seguridad estricta para los usuarios que se

    encuentran dentro y fuera de la organizacin.

    De todos los productos comparados en el punto de herramientas de data Mining

    se eligi la herramienta Pentaho Data Mining (Weka), ya que ha cumplido con

    todos los criterios de seleccin que se requieren para el presente proyecto,

    Adems, cabe resaltar que en el presente proyecto se hace nfasis en el uso de

    herramientas de cdigo abierto, ya que no se cuenta con presupuesto para

    adquirir licencias.

    Es una

    herramienta de

    cdigo abierto

    Posee una amplia

    gama de

    algoritmos para

    trabajar

    Trabaja con

    distintas

    bases de

    Datos.

    Permite la limpieza,

    integracin y

    transformacin de datos

    Se realizan continuas

    actualizaciones sobre

    las funcionalidades del

    Software

    Puntuacin

    Knowledge

    Seeker 0 0 3 0 2 5dVelox

    Enterprise 0 0 3 3 2 8

    MicroStrategy

    Data Mining 0 1 3 3 2 9SQL Server

    Data 0 1 3 3 2 9

    Mining 2008

    Pentaho Data

    Mining 5 1 3 3 0 12

    (Weka)

    Tabla 1 Comparacin entre herramientas data minig

  • 27

    Captulo III: Planteamiento Operacional

    3.1. Planteamiento Metodolgico

    El siguiente trabajo de investigacin est dentro del paradigma positivista, el tipo

    de investigacin segn la finalidad es aplicada, segn la temporalidad es

    seccional o sincrnica, segn la Amplitud es micro investigacin y segn el

    mbito es de campo.

    3.2. Tipo de estudio

    De acuerdo al alcance de ejecucin del diseo de investigacin es:

    Descriptiva

    Cuasi Experimental

    DONDE:

    M=Muestra

    O1=Variable Independiente

    O2=Variable Dependiente

    M

    O1

    O2 Figura 2. Tipo de estudio

  • 28

    3.3. Poblacin

    Como poblacin se tom la produccin de enero a diciembre del ao 2014 de

    calzados de damas que fueron en total de 15719 pares de calzados solo para damas

    de la empresa Duke S.A.C

    3.4. Muestra

    El muestreo se realiz de forma aleatoria en la cual se tomaron 30 muestras de

    tamao 20 del total de 15719 pareces de calzados solo para damas de la empresa

    Duke S.A.C

    Para poder hallar la muestra de nuestra poblacin aplicamos una formula

    estadstica

    Dnde:

    Margen de error e: 0.05

    Tamao de la poblacin N: 15719

    Desviacin estndar o: 0.5

    Nivel de confianza Z: 95%

    3.5. Tcnica de recoleccin de datos

    Siguiendo los pasos de una investigacin cientfica aplicada, precisamos

    encontrar los medios de recoleccin de informacin para luego procesarlas,

    analizarlas y posteriormente extraer las conclusiones sobre la base de la

    informacin recolectada, aplicando las tcnicas e instrumentos pertinentes como

    =N x 22

    2( 1) + 22

    =15719 x 0.521.962

    0.052(15719 1) + 0.521.962

    = 375

  • 29

    la observacin, la encuesta, revisin documental y tcnicas estadsticas. Par

    poder ver ms a fondo de que se trat la recoleccin de datos ver anexos

    3.6. Estudio de Factibilidad

    3.6.1. Factibilidad Tcnica

    Requerimiento de Hardware

    El equipo con el que se desarrollara el proyecto tiene las siguientes

    caractersticas

    Tabla 2. Requerimiento de Hardware

    Marca: Gigabyte Modelo: ---------------------

    Placa Madre: H81 ds2 asus

    Procesador: Intel Core i3 4460 3.40 Ghz

    Disco Duro: 500 Seagate (7200 RPM)

    Memoria RAM: 4 GB KINGSTON DDR3

    Video: Pci Express Integrado

    Sonido: Integrado 7.1 Red: Tarjeta de red

    10/100/1000 incorporado

    Case ATX: Avatec 650 watts reales Floppy:

    Multi DVD: Combo 24X LG Card Reader: ------------------------------

    Monitor: 18 lg o samsung

    Teclado: Multimedia Mouse: ptico

    Woofer: Escritorio Estabilizador: Forza

  • 30

    Requerimiento de Software

    Por otro lado con el software con el que se cuenta

    Tabla 3. Requerimiento de Software

    Software Versin

    Sistema Operativo Windows 8.1 8.1

    Microsoft Office Word y Excel 2010

    Leguaje de programacin

    NetBeans

    8.0.2 8.0.2

    Servidor base de datos Mysql 5.3 5.3

    Realizar diagramas StarUML 2.3.0

    Antivirus Nod 32 7.0302

    Weka 3.7.3

    3.6.2. Factibilidad Operativa

    Para el desarrollo del presente proyecto, se cuenta con los conocimientos

    necesarios en materia de Data Minig (minera de datos) y desarrollo de software,

    as como en las maneras de las metodologas de KDD (Knowledge Discovery

    data). De forma complementaria y no menos importante, se cuenta con la

    asesora de especialistas en la materia, adems del valioso aporte del ingeniero

    del curso de la UTP.

    3.6.3. Factibilidad Econmica

    3.6.3.1. Determinacin del costo del sistema

    Los importes en los que se incurrir en el presente trabajo estn detallados

    a continuacin.

  • 31

    Costo de personal

    Los costos de apoyo sern calculados teniendo en cuenta dos tipos de

    involucrados en el proyecto los cuales son en primera instancia personal

    encargada del desarrollo en si del proyecto de investigacin (jefe de

    proyecto, analista, programador, testeador, diseador).

    Personal de desarrollo en si del proyecto

    Participa en diferentes etapas del proyecto por un determinado tiempo

    nombrando las funciones a continuacin.

    Jefe de proyecto.

    Analista.

    Diseador.

    Programador.

    Testeador.

    Tabla 4. Personal desarrollo del proyecto

    Recursos Humanos

    Numero de

    Meses Tarifa Mensual Total (S/.)

    Jefe de proyecto es el

    analista. 5 S/. 800.00 S/. 4,000.00

    Diseador. 3 semanas S/. 1,000.00 S/. 750.00

    Programador. 2 S/. 1,000.00 S/. 2,000.00

    Testeador. 2 semanas S/. 750.00 S/. 375.00

    TOTAL S/. 7,125.00

  • 32

    Costo de Hardware

    En cuanto a costos para el equipamiento bsico para el funcionamiento

    operativo del sistema

    Tabla 5. Costo de Hardware

    Equipo Cantidad Costo unitario(S/.) Total(S/.)

    CPU 1 S/. 900.00 S/. 900.00

    Monitor 1 S/. 300.00 S/. 300.00

    Impresora 1 S/. 200.00 S/. 200.00

    Kit de dispositivos

    perifricos 1 S/. 80.00 S/. 80.00

    TOTAL S/. 1,480.00

    Costo de Software

    En cuanto al coste de software, es tan igual como el coste del equipo o hardware,

    el cual es, para la implementacin del sistema y costo de software para el

    funcionamiento del mismo.

    Costo de Software para la Implementacin

    Tabla 6. Costo de Software para la implementacin

    Software Cantidad Costo de licencias(S/.) Total(S/.)

    Windows 8.1 1 S/. 500.00 S/. 500.00

    Word y excel 1 S/. 313.83 S/. 313.83

    NetBeans 8.0.2 1 S/. 0.00 S/. 0.00

    Mysql 5.3 1 S/. 0.00 S/. 0.00

    StarUML 1 S/. 0.00 S/. 0.00

    Nod 32 1 S/. 44.38 S/. 44.38

    Weka 1 S/. 0.00 S/. 0.00

    TOTAL S/. 858.21

  • 33

    Costo de Software para el funcionamiento

    Tabla 7. Costo de Software para el funcionamiento

    Costo de Suministro

    En cuanto a suministros bsicos se consideran los siguientes: hojas bond,

    tiles de escritorio, discos, tinta para impresora, memoria de USB.

    Tabla 8. Costos de Suministro

    Suministro Cantidad

    Costo por

    Unidad(S/.) Total(S/.)

    Material de Oficina 1 S/. 10.00 S/. 10.00

    Hojas Bond 1 S/. 12.00 S/. 12.00

    Cartuchos de Impresora 4 S/. 30.00 S/. 120.00

    Memoria USB 1 S/. 20.00 S/. 20.00

    TOTAL S/. 162.00

    Costo de Servicios

    En el siguiente apartado se consideran los gastos de servicios como el

    agua, la luz, transporte y el servicio de internet, viticos.

    software Cantidad

    Costo de

    licencias(S/.) Total(S/.)

    Windows 8.1 1 S/. 500.00 S/. 500.00

    TOTAL S/. 500.00

  • 34

    Tabla 9. Costos de Servicios

    Servicio Cantidad(Mes)

    Costo Estimado al

    Mes Total(S/.)

    Agua 5 S/. 6.00 S/. 30.00

    Luz 5 S/. 15.00 S/. 75.00

    Transporte 5 S/. 28.00 S/. 140.00

    Viticos 5 S/. 80.00 S/. 400.00

    Internet 5 S/. 15.00 S/. 75.00

    TOTAL S/. 720.00

    Resumen de Costos

    En este ltimo apartado se resume todos los costos que sern utilizados

    para el desarrollo del proyecto.

    Tabla 10. Valor de desecho del Equipo

    Costo de Equipo

    S/.

    1,480.00

    Valor de desecho 10%

    Total valor de

    Salvamiento 148

    Valor de depreciacin 370

    Valor de desecho (VD): (1480.00 x 10%)=148.00

    Factor Denominador: (4+ (4*4))/2=10

    Suma a depreciar 1480.00-148.00=1332.00

  • 35

    Luz e internet: (15*12)+(15*12)=360.00 y para cada ao se tomar

    un incremento de 10% sobre el valor de dicho ao.

    Tabla 11. Resumen de Costos

    Criterio Costo Inicial Ao 1 Ao 2 Ao 3 Ao 4

    Personal

    S/.

    7,125.00 ..... ..... ..... .....

    Suministros

    S/.

    162.00 ..... ..... ..... .....

    Software

    S/.

    1,358.21 ..... ..... ..... .....

    S/.

    1,332.00 (4/10) (3/10) 2/10) (1/10)

    Equipo de

    Usuario

    S/.

    1,480.00 S/. 518.00 S/. 388.50

    S/.

    291.38 S/. 218.53

    Servicios

    S/.

    720.00 S/. 360.00 S/. 396.00

    S/.

    435.60 S/. 479.16

    Total S/. 10,845.21 S/. 878.00 S/. 784.50

    S/.

    726.98 S/. 697.69

    3.6.3.2. Determinacin del costo del sistema

    Los beneficios del proyecto se han calculado de una estimacin, en la cual

    se prev que el mejorar la seguridad en sistemas de autenticacin conlleva a

    un aun gasto anual de S/. 4000.00 que representan a 1 persona realizando

    este trabajo ao a ao y beneficios operativos de S/. 500.00 anuales.

    Tabla 12. Costo del sistema

    Actividad Ao 1 Ao 2 Ao 3 Ao 4

    Beneficio econmico

    por uso del sistema S/. 4,000.00 S/.4,000.00 S/. 4,000.00

    VD=S/.148.00+ S/.

    4,000.00

    Beneficio anual

    gastos operativos S/. 500.00 S/. 500.00 S/. 500.00 S/. 500.00

    Total S/. 4,500.00 S/. 4,500.00 S/. 4,500.00 S/. 4,648.00

  • 36

    3.6.3.3. Desarrollo del VAN y TIR

    Tabla 13. Cuadro Resumen Costo Beneficio o Flujo de caja

    Criterio Ao 0 Ao 1 Ao 2 Ao 3 Ao 4

    Beneficio ..

    S/.

    4,500.00

    S/.

    4,500.00 S/. 4,500.00

    S/.

    4,648.00

    Costo S/. 10,845.21

    S/.

    878.00

    S/.

    784.50

    S/.

    726.98

    S/.

    697.69

    Total

    S/. -

    10,845.21

    S/.

    5,378.00

    S/.

    5,284.50 S/. 5,226.98

    S/.

    5,345.69

    Acumulado

    S/. -

    10,845.21

    S/. -

    5,467.21

    S/. -

    182.71 S/. 5,044.27

    S/.

    10,389.96

    Figura 3. Esquema Costo beneficio

    Periodo de reembolso = A+ (B/C)

    Dnde:

    A = Nmero de aos antes del ao de retorno final. (O en otras palabras ltimo

    ao donde existe una diferencia de flujo efectivo acumulado negativo).

    B= Total restante para ser pagado despus de iniciado el ao de reembolso para

    traer el flujo efectivo a 0.0 (Diferencia acumulada del ltimo ao negativo).

    0

    2000

    4000

    6000

    8000

    10000

    12000

    Ao 0 Ao 1 Ao 2 Ao 3 Ao 4

    Beneficio

    Costo

  • 37

    C= Total (neto) reembolsado en el ao de amortizacin completo. (Valor absoluto

    de la diferencia acumulada (el ltimo ao negativo ms el primero positivo)).

    Entonces:

    A=2 (el segundo ao).

    B=182.71 (Flujo acumulado negativo del tercer ao).

    C=5,044.27 (Diferencia acumulada).

    PR=2+ (182.71 /3250.76)

    PR=2.036221333

    Por lo tanto: El retorno del efectivo estar dado en un periodo de 2 aos y 1 da.

    Costo de oportunidad CO= ( ( 1 + i ) * ( 1 + % inflacin anual ) -1 ) * 100

    Dnde:

    i= 16.29% inters promedio del mercado nacional

    Inflacin anual = 3.25%1

    CO= ( ( 1 + 0.1629) * ( 1 + 0.0325 ) -1 ) * 100

    CO=20.069425% entonces se tomar este valor para hallar el valor actual neto

    del proyecto (VAN).

    Desarrollo del valor actual neto

    Desarrollo del TIR (Taza de inters de retorno).

    1 Banco Central de Reserva del Per, Presentacin del Reporte de Inflacin-Junio 2015

    En http://www.bcrp.gob.pe/

  • 38

    Tabla 14. Cuadro VAN y TIR

    Aos Flujos de Caja

    0 S/. -10,845.21

    1 S/. 5,378.00

    2 S/. 5,284.50

    3 S/. 5,226.98

    4 S/. 5,345.69

    VAR S/. 2,891.06

    TIR 34%

    Dado que el Valor Actual Neto (VAN), del proyecto es de S/. 2,891.06 >0 el

    proyecto puede aceptarse y por otro lado la tasa Interna de Retorno es

    34%>20.06% por lo tanto el proyecto ofrecer una rentabilidad mayor que la

    mnima requerida.

  • 39

    3.7. Proceso de rea de Produccin

    Figura 4. Proceso De produccin de calzados

    Inicio

    Recepcionar e

    inspeccionarMater

    iales

    Area de Cortes

    Existe Modelo

    Revisin de Cuero Disear Modelo

    Si No

    Escarlar PiezasRevisin de CueroTroquel o Manual

    Cortar Pieles

    Despastar y

    Repujar

    Aparar Piezas de

    Cuero

    Armar Cortes

    Montar Puntas y

    Talon

    Pegar Plantas

    Rematar o Acabar

    Empacar y

    Almacenar

    Fin

    Recepcin,,

    inspeccin y

    almacenamiento

    de Materiales

    Area de Corte Area de aparado Area de Armado

    rea de ArmadoArea de acabadorea de Empaque

    y almacnFin

    Inicio

    Diagrama de Flujo de Materiales

  • 40

    3.8. Cronograma de Actividades

    Figura 5. Diagrama de Gantt

  • 41

    Captulo IIII: Resultados

    Parte estadstica e interpretacin de la produccin de calzados DUKE

    durante el ao 2014.

    Figura 6. Modelo DJ001 confeccionados durante un ao

    En la empresa de calzados duke de enero a diciembre del ao 2014 el 35 % de zapatos

    fabricados del modelo DJ001 estuvieron entre 88 y 101 pares semanales sin embargo el

    8% estuvieron entre 60 y 73 pares semanales. La empresa fabrica con frecuencia 100

    pares semanales durante el ao con un promedio de 106 pares, el 50 % de los zapatos

    producidos supera los 100 pares.

    8% 11%

    35% 17%

    10%

    11% 8%

    Numero de pares de zapato del modelo DJ001 confeccionados durante un ao

    60 73

    74 87

    88 101

    102 115

    116 129

    130 143

    144 157

  • 42

    Figura 7. Modelo DJ002 confeccionados durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 65 % de zapatos

    fabricados del modelo DJ001 estuvieron entre 60 y 72 pares semanales sin embargo el

    4% estuvieron entre 60 y 72 pares semanales. La empresa fabrica con frecuencia 60

    pares semanales durante el ao con un promedio de 66 pares.

    Figura 8. Modelo DJ003 confeccionados durante un ao

    65%

    25%

    4%

    6%

    Numero de pares de zapato del modelo DJ002 confeccionados

    durante un ao

    60 72

    73 85

    86 98

    99 111

    2%

    6%

    40%

    23%

    25%

    2% 2%

    Numero de pares de zapato del modelo DJ003 confeccionados durante un ao

    0 16

    17 33

    34 50

    51 67

    68 84

    85 101

    102 118

  • 43

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 40 % de zapatos

    fabricados del modelo DJ003 estuvieron entre 34 y 50 pares semanales sin embargo el

    2% estuvieron entre 85 y 101 pares semanales. La empresa fabrica con frecuencia 60

    pares semanales durante el ao con un promedio de 54 pares.

    Figura 9. Modelo DJ004 confeccionados durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 21% de zapatos

    fabricados del modelo DJ004 estuvieron entre 28 y 41 pares semanales sin embargo el

    2% estuvieron entre 84 y 97 pares semanales. La empresa fabrica con frecuencia 60

    pares semanales durante el ao con un promedio de 43 pares. Al parecer es un modelo

    que tiene poca aceptacin por parte del usuario lo cual la empresa debera de descartar o

    cambiar de modelo.

    14%

    12%

    21%

    17%

    21%

    13%

    2%

    Numero de pares de zapato del modelo DJ004 confeccionados durante un ao

    0 13 14 27

    28 41 42 55

    56 69 70 83

    84 97

  • 44

    Figura 10. Modelo DJ005 confeccionados durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 48 % de zapatos

    fabricados del modelo DJ004 estuvieron entre 0 y 22 pares semanales sin embargo el 2%

    estuvieron entre 138 y 160 pares semanales. La empresa fabrica en promedio 32 pares

    durante el ao con lo cual podemos deducimos que el modelo DJ005 no se fabrica

    mucho, no es un modelo que obtenga mucha rentabilidad.

    48%

    23%

    13%

    8% 4%

    2% 2%

    Numero de pares de zapato del modelo DJ005 confeccionados durante un ao

    0 22

    23 45

    46 68

    69 91

    92 114

    115 137

    138 160

  • 45

    Parte estadstica e interpretacin de la venta de calzados DUKE durante el ao 2014

    Figura 11. Modelo DJ001 vendidos durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 22 % de zapatos

    vendidos del modelo DJ001 estuvieron entre 170 y 189 pares semanales sin embargo el

    7% estuvieron entre 50 y 69 pares semanales. La empresa fabrica en promedio 106

    pares durante el ao con lo cual decimos q este modelo es rentable para la empresa.

    7% 9%

    12%

    14%

    17%

    19%

    22%

    Numero de pares de zapato del modelo DJ001 vendidos durante un

    ao

    50 69

    70 89

    90 109

    110 129

    130 149

    150 169

    170 189

  • 46

    Figura 12. Modelo DJ002 vendidos durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 52 % de zapatos

    vendidos del modelo DJ002 estuvieron entre 50 y 63 pares semanales sin embargo el 2%

    estuvieron entre 92 y 105 pares semanales. La empresa fabrica en promedio 64 pares

    durante el ao con lo cual decimos q este modelo es rentable para la empresa.

    52%

    13%

    29%

    2% 0%

    4%

    Numero de pares de zapato del modelo DJ002 vendidos durante un ao

    50 63

    64 77

    78 91

    92 105

    106 119

    120 133

  • 47

    Figura 13. Modelo DJ003 vendidos durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 52 % de zapatos

    vendidos del modelo DJ003 estuvieron entre 50 y 63 pares semanales sin embargo el 2%

    estuvieron entre 92 y 105 pares semanales. La empresa fabrica en promedio 64 pares

    durante el ao con lo cual decimos q este modelo es rentable para la empresa.

    2%

    13%

    25%

    35%

    19%

    2%

    4%

    Numero de pares de zapato del modelo DJ003 vendidos durante un ao

    15 7,5

    31 23,5

    47 39,5

    63 55,5

    79 71,5

    95 87,5

    111 103,5

  • 48

    Figura 14. Modelo DJ004 vendidos durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 23 % de zapatos

    vendidos del modelo DJ004 estuvieron entre 42 y 55 pares semanales sin embargo el 4%

    estuvieron entre 0 y 13 pares semanales. La empresa fabrica en promedio 42 pares

    durante el ao.

    15%

    10%

    21%

    23%

    19%

    8% 4%

    Numero de pares de zapato del modelo DJ004 vendidos durante un ao

    0 13

    14 27

    28 41

    42 55

    56 69

    70 83

    84 97

  • 49

    Figura 15. Modelo DJ005 vendidos durante un ao

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 50 % de zapatos

    vendidos del modelo DJ005 estuvieron entre 0 y 24 pares semanales sin embargo el 2%

    estuvieron entre 125 y 149 pares semanales. La empresa fabrica en promedio 42 pares

    durante el ao con lo cual decimos que el modelo necesita ser modificado por su poca

    productividad.

    50%

    29%

    7%

    8%

    2% 2% 2%

    Numero de pares de zapato del modelo DJ005 vendidos durante un ao

    0 24

    25 49

    50 74

    75 99

    100 124

    125 149

    150 174

  • 50

    Comparacin de Datos estadsticos tanto de produccin como de

    ventas de todos los modelos durante el ao 2014

    Figura 16. Modelos producidos durante el ao

    Figura 17. Modelos vendidos durante el ao

    1%

    6%

    19%

    5%

    5% 5%

    10% 11%

    18%

    20%

    Numero de pares de zapatos de todos los modelos producidos durante el ao

    180 200

    201 221

    222 242

    243 263

    264 284

    285 305

    306 326

    327 347

    348 368

    2%

    7% 10% 2%

    5%

    7%

    31%

    17%

    9% 10%

    Numero de pares de zapatos de todos los modelos vendidos durante el ao

    180 197

    198 215

    216 233

    234 251

    252 269

    270 287

    288 305

    306 323

    324 341

    342 359

  • 51

    En la empresa de calzados Duke de enero a diciembre del ao 2014 el 20% de zapatos

    confeccionados de los 5 modelos estuvieron entre 369 y 389 sin embargo el 31 % de

    zapatos vendidos de los 5 modelos estuvieron entre 288 y 305 pares semanales. La

    empresa fabrica en promedio produce 307 y vende 289 pares durante el ao con lo cual

    podemos concluir lo que produce es vendido casi en su totalidad.

  • 52

    Conclusiones

    La elaboracin de este trabajo fue notoria la aplicacin de las herramientas

    estadsticas, dando como resultados obtenidos en el estudio se logr identificar

    los criterios de negocio enfocado en la produccin. Dando como resultados que:

    Cada ao la empresa aumenta el nmero de produccin de zapatos

    sobrepasando los 300 pares semanales.

    La empresa calzados Duke vende por semana entre 285 y 294 pares de zapatos

    con un nivel de confianza 95 %.

    La empresa por semana fabrica entre 300 y 314 pareces de zapatos con un nivel

    de confianza 95 %

    En anlisis estadstico realizado la empresa de calzados Duke ha producido un

    total de 15919 pares y ha vendido un total de 15406 pares.

    De los 5 modelos producidos por la empresa el modelo DJ001 es el producto que

    ms se fabrica y vende por ende la empresa debera aumentar la produccin de

    ese modelo.

    La empresa debera darle ms nfasis o descartar el modelo DJ001 ya que ese

    modelo es el que menos es producido y vendido.

  • 53

    Bibliografa

    Han, J., & Kamber, M. (2006). Data Mining: Concepts and Techniques. BOSTON: EL SEVIER.

    Maimom, O., & Rokach, l. (2010). Dataming and KDD. New York: Springer.

    Molina Lpez , J., & Garca Herrero, J. (2006). TCNICAS DE ANLISIS DE DATOS. Madrid:

    Universidad de Madrid.

    Usama, F., Piatetsky, G., & Smyth , P. (1996). From Data Mining to Knowledge Discovery in

    Databases. AAAI96, 54.

    Weiss, G., & Davison, B. (2010). Data Mining. To appear in the Handbook of Technology

    Management, H. Bidgoli (Ed.), 17.

    Weiss, J. (2010). Data Mining. The Handbook of Technology Management.

  • 54

    Anexos

  • 55

  • 56