ontología como instrumento de gestión de conocimiento

6
La ontología como un instrumento de gestión del conocimiento en los procesos clave de la MiPyME: el caso de la contabilidad Blanca Belén Salas Uría LI 1 , Dr. Raúl Morales Carrasco 2 y MA Blanca Estela Velasco Díaz 3 Resumen--- El incremento de los recursos elaborados en el área contable dificulta la interoperabilidad entre los diferentes niveles y sistemas de las organizaciones. La MiPyME carece con un medio para hacer el análisis de la información, por lo cual lo que se desea consultar no muestra un resultado eficiente hacia el usuario. Por este motivo se pretende aplicar las herramientas ontológicas que permiten unificar los diferentes criterios terminológicos que se emplean en una organización y que inciden en el área contable, lo que permite gestionar el conocimiento con el fin de generar una excelente comunicación entre los diferentes niveles de las empresas. Por lo tanto, en ambientes colaborativos de trabajo es muy importante contar con una infraestructura robusta de Tecnologías de Información (TI) que permita la adquisición, transmisión y explotación de este conocimiento de una manera explícita y formal por medio de las ontologías Palabras clave---ventaja competitiva, gestión del conocimiento, ontología, herramientas ontológicas. Introducción En la actualidad se requiere la reutilización de contenidos ya elaborados que genera la documentación técnica en el área contable dentro del sector empresarial, principalmente en la MiPyME. Para lograr lo anterior se cuenta con el desarrollo de las herramientas ontológicas que generalmente se utilizan en diferentes contextos, puntos de vista y suposiciones acerca de un área de estudio determinada. Las herramientas ontológicas permiten crear un entendimiento compartido a través del uso de las ontologías, para establecer correspondencia y relaciones entre los diferentes dominios de entidades de información. Se investigó y se encontró aproximadamente diez herramientas ontológicas empleadas en la construcción de ontologías, de las cuales se seleccionaron y compararon Protégé y GATE, por ser las más utilizadas a nivel mundial. Protégé y GATE dan lugar a interacciones que propicien la construcción colaborativa de conocimiento para el desarrollo del proyecto. A continuación se describe brevemente cada una de ellas. Protégé: es un software libre de código abierto, ofrece una interfaz gráfica que permite al desarrollador de ontologías enfocarse en la modelación conceptual sin que requiera de conocimientos de la sintaxis de los lenguajes de salida. GATE: es un software libre de código abierto, que proporciona un amplio conjunto de herramientas interactivas gráficas para la creación, la medición y el mantenimiento de los componentes de software para el procesamiento de lenguaje humano, la gestión del conocimiento y creación de ontologías. GATE se seleccionó para aplicarse en el proceso de construcción de la ontología ya que cuenta con los recursos de procesamiento, para identificar automáticamente las oraciones. Ya que es preciso adaptarlos en los términos contables al procesar textos en español para trabajar correctamente en la elaboración de la misma. Al utilizar GATE como una importante herramienta ontológica en la comunicación de una organización, que permite unificar los diferentes criterios terminológicos en el área contable, implica una importante innovación en sus procesos a fin de generar ventajas competitivas. Proceso en la elaboración de la ontología en el área contable Análisis de especificación de requerimientos Las actividades que se realizan en esta fase son: Construir el corpus en el área contable: Debe incluir las actividades si se realiza de manera manual como si se recurre a técnicas automatizadas como GATE. Si bien una persona podría aplicar de manera consistente un esquema de clasificación de conceptos de manera manual, esto es un proceso tedioso que 1 La L.I. Blanca Belén Salas Uría es estudiante de la Maestría en Ingeniería en el Instituto Tecnológico de Puebla, México. [email protected] (autor corresponsal). 2 El Dr. Raúl Morales Carrasco es Investigador de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México. [email protected] 3 La M.A. Blanca Estela Velasco Díaz es Profesora de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México. [email protected]

Upload: raulmc

Post on 19-Dec-2015

12 views

Category:

Documents


1 download

DESCRIPTION

La ontología como un instrumento de gestión del conocimiento en los procesos clave de la MiPyME: el caso de la contabilidadBlanca Belén Salas Uría LI , Dr. Raúl Morales Carrasco y MA Blanca Estela Velasco Díaz El incremento de los recursos elaborados en el área contable dificulta la interoperabilidad entre los diferentes niveles y sistemas de las organizaciones. Se pretende aplicar las herramientas ontológicas que permiten unificar los diferentes criterios terminológicos que se emplean en una organización y que inciden en el área contable, lo que permite gestionar el conocimiento con el fin de generar una mejor comunicación entre los diferentes niveles de las empresas en ambientes colaborativos de trabajo que permita la adquisición, transmisión y explotación de este conocimiento de una manera explícita y formal por medio de las ontologías

TRANSCRIPT

Page 1: Ontología como Instrumento de Gestión de Conocimiento

La ontología como un instrumento de gestión del conocimiento en los

procesos clave de la MiPyME: el caso de la contabilidad

Blanca Belén Salas Uría LI 1, Dr. Raúl Morales Carrasco

2 y MA Blanca Estela Velasco Díaz

3

Resumen--- El incremento de los recursos elaborados en el área contable dificulta la interoperabilidad entre los diferentes

niveles y sistemas de las organizaciones. La MiPyME carece con un medio para hacer el análisis de la información, por lo

cual lo que se desea consultar no muestra un resultado eficiente hacia el usuario. Por este motivo se pretende aplicar las

herramientas ontológicas que permiten unificar los diferentes criterios terminológicos que se emplean en una organización

y que inciden en el área contable, lo que permite gestionar el conocimiento con el fin de generar una excelente

comunicación entre los diferentes niveles de las empresas. Por lo tanto, en ambientes colaborativos de trabajo es muy

importante contar con una infraestructura robusta de Tecnologías de Información (TI) que permita la adquisición,

transmisión y explotación de este conocimiento de una manera explícita y formal por medio de las ontologías

Palabras clave---ventaja competitiva, gestión del conocimiento, ontología, herramientas ontológicas.

Introducción

En la actualidad se requiere la reutilización de contenidos ya elaborados que genera la documentación técnica en

el área contable dentro del sector empresarial, principalmente en la MiPyME. Para lograr lo anterior se cuenta con el

desarrollo de las herramientas ontológicas que generalmente se utilizan en diferentes contextos, puntos de vista y

suposiciones acerca de un área de estudio determinada. Las herramientas ontológicas permiten crear un

entendimiento compartido a través del uso de las ontologías, para establecer correspondencia y relaciones entre los

diferentes dominios de entidades de información.

Se investigó y se encontró aproximadamente diez herramientas ontológicas empleadas en la construcción de

ontologías, de las cuales se seleccionaron y compararon Protégé y GATE, por ser las más utilizadas a nivel mundial.

Protégé y GATE dan lugar a interacciones que propicien la construcción colaborativa de conocimiento para el

desarrollo del proyecto. A continuación se describe brevemente cada una de ellas.

Protégé: es un software libre de código abierto, ofrece una interfaz gráfica que permite al desarrollador de

ontologías enfocarse en la modelación conceptual sin que requiera de conocimientos de la sintaxis de los

lenguajes de salida.

GATE: es un software libre de código abierto, que proporciona un amplio conjunto de herramientas interactivas

gráficas para la creación, la medición y el mantenimiento de los componentes de software para el procesamiento de

lenguaje humano, la gestión del conocimiento y creación de ontologías.

GATE se seleccionó para aplicarse en el proceso de construcción de la ontología ya que cuenta con los recursos

de procesamiento, para identificar automáticamente las oraciones. Ya que es preciso adaptarlos en los términos

contables al procesar textos en español para trabajar correctamente en la elaboración de la misma.

Al utilizar GATE como una importante herramienta ontológica en la comunicación de una organización, que

permite unificar los diferentes criterios terminológicos en el área contable, implica una importante innovación en sus

procesos a fin de generar ventajas competitivas.

Proceso en la elaboración de la ontología en el área contable

Análisis de especificación de requerimientos

Las actividades que se realizan en esta fase son:

Construir el corpus en el área contable: Debe incluir las actividades si se realiza de manera manual como

si se recurre a técnicas automatizadas como GATE. Si bien una persona podría aplicar de manera

consistente un esquema de clasificación de conceptos de manera manual, esto es un proceso tedioso que

1 La L.I. Blanca Belén Salas Uría es estudiante de la Maestría en Ingeniería en el Instituto Tecnológico de Puebla, México.

[email protected] (autor corresponsal). 2 El Dr. Raúl Morales Carrasco es Investigador de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México.

[email protected] 3 La M.A. Blanca Estela Velasco Díaz es Profesora de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México.

[email protected]

Page 2: Ontología como Instrumento de Gestión de Conocimiento

demanda mucho tiempo, esfuerzo y dinero, tanto considerando el entrenamiento en el uso del esquema

como su aplicación (Rosé et al.2008). Para una mejor comprensión del análisis manual de los conceptos

consulte el manual de terminología de Pavel (Pavel y Nolet, 2002).

Análisis automático: se ha recurrido tanto a interfaces estructuradas y semi estructuradas, como a texto

libre. Si bien las interfaces estructuradas y semi-estructuradas (oraciones de apertura, dirigidas por

menú, y actos de diálogo) permiten simplificar el proceso de análisis al no tener que usar técnicas de

procesamiento de lenguaje natural (Soller et al.2005), también pueden conducir a inferencias imprecisas

(Tchounikine et al.2010), restringir los tipos de actos comunicativos y retardar la comunicación (Kumar

et al. 2007). En relación al texto libre, al permitir que la comunicación se realice sin restricciones, ya no

es posible usar la interfaz para hacer inferencias sobre el proceso de interacción, haciendo necesario

recurrir a técnicas de procesamiento de lenguaje natural y de minería de textos. Existen algunas

experiencias donde estas técnicas se usaron exitosamente para identificar: intencionalidad de la

contribución, tópico de discusión, y problemas en la colaboración. (Padilha et al. 2004; Orvis et al.

2006; Ravi y Kim, 2007).

Técnicas de Minería de Textos

El uso de minería de textos para la construcción de un clasificador requiere que un conjunto de documentos

manualmente clasificado por expertos del dominio, sea divido en dos subconjuntos, uno de entrenamiento y otro de

prueba. Al momento de trabajar con el análisis de contenido se descubrió que en cada una de las contribuciones de

los contadores se podía identificar más de una habilidad y que por consiguiente convenía tomar a las oraciones como

unidad de análisis. Por lo tanto, como paso previo a la aplicación de la técnica de minería de textos es preciso

identificar las oraciones que forman parte de las contribuciones de los contadores. (Cunningham et al. 2011).

Usualmente tratamos con dos tipos de información: estructurada y no-estructurada. La información estructurada

es típicamente generada por humanos y para humanos, aunque las computadoras requieren algún nivel de

interpretación para hacer significativa a la información no-estructurada. Por su parte, para la información

estructurada (almacenada en bases de datos) su interpretación esta inequívocamente determinada por su formato. La

minera de textos o text mining se refiere al proceso de extracción de patrones interesantes y no triviales, o

conocimiento, desde documentos de texto. Si bien la minería de textos utiliza técnicas de la minería de datos, la

diferencia fundamental entre ellas radica en que la minería de textos no busca patrones en registros de datos

formalizados sino en datos textuales no estructurados. (García et al. 2006).

Las técnicas de clasificación de la minería de textos, consisten en asignar objetos por categorías predefinidas, se

adecuan naturalmente al problema de identificar las habilidades manifestadas por los contadores al coordinar grupos

colaborativos, porque la intención es hacer corresponder a cada contribución de los integrantes una o más habilidades

de la clasificación. Para la construcción de un clasificador se necesita que un conjunto de documentos manualmente

clasificado por expertos del dominio, sea divido en dos subconjuntos, uno de entrenamiento y otro de prueba. El

clasificador se construye mediante un proceso inductivo que observando las características de los documentos del

subconjunto de entrenamiento infiere las condiciones que documentos previamente no examinados deberían cumplir

para ser clasificados bajo una u otra categoría. Por otro lado, la comparación de las decisiones de clasificación

realizadas por el modelo, con las efectuadas sobre el subconjunto de prueba por expertos humanos, permite evaluar

la efectividad de la clasificación automática. (Do Prado et al. 2008).

Descomposición de Textos en Oraciones

GATE es una herramienta de código abierto que incluye recursos (parsers, taggers, recuperación de información,

extracción de información, aprendizaje de máquina, etc.) que permiten desarrollar y utilizar componentes de software

que procesan lenguaje natural. En lo que respecta a la segmentación de oraciones, GATE ofrece dos recursos de

procesamiento: RegEx Sentence Splitter (divisor de sentencias) y ANNIE Sentence Splitter. Ya sea que se elija uno u

otro recurso de procesamiento, a cada sentencia identificada se le asigna una anotación de tipo “Sentence”, en tanto

que a los caracteres que permiten distinguir oraciones le corresponde una anotación “Split”. Las anotaciones “Split”

tienen una característica denominada “kind” con dos valores posibles: “internal” para todos los signos de puntuación

que señalan el fin de una oración, o “external” para los caracteres que señalan el fin de una oración pero que no

forman parte de la misma. Una anotación debe ser entendida como una forma de metadato asociado con una sección

particular del contenido de un documento. RegEx Sentence Splitter se basa en expresiones regulares que deben ser

especificadas siguiendo la sintaxis del API regex de Java. Si bien se utilizó este recurso en primera instancia, tuvo

que ser descartado dado que genera errores en la identificación de oraciones cuando una abreviatura tiene a

continuación un signo de puntuación del cual no está separada por caracteres de espacio. (Feldman et al. 2007).

Page 3: Ontología como Instrumento de Gestión de Conocimiento

Adaptaciones al componente ANNIE Sentence Splitter

La función principal de Sentence Splitter (en español divisor de oraciones) consiste en segmentar el texto en

oraciones, para ello utiliza una lista nomenclaturas de abreviaturas para ayudar a distinguir puntos y parte de

oraciones-marca de otros tipos. Para utilizar este módulo de procesamiento se tiene que especificar dos parámetros:

gazetterListsURL: como su nombre lo dice son listas de índice geográfico usadas en archivos de texto, que

permite distinguir una lista de abreviaturas usadas comúnmente que permiten distinguir puntos que señalan el fin de

oraciones de aquellos que forman parte de abreviaturas.

transducerURL: la dirección de la localización de una gramática JAPE que indica cuando un signo de

puntuación marca el fin de una oración.

La gramática JAPE permite personalizar ANNIE Sentence Splitter en función de las características del lenguaje o

dominio de aplicación al que pertenece el texto analizado. Una gramática JAPE(es un motor java que especifica los

patrones de anotación de los documentos) consiste de un conjunto de fases compuestas de reglas patrón-acción. Cada

una de las reglas tiene una parte izquierda (LHS) y una parte derecha (RHS) separadas mediante “-->”. En LHS (el

lado izquierdo de las reglas de anotación en los documentos) se describe el patrón a buscar en las anotaciones del

documento, en tanto que RHS (la parte derecha de las declaraciones de manipulación de cada anotación) indica las

acciones a realizar si el documento contiene el patrón. En LHS el patrón buscado se encierra entre paréntesis en tanto

que cada anotación que forma parte del patrón se encierra entre llaves. El patrón descrito en LHS puede consistir de

una anotación, una anotación con un valor de atributo especifico, o una expresión regular que debe satisfacer una

anotación. Para clarificar los conceptos mencionados considérese el siguiente ejemplo:

Phase: find

Input: Token SpaceToken

Options: control = appelt

Rule: puntoPuntosSuspensivos

({Token.string=="."}) [1,3]

: split

-->:split.Split = {kind = "internal"}

Lo primero a especificar en una gramática es su nombre, en el ejemplo “Phase:find”. Se usa la palabra “Phase”

porque las gramáticas de JAPE pueden combinarse formando una secuencia donde cada gramática constituye una

fase. También es necesario indicar los tipos de anotaciones que la gramática usará, en este caso anotaciones “Token”

y “SpaceToken” según se indica en “Input: Token SpaceToken”. En tanto que, con “Control” se precisa la manera de

proceder cuando más de una regla dentro de una fase coincide con la misma región de texto.

Las anotaciones de entrada utilizadas por ANNIE Sentence Splitter deben generarse por un recurso de

procesamiento ejecutado con anterioridad y para ello fue necesario utilizar GATE Unicode Tokeniser(es un

componente que divide el texto en selecciones llamadas tokens). La tokenización consiste en dividir un conjunto de

símbolos para asignar un significado coherente entre símbolos. ” (W3Csw2001).

En la figura 1 aparecen otros dos recursos de procesamiento que se utilizaron junto con ANNIE Sentence Splitter

para reconocer oraciones en textos en español. GATE Unicode Tokeniser permite identificar los diferentes tipos de

tokens en el texto analizado, en tanto que Document Reset PR (es un recurso que permite al documento ser

reinicializado a su estado original) sirve para eliminar las anotaciones creadas en el texto analizado en cada caso de

prueba.

En la figura 2 se complementó el uso adecuado del componente ANNIE Sentence Splitter en GATE para

conformar las relaciones entre términos y así generar los conceptos contables adecuados para la ontología.

En el cuadro 1 se describen una muestra de resultados obtenidos en la extracción de términos contables con

GATE, para después almacenarlos en una base de datos que contenga la terminología adecuada en cada área

contable. En la primera columna ID_C identifica la nomenclatura única, utilizada en la base de datos, que debe de

tener cada área contable para conocer el corpus de donde se extrajo el término. En la segunda columna NOMBRE se

describe la nomenclatura única del área contable, que ayudará al usuario a identificar el término correcto en el

corpus. La tercera columna DESCRIPCION describe ampliamente cada área y la última columna

TOTAL_TERMINOS nos muestra el total de términos encontrados en el corpus de cada área.

Page 4: Ontología como Instrumento de Gestión de Conocimiento

Figura 1.Extracción y enmarcado de términos herramientas ANNIE. Fuente: GATE, 2014

Figura 2.Extracción y enmarcado de términos en GATE. Fuente: GATE, 2014

ID_C NOMBRE DESCRIPCION TOTAL_TERMINOS

1CFE Contabilidad

Financiera

Externa

Emite datos que se plasman en estados contables que son

objeto de difusión pública. En éstos, la empresa ha de

informar del patrimonio, constituido por recursos

económicos y financieros, con los que cuenta en una fecha

determinada y del beneficio, o pérdida, obtenido en cierto

período de tiempo.

80

Page 5: Ontología como Instrumento de Gestión de Conocimiento

ID_C NOMBRE DESCRIPCION TOTAL_TERMINOS

2CAI Contabilidad

Administrativa

Interna

Se encarga de estudiar problemas específicos que enfrenta

la gerencia en una empresa en diferentes niveles,

encontrándose con el problema de identificar alternativas

o cursos de acción para determinar el más apropiado. Por

tanto, este servicio es altamente especializado para

asesorar a la gerencia sobre prácticas y administración

60

3CF Contabilidad

Fiscal

Se refiere al sistema de registro, clasificación, análisis y

presentación de la información relativa a las operaciones

financieras diseñado para cumplir con las obligaciones de

carácter fiscal de una empresa u organización.

40

4CC Contabilidad de

Costos

Registra, clasifica, asigna, distribuye y controla los costos

de las actividades de producción, distribución,

administración y financiamiento de una empresa u

organización. En este sentido, la función de la contabilidad

de costos es interpretar toda esta información para

presentarla a la junta directiva de una compañía con la

finalidad de orientarla en la toma de decisiones en

términos de gestión, planificación y control

administrativo.

90

5CP Contabilidad

Pública

Se encarga de registrar, clasificar, analizar y presentar la

información de la actividad económica de los organismos

públicos, para comunicar, a través de los estados

contables, la situación financiera de estos con el objetivo

de mejorar el manejo, control y gestión de los recursos del

Estado.

70

Cuadro 1. Resultados de conceptos en GATE.Fuente: Elaboración propia

Resumen de Resultados

En el corpus de la muestra, se seleccionaron 40 documentos para su análisis de extracción y enmarcado de

términos de los cuales se obtuvieron un total de 340 términos como se muestra en el cuadro 1.

Los resultados obtenidos con las pruebas realizadas en GATE se identificaron los términos adecuados en cada

área contable, lo que permiten unificar los diferentes criterios terminológicos que se emplean en una organización

para mantener una mejor comunicación, gestión del conocimiento e interoperabilidad entre las personas y los agentes

de software.

Conclusiones El identificar los conceptos que contiene un documento no es una tarea sencilla porque existen muchos casos

particulares que se deben tener en cuenta, y la etapa de pruebas para asegurarse que las reglas creadas no entren en

conflicto puede ser muy laboriosa. Sin embargo, dado que las reglas seguidas para la segmentación son especificadas

en la gramática creada para ANNIE Sentence Splitter puede aplicarse a cualquier texto en español

independientemente de su país de procedencia. Aún quedan tareas por desarrollar para llegar a identificar, mediante

minería de textos, las habilidades de las herramientas de GATE pero los resultados obtenidos son alentadores lo que

destacó su utilización como una importante herramienta en la comunicación, el análisis y la evaluación del

conocimiento en diferentes niveles de la organización para que la empresa sea más redituable a través del tiempo.

Referencias Cunningham, H., Maynard, D., Bontcheva, K., Tablan, V., Aswani, N., et al: Developing Language Processing Components with GATE Version

6 (a User Guide). Sheffield University (2011)

Do Prado, H. A., Ferneda, E.: Emerging Technologies of Text Mining: Techniques and Applications. Information Science Reference, Nueva York

(2008)

Page 6: Ontología como Instrumento de Gestión de Conocimiento

García Adeva, J. J., Calvo. R. A.: Mining Text with Pimiento. IEEE Internet Computing, 10 (4), 27-35 (2006)

GATE, General architecture for text engineering. (2014) https://gate.ac.uk/

Kumar, R., Rosé, C.P., Wang, Y., Joshi, M., Robinson, A.: Tutorial Dialogue as Adaptive Collaborative Learning Support. En: Proceedings of the

2007 conference on Artificial Intelligence in Education: Building Technology Rich Learning Contexts That Work, pp. 383-390. IOS Press,

Amsterdam (2007)

Orvis, K.L., Lassiter, A.L.R.: Computer-Supported Collaborative Learning: The Role of the Instructor. En: Pixy Ferris S., Godar, S.H. (eds.)

Teaching and learning with virtual teams, pp. 158-179. Information Science Publishing (2006)

Padilha, T. P. P., Almeida, L., Alves, J. B. M.: Mining Techniques for Models of Collaborative Learning. En: Mostow, J., Tedesco. P. (eds.)

Designing Computational Models of Collaborative Learning Interaction, ITS 2004, pp. 89-94. Brazil (2004)

Pavel Silvia y Nolet Diane. “Manual de terminología”. Ministro de Obras Públicas y Servicios Gubernamentales de Canadá, No de catálogo S53-

28/2001, ISBN 0-660-61616-5(2002)

Ravi, S., Kim, J.: Profiling Student Interactions in Threaded Discussions with Speech Act Classifiers. En: Proceedings of the 2007 conference on

Artificial Intelligence in Education: Building Technology Rich Learning Contexts That Work, pp. 357-364. IOS Press, Amsterdam (2007)

Rosé, C., Wang, Y., Cui, Y., Arguello, J., Stegmann, K., Weinberger, A., Fischer, F.: Analyzing collaborative learning processes automatically:

Exploiting the advances of computational linguistics in computer-supported collaborative learning. International Journal of Computer-Supported Collaborative Learning, 3 (3), 237-271 (2008).

Soller, A., Martínez, M.A., Jermann, P., Muehlenbrock, M.: From Mirroring to Guiding: A Review of State of the Art Technology for Supporting Collaborative Learning. International Journal of Artificial Intelligence in Education, 15 (4), 261-290 (2005)

Tchounikine, P., Rummel, N., McLaren, B.M.: Computer Supported Collaborative Learning and Intelligent Tutoring Systems. En: Nkambou, R., Mizoguchi, R., Bourdeau, J. (eds.) Advances in Intelligent Tutoring Systems, pp. 447-463. Springer (2010)

W3C, WWW Consortium. (2010). Semantic Web, http://www.w3.org/standards/semanticweb/