ontología como instrumento de gestión de conocimiento
DESCRIPTION
La ontología como un instrumento de gestión del conocimiento en los procesos clave de la MiPyME: el caso de la contabilidadBlanca Belén Salas Uría LI , Dr. Raúl Morales Carrasco y MA Blanca Estela Velasco Díaz El incremento de los recursos elaborados en el área contable dificulta la interoperabilidad entre los diferentes niveles y sistemas de las organizaciones. Se pretende aplicar las herramientas ontológicas que permiten unificar los diferentes criterios terminológicos que se emplean en una organización y que inciden en el área contable, lo que permite gestionar el conocimiento con el fin de generar una mejor comunicación entre los diferentes niveles de las empresas en ambientes colaborativos de trabajo que permita la adquisición, transmisión y explotación de este conocimiento de una manera explícita y formal por medio de las ontologíasTRANSCRIPT
![Page 1: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/1.jpg)
La ontología como un instrumento de gestión del conocimiento en los
procesos clave de la MiPyME: el caso de la contabilidad
Blanca Belén Salas Uría LI 1, Dr. Raúl Morales Carrasco
2 y MA Blanca Estela Velasco Díaz
3
Resumen--- El incremento de los recursos elaborados en el área contable dificulta la interoperabilidad entre los diferentes
niveles y sistemas de las organizaciones. La MiPyME carece con un medio para hacer el análisis de la información, por lo
cual lo que se desea consultar no muestra un resultado eficiente hacia el usuario. Por este motivo se pretende aplicar las
herramientas ontológicas que permiten unificar los diferentes criterios terminológicos que se emplean en una organización
y que inciden en el área contable, lo que permite gestionar el conocimiento con el fin de generar una excelente
comunicación entre los diferentes niveles de las empresas. Por lo tanto, en ambientes colaborativos de trabajo es muy
importante contar con una infraestructura robusta de Tecnologías de Información (TI) que permita la adquisición,
transmisión y explotación de este conocimiento de una manera explícita y formal por medio de las ontologías
Palabras clave---ventaja competitiva, gestión del conocimiento, ontología, herramientas ontológicas.
Introducción
En la actualidad se requiere la reutilización de contenidos ya elaborados que genera la documentación técnica en
el área contable dentro del sector empresarial, principalmente en la MiPyME. Para lograr lo anterior se cuenta con el
desarrollo de las herramientas ontológicas que generalmente se utilizan en diferentes contextos, puntos de vista y
suposiciones acerca de un área de estudio determinada. Las herramientas ontológicas permiten crear un
entendimiento compartido a través del uso de las ontologías, para establecer correspondencia y relaciones entre los
diferentes dominios de entidades de información.
Se investigó y se encontró aproximadamente diez herramientas ontológicas empleadas en la construcción de
ontologías, de las cuales se seleccionaron y compararon Protégé y GATE, por ser las más utilizadas a nivel mundial.
Protégé y GATE dan lugar a interacciones que propicien la construcción colaborativa de conocimiento para el
desarrollo del proyecto. A continuación se describe brevemente cada una de ellas.
Protégé: es un software libre de código abierto, ofrece una interfaz gráfica que permite al desarrollador de
ontologías enfocarse en la modelación conceptual sin que requiera de conocimientos de la sintaxis de los
lenguajes de salida.
GATE: es un software libre de código abierto, que proporciona un amplio conjunto de herramientas interactivas
gráficas para la creación, la medición y el mantenimiento de los componentes de software para el procesamiento de
lenguaje humano, la gestión del conocimiento y creación de ontologías.
GATE se seleccionó para aplicarse en el proceso de construcción de la ontología ya que cuenta con los recursos
de procesamiento, para identificar automáticamente las oraciones. Ya que es preciso adaptarlos en los términos
contables al procesar textos en español para trabajar correctamente en la elaboración de la misma.
Al utilizar GATE como una importante herramienta ontológica en la comunicación de una organización, que
permite unificar los diferentes criterios terminológicos en el área contable, implica una importante innovación en sus
procesos a fin de generar ventajas competitivas.
Proceso en la elaboración de la ontología en el área contable
Análisis de especificación de requerimientos
Las actividades que se realizan en esta fase son:
Construir el corpus en el área contable: Debe incluir las actividades si se realiza de manera manual como
si se recurre a técnicas automatizadas como GATE. Si bien una persona podría aplicar de manera
consistente un esquema de clasificación de conceptos de manera manual, esto es un proceso tedioso que
1 La L.I. Blanca Belén Salas Uría es estudiante de la Maestría en Ingeniería en el Instituto Tecnológico de Puebla, México.
[email protected] (autor corresponsal). 2 El Dr. Raúl Morales Carrasco es Investigador de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México.
[email protected] 3 La M.A. Blanca Estela Velasco Díaz es Profesora de la Maestría en Ingeniería del Instituto Tecnológico de Puebla, México.
![Page 2: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/2.jpg)
demanda mucho tiempo, esfuerzo y dinero, tanto considerando el entrenamiento en el uso del esquema
como su aplicación (Rosé et al.2008). Para una mejor comprensión del análisis manual de los conceptos
consulte el manual de terminología de Pavel (Pavel y Nolet, 2002).
Análisis automático: se ha recurrido tanto a interfaces estructuradas y semi estructuradas, como a texto
libre. Si bien las interfaces estructuradas y semi-estructuradas (oraciones de apertura, dirigidas por
menú, y actos de diálogo) permiten simplificar el proceso de análisis al no tener que usar técnicas de
procesamiento de lenguaje natural (Soller et al.2005), también pueden conducir a inferencias imprecisas
(Tchounikine et al.2010), restringir los tipos de actos comunicativos y retardar la comunicación (Kumar
et al. 2007). En relación al texto libre, al permitir que la comunicación se realice sin restricciones, ya no
es posible usar la interfaz para hacer inferencias sobre el proceso de interacción, haciendo necesario
recurrir a técnicas de procesamiento de lenguaje natural y de minería de textos. Existen algunas
experiencias donde estas técnicas se usaron exitosamente para identificar: intencionalidad de la
contribución, tópico de discusión, y problemas en la colaboración. (Padilha et al. 2004; Orvis et al.
2006; Ravi y Kim, 2007).
Técnicas de Minería de Textos
El uso de minería de textos para la construcción de un clasificador requiere que un conjunto de documentos
manualmente clasificado por expertos del dominio, sea divido en dos subconjuntos, uno de entrenamiento y otro de
prueba. Al momento de trabajar con el análisis de contenido se descubrió que en cada una de las contribuciones de
los contadores se podía identificar más de una habilidad y que por consiguiente convenía tomar a las oraciones como
unidad de análisis. Por lo tanto, como paso previo a la aplicación de la técnica de minería de textos es preciso
identificar las oraciones que forman parte de las contribuciones de los contadores. (Cunningham et al. 2011).
Usualmente tratamos con dos tipos de información: estructurada y no-estructurada. La información estructurada
es típicamente generada por humanos y para humanos, aunque las computadoras requieren algún nivel de
interpretación para hacer significativa a la información no-estructurada. Por su parte, para la información
estructurada (almacenada en bases de datos) su interpretación esta inequívocamente determinada por su formato. La
minera de textos o text mining se refiere al proceso de extracción de patrones interesantes y no triviales, o
conocimiento, desde documentos de texto. Si bien la minería de textos utiliza técnicas de la minería de datos, la
diferencia fundamental entre ellas radica en que la minería de textos no busca patrones en registros de datos
formalizados sino en datos textuales no estructurados. (García et al. 2006).
Las técnicas de clasificación de la minería de textos, consisten en asignar objetos por categorías predefinidas, se
adecuan naturalmente al problema de identificar las habilidades manifestadas por los contadores al coordinar grupos
colaborativos, porque la intención es hacer corresponder a cada contribución de los integrantes una o más habilidades
de la clasificación. Para la construcción de un clasificador se necesita que un conjunto de documentos manualmente
clasificado por expertos del dominio, sea divido en dos subconjuntos, uno de entrenamiento y otro de prueba. El
clasificador se construye mediante un proceso inductivo que observando las características de los documentos del
subconjunto de entrenamiento infiere las condiciones que documentos previamente no examinados deberían cumplir
para ser clasificados bajo una u otra categoría. Por otro lado, la comparación de las decisiones de clasificación
realizadas por el modelo, con las efectuadas sobre el subconjunto de prueba por expertos humanos, permite evaluar
la efectividad de la clasificación automática. (Do Prado et al. 2008).
Descomposición de Textos en Oraciones
GATE es una herramienta de código abierto que incluye recursos (parsers, taggers, recuperación de información,
extracción de información, aprendizaje de máquina, etc.) que permiten desarrollar y utilizar componentes de software
que procesan lenguaje natural. En lo que respecta a la segmentación de oraciones, GATE ofrece dos recursos de
procesamiento: RegEx Sentence Splitter (divisor de sentencias) y ANNIE Sentence Splitter. Ya sea que se elija uno u
otro recurso de procesamiento, a cada sentencia identificada se le asigna una anotación de tipo “Sentence”, en tanto
que a los caracteres que permiten distinguir oraciones le corresponde una anotación “Split”. Las anotaciones “Split”
tienen una característica denominada “kind” con dos valores posibles: “internal” para todos los signos de puntuación
que señalan el fin de una oración, o “external” para los caracteres que señalan el fin de una oración pero que no
forman parte de la misma. Una anotación debe ser entendida como una forma de metadato asociado con una sección
particular del contenido de un documento. RegEx Sentence Splitter se basa en expresiones regulares que deben ser
especificadas siguiendo la sintaxis del API regex de Java. Si bien se utilizó este recurso en primera instancia, tuvo
que ser descartado dado que genera errores en la identificación de oraciones cuando una abreviatura tiene a
continuación un signo de puntuación del cual no está separada por caracteres de espacio. (Feldman et al. 2007).
![Page 3: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/3.jpg)
Adaptaciones al componente ANNIE Sentence Splitter
La función principal de Sentence Splitter (en español divisor de oraciones) consiste en segmentar el texto en
oraciones, para ello utiliza una lista nomenclaturas de abreviaturas para ayudar a distinguir puntos y parte de
oraciones-marca de otros tipos. Para utilizar este módulo de procesamiento se tiene que especificar dos parámetros:
gazetterListsURL: como su nombre lo dice son listas de índice geográfico usadas en archivos de texto, que
permite distinguir una lista de abreviaturas usadas comúnmente que permiten distinguir puntos que señalan el fin de
oraciones de aquellos que forman parte de abreviaturas.
transducerURL: la dirección de la localización de una gramática JAPE que indica cuando un signo de
puntuación marca el fin de una oración.
La gramática JAPE permite personalizar ANNIE Sentence Splitter en función de las características del lenguaje o
dominio de aplicación al que pertenece el texto analizado. Una gramática JAPE(es un motor java que especifica los
patrones de anotación de los documentos) consiste de un conjunto de fases compuestas de reglas patrón-acción. Cada
una de las reglas tiene una parte izquierda (LHS) y una parte derecha (RHS) separadas mediante “-->”. En LHS (el
lado izquierdo de las reglas de anotación en los documentos) se describe el patrón a buscar en las anotaciones del
documento, en tanto que RHS (la parte derecha de las declaraciones de manipulación de cada anotación) indica las
acciones a realizar si el documento contiene el patrón. En LHS el patrón buscado se encierra entre paréntesis en tanto
que cada anotación que forma parte del patrón se encierra entre llaves. El patrón descrito en LHS puede consistir de
una anotación, una anotación con un valor de atributo especifico, o una expresión regular que debe satisfacer una
anotación. Para clarificar los conceptos mencionados considérese el siguiente ejemplo:
Phase: find
Input: Token SpaceToken
Options: control = appelt
Rule: puntoPuntosSuspensivos
({Token.string=="."}) [1,3]
: split
-->:split.Split = {kind = "internal"}
Lo primero a especificar en una gramática es su nombre, en el ejemplo “Phase:find”. Se usa la palabra “Phase”
porque las gramáticas de JAPE pueden combinarse formando una secuencia donde cada gramática constituye una
fase. También es necesario indicar los tipos de anotaciones que la gramática usará, en este caso anotaciones “Token”
y “SpaceToken” según se indica en “Input: Token SpaceToken”. En tanto que, con “Control” se precisa la manera de
proceder cuando más de una regla dentro de una fase coincide con la misma región de texto.
Las anotaciones de entrada utilizadas por ANNIE Sentence Splitter deben generarse por un recurso de
procesamiento ejecutado con anterioridad y para ello fue necesario utilizar GATE Unicode Tokeniser(es un
componente que divide el texto en selecciones llamadas tokens). La tokenización consiste en dividir un conjunto de
símbolos para asignar un significado coherente entre símbolos. ” (W3Csw2001).
En la figura 1 aparecen otros dos recursos de procesamiento que se utilizaron junto con ANNIE Sentence Splitter
para reconocer oraciones en textos en español. GATE Unicode Tokeniser permite identificar los diferentes tipos de
tokens en el texto analizado, en tanto que Document Reset PR (es un recurso que permite al documento ser
reinicializado a su estado original) sirve para eliminar las anotaciones creadas en el texto analizado en cada caso de
prueba.
En la figura 2 se complementó el uso adecuado del componente ANNIE Sentence Splitter en GATE para
conformar las relaciones entre términos y así generar los conceptos contables adecuados para la ontología.
En el cuadro 1 se describen una muestra de resultados obtenidos en la extracción de términos contables con
GATE, para después almacenarlos en una base de datos que contenga la terminología adecuada en cada área
contable. En la primera columna ID_C identifica la nomenclatura única, utilizada en la base de datos, que debe de
tener cada área contable para conocer el corpus de donde se extrajo el término. En la segunda columna NOMBRE se
describe la nomenclatura única del área contable, que ayudará al usuario a identificar el término correcto en el
corpus. La tercera columna DESCRIPCION describe ampliamente cada área y la última columna
TOTAL_TERMINOS nos muestra el total de términos encontrados en el corpus de cada área.
![Page 4: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/4.jpg)
Figura 1.Extracción y enmarcado de términos herramientas ANNIE. Fuente: GATE, 2014
Figura 2.Extracción y enmarcado de términos en GATE. Fuente: GATE, 2014
ID_C NOMBRE DESCRIPCION TOTAL_TERMINOS
1CFE Contabilidad
Financiera
Externa
Emite datos que se plasman en estados contables que son
objeto de difusión pública. En éstos, la empresa ha de
informar del patrimonio, constituido por recursos
económicos y financieros, con los que cuenta en una fecha
determinada y del beneficio, o pérdida, obtenido en cierto
período de tiempo.
80
![Page 5: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/5.jpg)
ID_C NOMBRE DESCRIPCION TOTAL_TERMINOS
2CAI Contabilidad
Administrativa
Interna
Se encarga de estudiar problemas específicos que enfrenta
la gerencia en una empresa en diferentes niveles,
encontrándose con el problema de identificar alternativas
o cursos de acción para determinar el más apropiado. Por
tanto, este servicio es altamente especializado para
asesorar a la gerencia sobre prácticas y administración
60
3CF Contabilidad
Fiscal
Se refiere al sistema de registro, clasificación, análisis y
presentación de la información relativa a las operaciones
financieras diseñado para cumplir con las obligaciones de
carácter fiscal de una empresa u organización.
40
4CC Contabilidad de
Costos
Registra, clasifica, asigna, distribuye y controla los costos
de las actividades de producción, distribución,
administración y financiamiento de una empresa u
organización. En este sentido, la función de la contabilidad
de costos es interpretar toda esta información para
presentarla a la junta directiva de una compañía con la
finalidad de orientarla en la toma de decisiones en
términos de gestión, planificación y control
administrativo.
90
5CP Contabilidad
Pública
Se encarga de registrar, clasificar, analizar y presentar la
información de la actividad económica de los organismos
públicos, para comunicar, a través de los estados
contables, la situación financiera de estos con el objetivo
de mejorar el manejo, control y gestión de los recursos del
Estado.
70
Cuadro 1. Resultados de conceptos en GATE.Fuente: Elaboración propia
Resumen de Resultados
En el corpus de la muestra, se seleccionaron 40 documentos para su análisis de extracción y enmarcado de
términos de los cuales se obtuvieron un total de 340 términos como se muestra en el cuadro 1.
Los resultados obtenidos con las pruebas realizadas en GATE se identificaron los términos adecuados en cada
área contable, lo que permiten unificar los diferentes criterios terminológicos que se emplean en una organización
para mantener una mejor comunicación, gestión del conocimiento e interoperabilidad entre las personas y los agentes
de software.
Conclusiones El identificar los conceptos que contiene un documento no es una tarea sencilla porque existen muchos casos
particulares que se deben tener en cuenta, y la etapa de pruebas para asegurarse que las reglas creadas no entren en
conflicto puede ser muy laboriosa. Sin embargo, dado que las reglas seguidas para la segmentación son especificadas
en la gramática creada para ANNIE Sentence Splitter puede aplicarse a cualquier texto en español
independientemente de su país de procedencia. Aún quedan tareas por desarrollar para llegar a identificar, mediante
minería de textos, las habilidades de las herramientas de GATE pero los resultados obtenidos son alentadores lo que
destacó su utilización como una importante herramienta en la comunicación, el análisis y la evaluación del
conocimiento en diferentes niveles de la organización para que la empresa sea más redituable a través del tiempo.
Referencias Cunningham, H., Maynard, D., Bontcheva, K., Tablan, V., Aswani, N., et al: Developing Language Processing Components with GATE Version
6 (a User Guide). Sheffield University (2011)
Do Prado, H. A., Ferneda, E.: Emerging Technologies of Text Mining: Techniques and Applications. Information Science Reference, Nueva York
(2008)
![Page 6: Ontología como Instrumento de Gestión de Conocimiento](https://reader035.vdocuments.mx/reader035/viewer/2022072007/55cf8edc550346703b9668a3/html5/thumbnails/6.jpg)
García Adeva, J. J., Calvo. R. A.: Mining Text with Pimiento. IEEE Internet Computing, 10 (4), 27-35 (2006)
GATE, General architecture for text engineering. (2014) https://gate.ac.uk/
Kumar, R., Rosé, C.P., Wang, Y., Joshi, M., Robinson, A.: Tutorial Dialogue as Adaptive Collaborative Learning Support. En: Proceedings of the
2007 conference on Artificial Intelligence in Education: Building Technology Rich Learning Contexts That Work, pp. 383-390. IOS Press,
Amsterdam (2007)
Orvis, K.L., Lassiter, A.L.R.: Computer-Supported Collaborative Learning: The Role of the Instructor. En: Pixy Ferris S., Godar, S.H. (eds.)
Teaching and learning with virtual teams, pp. 158-179. Information Science Publishing (2006)
Padilha, T. P. P., Almeida, L., Alves, J. B. M.: Mining Techniques for Models of Collaborative Learning. En: Mostow, J., Tedesco. P. (eds.)
Designing Computational Models of Collaborative Learning Interaction, ITS 2004, pp. 89-94. Brazil (2004)
Pavel Silvia y Nolet Diane. “Manual de terminología”. Ministro de Obras Públicas y Servicios Gubernamentales de Canadá, No de catálogo S53-
28/2001, ISBN 0-660-61616-5(2002)
Ravi, S., Kim, J.: Profiling Student Interactions in Threaded Discussions with Speech Act Classifiers. En: Proceedings of the 2007 conference on
Artificial Intelligence in Education: Building Technology Rich Learning Contexts That Work, pp. 357-364. IOS Press, Amsterdam (2007)
Rosé, C., Wang, Y., Cui, Y., Arguello, J., Stegmann, K., Weinberger, A., Fischer, F.: Analyzing collaborative learning processes automatically:
Exploiting the advances of computational linguistics in computer-supported collaborative learning. International Journal of Computer-Supported Collaborative Learning, 3 (3), 237-271 (2008).
Soller, A., Martínez, M.A., Jermann, P., Muehlenbrock, M.: From Mirroring to Guiding: A Review of State of the Art Technology for Supporting Collaborative Learning. International Journal of Artificial Intelligence in Education, 15 (4), 261-290 (2005)
Tchounikine, P., Rummel, N., McLaren, B.M.: Computer Supported Collaborative Learning and Intelligent Tutoring Systems. En: Nkambou, R., Mizoguchi, R., Bourdeau, J. (eds.) Advances in Intelligent Tutoring Systems, pp. 447-463. Springer (2010)
W3C, WWW Consortium. (2010). Semantic Web, http://www.w3.org/standards/semanticweb/