seminario universitario de estudios del discurso...

16
Seminario Universitario de Estudios del Discurso Forense Instituto de Investigaciones Sociales Facultad de Contaduría y Administración UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO MANUAL DE PROCEDIMIENTOS PARA LA EJECUCIÓN DEL PROGRAMA Algoritmos generadores de redes de archivos para analizar discursos (AgraAD) Fernando Francisco Castaños Zuno Carlos Francisco Méndez Cruz Margarita Palacios Sierra (Coordinadores) Agosto, 2015

Upload: dangthien

Post on 10-Oct-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Seminario Universitario de Estudios del Discurso Forense

Instituto de Investigaciones Sociales Facultad de Contaduría y Administración

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

MANUAL DE PROCEDIMIENTOS PARA LA EJECUCIÓN DEL PROGRAMA Algoritmos generadores de redes

de archivos para analizar discursos (AgraAD) Fernando Francisco Castaños Zuno

Carlos Francisco Méndez Cruz Margarita Palacios Sierra

(Coordinadores)

Agosto, 2015

2    

Í N D I C E

I. Introducción

II. Objetivo del manual

III. Procedimiento

1. Propósito del procedimiento

2. Alcance

3. Responsabilidades

4. Definiciones

5. Ejecución del programa

5.1 Requerimientos del sistema

5.2 Consideraciones previas

5.3 Ejecución por primera vez

5.4 Ejecuciones posteriores

5.5 Eliminación del programa en Word

3    

I. Introducción

El Seminario Universitario de Estudios del Discurso Forense (SUEDIF) está conformado por

catorce instituciones universitarias que trabajan multidisciplinaria y colegiadamente en

proyectos de docencia, investigación y difusión sobre las disputas y los conflictos nacionales

para profundizar en su conocimiento y su estudio.

Debido al carácter interdisciplinario, tanto el Seminario como el Instituto de Investigaciones

Sociales (IIS) y el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la

UNAM se encargaron de desarrollar un programa que permita el etiquetado y la

sistematización de diferentes corpus para facilitar y agilizar las investigaciones sobre análisis del

discurso en cualquier área con el propósito de presentar posibles rutas de análisis a problemas

jurídicos.

El programa genera diez archivos denominados de la siguiente manera: fuente, remarcado, para

numerar, que numera, numerado, para limpiar, que limpia, para contar, que cuenta, y contadas.

La definición de cada uno se encuentra en el apartado 3, punto 4.

Para la implementación del procedimiento, se analizaron las ventajas y desventajas de una

macro en MS Office, un programa C#, Java POI/JExcel o el diseño de un sitio web. Se eligió

la primera opción por los siguientes motivos: la ejecución es más sencilla porque no necesita

conocimiento informático especializado, la rapidez para la automatización del procedimiento

es mayor que las anteriores, los riesgos de contagio de virus son mínimos, y finalmente el

modo de ejecución es mediante un botón de herramientas de MS Office, es decir, la macro no

requiere una interfaz de usuario.

El proyecto empleó para prueba una prueba el corpus de los discursos presidenciales de Juan

Silva Meza (2011-2014), expresidente de la Suprema Corte de Justicia de la Nación. La prueba

contó con tres fases: recuperación del corpus, diseño y evaluación del programa.

El presente manual contiene la descripción del procedimiento para ejecutarlo fácilmente desde

cualquier computadora. Pretende ser la guía que refleje y concentre las acciones y los procesos

del programa.

4    

II. Objetivo del manual

Generar un documento de seguimiento y de apoyo que describa los procedimientos necesarios

para la ejecución del programa Algoritmos generadores de redes de archivos para analizar discursos

(AgraAD) orientado a cualquier usuario dedicado a la investigación que busque obtener datos

estadísticos acerca de las unidades de algún corpus.

III. Procedimiento

Desarrollo de una herramienta para generar archivos con información relevante para el análisis

de discursos en corpus.

1. Propósito del procedimiento

Identificar las actividades, los responsables, la duración, los espacios de trabajo, las fuentes de

información e interacciones necesarias para la ejecución del programa AgraAD.

2. Alcance

El procedimiento corresponde a la Universidad Nacional Autónoma de México,

específicamente al Seminario Universitario de Estudios del Discurso Forense (SUEDIF), el

Instituto de Investigaciones Sociales (IIS) y el Grupo de Ingeniería Lingüística (GIL).

3. Responsabilidades

• Responsable de la propiedad de la idea:

o Doctor Fernando Francisco Castaños Zuno

• Responsables de la programación:

o Doctor Carlos Francisco Méndez Cruz

• Colaboradores:

o Pedro Eduardo Hernández Fuentes

o Marcio Francisco Martínez Valenzuela

o Doctora Margarita Palacios Sierra

• Adaptación y revisión:

o Pedro Eduardo Hernández Fuentes

o Led Eduardo Ruvalcaba Tamés

5    

4. Definiciones

En este apartado se describe de forma general cada una de las transformaciones que realiza el

procedimiento1, la cual estará indicada por una T seguida de un número (Tn). Una

transformación toma como entrada un archivo para generar otro archivo de salida que puede

ser de Word o de Excel. El signo “>” señala el proceso de transformación que crea cada

documento.

La primera transformación, T1, consiste en copiar una información originada en cualquier

formato a un documento de Word (archivo fuente), y es conducida necesariamente por una

persona. Nombramos a la primera información archivo original.

T1. Original (cualquier formato) > Fuente (Word)

Archivo original: discurso, fragmento de discurso o conjunto de discursos a los que

se puede acceder como aparecieron inicialmente, porque se conserva en algún lugar

(real o virtual) o porque se ha copiado, en la medida de lo posible, con sus

propiedades, entre ellas: tamaño, diseño de página y tipografía, conjuntamente con

los cuadros y las ilustraciones que lo acompañaban.

Archivo fuente: documento digital que registra las cadenas lingüísticas y los elementos

paralingüísticos que conforman el texto del discurso, propiamente, así como las

descripciones pertinentes (para los fines de la investigación) de los componentes no

textuales acompañantes. En su caso, se ha sustituido el tipo, el tamaño y el color de

letra básicos por unos estandarizados (de acuerdo con convenciones generales del

corpus o del proyecto en que se inscriba el análisis).

T2. Fuente (Word) > Remarcado (Word)

Archivo remarcado: documento en el que se ha introducido una marca de párrafo y

una de enunciado antes de la primera palabra de la oración inicial, se ha

reemplazado cada punto y seguido por un símbolo propio de enunciado (#E) y

cada marca de párrafo original, así como las que se hubieran generado

automáticamente en los pasos anteriores, por una marca propia (#P).                                                                                                                          1 Para ver el detalle de las transformaciones, consulte el documento: Léxico Procedimientos básicos 20140310.  

6    

T3. Remarcado (Word) > Para numerar (Word)

Archivo para numerar: documento en el cual los elementos de los enunciados han

sido dispuestos verticalmente, es decir, cada uno de ellos ocupa un renglón distinto.

T4. Para numerar (Word) > Que numera (Excel)

Archivo que numera: base de datos a cuya primera columna se ha trasladado (copiado)

el contenido del archivo para numerar. En cada celda hay una palabra (que puede

estar acompañada de uno o más signos de puntuación) o una marca propia, de

enunciado o de párrafo y no hay (en la columna) celdas vacías. Esa columna está

acompañada de otras, que numeran los párrafos, los enunciados y las palabras de

cada oración.

T5. Que numera (Excel) > Numerado (Word)

Archivo numerado: documento en el que se retoma la última columna del archivo que

numera para colocarlo en un documento en Word con formato unificado.

T6. Que numera (Excel) > Para limpiar (Excel)

Archivo para limpiar: base de datos con los elementos y los identificadores de

posición de estos que han sido generados para cada uno hasta ahora, es decir, el

orden secuencial simple y el vector de posición, sin las funciones generadoras.

T7. Para limpiar (Excel) > Que limpia (Excel)

Archivo que limpia: base de datos con las columnas de la anterior y otras en las que

aparecen, sucesivamente, las marcas de párrafo sustituidas por registros en blanco y

las palabras sin signos de puntuación.

T8. Que limpia (Excel) > Para contar (Excel)

Archivo para contar: base de datos en la que se han eliminado los registros en blanco,

se ha generado un orden secuencial para la lista de palabras, sin los demás

7    

elementos de los archivos previos y se han hecho las correcciones manuales, en

caso de que fueran pertinentes.

T9. Para contar (Excel) > Que cuenta (Excel)

Archivo que cuenta: base de datos en la que se han eliminado las columnas vectores

de posición, orden secuencial simple y orden secuencial de palabras para crear la

columna de palabras muestra, en la que se presentará la información

alfabéticamente; además de la columna sumas por palabras tipo, que muestra los

resultados de los datos anteriores.

T10. Que cuenta (Excel) > Contadas (Excel)

Archivo contadas: base de datos en la que se presentan los resultados totales de

palabras tipo y total de muestras por tipo. Así como el cociente entre las anteriores,

es decir, la tasa de repetición de cada palabra tipo.

5. Ejecución del programa

5.1 Requerimientos del sistema

a. Equipo con sistema operativo Windows.

b. Equipo con espacio mínimo del disco duro de 3000 MB.

c. Equipo con memoria RAM mínima de 1024 MB.

d. Paquetería de Microsoft Office, preferentemente en su última versión.2

5.2 Consideraciones previas

a. La recuperación del corpus se realiza manualmente. El proceso del programa

comienza a partir de un documento en Word (Archivo fuente),

recomendablemente este debe tener el mismo formato del Archivo original y no

debe contener imágenes.

b. Se debe contar con el archivo AgraAD_02.bas, ubicado en su disco local, éste

sólo se requiere importar una vez.

c. Durante la ejecución del programa se recomienda:                                                                                                                          2 El programa se ha probado y ha funcionado correctamente en las versiones de MS Office 2007, 2010 y 2013.  

8    

i. No cerrar la aplicación de Word aunque parezca inactiva (no dejará

realizar algún cambio sobre la ventana de Word).

ii. No tener abierto ningún documento en Excel.

iii. Tener abierto únicamente el documento en el que se ejecutará el

programa.

5.3Ejecución por primera vez

1. Abrir el archivo de Word en el que se aplicarán las transformaciones (archivo fuente).

2. Presionar la combinación de teclas: “ALT” + “F11” (en algunos casos, la combinación es “ALT” + “FN” + “F11”), que abrirá una nueva ventana “Microsoft Visual Basic para Aplicaciones”.

9    

3. Seleccionar el menú “Herramientas” y dar clic en la opción “Referencias”.

4. Buscar la leyenda “Microsoft Excel X.X Object Library”, donde X se refiere a la versión de la librería. Esta puede ser 13, 14, 15 o superior. Luego dar clic en la casilla ubicada en el lado izquierdo. A continuación dar clic en “Aceptar”.

10    

5. Dar clic derecho sobre el panel izquierdo, en “Normal” y seleccionar “Importar archivo”.

6. Seleccionar el archivo “AgraAD_02.bas” y presionar “Abrir”.

11    

7. Dar un clic sobre el botón “+” de la opción “Módulos” y luego dar doble clic sobre “AgraAD_02”.

8. Para ejecutar el programa, presionar el botón “Play” o “Ejecutar”.

9. Al dar clic sobre el botón “Ejecutar”, se abrirá una ventana que pedirá que ingrese el nombre de los documentos. Por ejemplo si el documento se llama

1  2    

12    

SC00001.docx, se escribe SC00001. Después de escribir este nombre, presionar “Aceptar”.

10. Lo siguiente que se mostrará será la opción de escoger la carpeta en la que deseemos que se guarden todos los archivos y luego presionar la opción de “Aceptar”.

11. El programa entrará en un modo de ejecución, se confirma que sigue corriendo porque la ventana de “Microsoft Visual Basic para Aplicaciones” tendrá una leyenda en el encabezado que dirá “[ejecutando]”.

12. Durante la ejecución del programa, aparecerá la siguiente advertencia. Seleccionar “Sí”.

2  

1  

1  

2  

13    

13. La ejecución del programa termina cuando aparece el siguiente cuadro de información:

14. Finalmente, podremos ver los archivos con las transformaciones en la carpeta seleccionada previamente.

5.4 Ejecuciones posteriores

Esta parte del manual considera que ya se ha importado la macro a Word.

1. Abrir un documento de Word, que será en el que se realizarán las transformaciones; aparecerá un mensaje de advertencia que se mostrará cada vez que abramos un documento.Sidesea utilizar el programa, dar clic en “Habilitar contenido”.3

                                                                                                                         3Si desea conocer porque se produce una advertencia de seguridad, consulte el siguiente sitio web: https://support.office.com/es-hn/article/Habilitar-o-deshabilitar-macros-en-documentos-de-Office-7b4fdd2e-174f-47e2-9611-9efe4f860b12.  

14    

2. Presionar la combinación de teclas: “ALT” + “F11”, que abrirá una nueva ventana “Microsoft Visual Basic para Aplicaciones”.

3. Presionar el botón de “Play” o “Ejecutar”.

15    

4. Al dar clic sobre el botón de ejecución se repetirá la secuencia de acciones descritas en la sección anterior, del paso 9 al13.

5.5 Eliminación del programa en Word

1. Abrir cualquier archivo de Word.

2. Presionar la combinación de teclas: “ALT”+ “F11”, que abrirá una nueva ventana “Microsoft Visual Basic para Aplicaciones”.

3. Dar clic derecho sobre el panel izquierdo, en“AgraAD_02” y seleccionar la opción “Quitar MacroLexico…”.Cuando aparecerá la advertencia, seleccionar “No”.

1  

2  

16    

4. Al realizar el paso anterior, se habrá eliminado la “MacroLexico”, se sabrá que se ha efectuado porque no aparecerá el mensaje de advertencia de seguridad.