del pino johanna salazar gustavo. estudiantes enfrentan semestre a semestre la dificultad de...

22
Análisis de Métricas de Similaridad Usadas en un Algoritmo de Filtro Colaborativo Basado en el Usuario Para Recomendar Materias de Pregrado Del Pino Johanna Salazar Gustavo

Upload: josue-calistro

Post on 23-Jan-2016

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Análisis de Métricas de Similaridad Usadas en un

Algoritmo de Filtro Colaborativo Basado en el Usuario Para Recomendar

Materias de Pregrado

Del Pino JohannaSalazar Gustavo

Page 2: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar

La ESPOL no cuenta con una solución tecnológica que asista a sus estudiantes en esta tarea.

Descripción del Problema

Page 3: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Aportar al desarrollo tecnológico de los servicios informáticos de la ESPOL.

Aprovechar la Información que posee la ESPOL de sus registros para ponerlo al servicio de sus estudiantes.

Aplicar una tecnología innovadora para resolver el problema expuesto.

Motivación

Page 4: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Crear un recomendador de materias basado en el usuario

Adaptar el recomendador de materias para que realice comparaciones de historiales Académicos

Analizar el comportamiento del recomendador de materias con diferentes métricas de similaridad

Análisis de la Solución

Page 5: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Lógica del Recomendador

?ALGEBRA

FISICA

CALCULO

LAB. FISICA

UTILITARIOS

Page 6: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Limitaciones del Recomendador basado en el usuario

ESTUDIANTE A

VECINOS DE AESTUDIANTE BY B TAMBIEN

ESTUDIANTE A ESTUDIANTE B

1 1 1 1 1 2 2

2222

3

3

3

3 3 3

4

4 4

4

4

5 5

5 5

5

5

6 6 6 6 6

67

7

7

7 7

7

Page 7: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Métricas de similaridad

Estudiante A Estudiante B

COEFICIENTE DE SIMILARIDAD DE TANIMOTON(A∩B)

N(A ∪B)=

2

9

Page 8: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Métricas de similaridad

COEFICIENTE DE SIMILARIDAD LOGLIKELIHOOD

Estudiante A Estudiante B

k11

k22

k21k12

Page 9: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Se crean vecindades comparando Historiales Académicos

◦ Se identifican tendencias en la forma de aprobar las materias del flujo de la carrera

Adaptación del Recomendador

Page 10: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Proceso de Recomendación

Page 11: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Proceso de Recomendación (II)

101 6

102 3

103 2

104 2

105 1

106 1

101 6

102 3

103 2

104 2

105 1

106 1

6 1

X 0,5

X = 0,5*6X = 3

Nearest - N Umbral

N = 4

Page 12: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Proceso de Recomendación (III)

Fundamentos deProgramación

Page 13: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Implementación

Page 14: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Pruebas

SimilaridadVecindadEstudianteSemestre

Del segundo al

octavo

N cercanosN=2n ; 0 ≤ n ≤7 Tanimoto

LoglikelihoodUmbral

0.2 ->0.9

Ingreso desde el

2007

Aciertos

Recall

Page 15: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Vecindades de Tipo N Cercanos

Resultados

Semestre 2 Semestre 5

Semestre 8

Page 16: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Vecindades de Tipo Umbral

Resultados (II)

Semestre 2 Semestre 5

Semestre 8

Page 17: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Loglikelihood

Resultados (III) Tanimoto

Page 18: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Adaptación exitosa del recomendador con un valor de acierto de 0.83, métrica Loglikelihood y vecindad N Cercanos de Tamaño 64, similaridad promedio de 0.57, desviación estándar de 0.11

Loglikelihood comportamiento más certero y uniforme. Tanimoto comportamiento variable y acierto bajo en algunos semestres.

Conclusiones

Page 19: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Vecindad de Tipo Umbral obtiene valores de acierto menores a vecindad de tipo N Cercanos

Recomendaciones optimas pero no ideales.

Tiempos de procesamiento por estudiante redondean los 10 seg.

Conclusiones (II)

Page 20: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Encontrar el tamaño de vecindad óptimo dentro del rango [32,128)

Pruebas que midan la efectividad de las recomendaciones en base a decisiones posteriores a consulta

Considerar este trabajo como la base de implementación de una aplicación al alcance de los estudiantes

Recomendaciones

Page 21: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

considerar otros factores de criterio como: las notas de los estudiantes, valoraciones de los profesores en el CENACAD, etc.

Las recomendaciones deben ser calculadas de manera previa a la consulta de los estudiantes

Si se desea realizar recomendaciones en tiempo real se debe trasladar el recomendador de materias a un ambiente distribuido

Recomendaciones (II)

Page 22: Del Pino Johanna Salazar Gustavo.  Estudiantes enfrentan semestre a semestre la dificultad de decidir respecto a las materias que pueden tomar  La ESPOL

Gracias por su atención!