2005-12-31
Your NameYour Title
Your Organization (Line #1)Your Organization (Line #2)
TIBERIUS
Predictive Modelling Software
Introducción a los Sistemas Inteligentes
Gabriel Cartuccia Rodrigo Varela
01/11/2010
2
Agenda
Introducción a la herramientaQué problemas resuelveFuentes de datos soportadasExportación de los resultadosFuncionamiento
Parametrización de input y outputConfiguración y entrenamiento del modeloResultados
PrediccionesImportancia de las variablesHistogramasGráficos de dispersión
DemoConclusiones
3
Introducción a la herramienta
Es una herramienta para el modelado y visualización de datos
Ganadora de varios certámenes internacionales como la herramienta más precisa (NCDM Analytic Challenge 2008, BI CUP 2006, entre otros)
Corre en plataforma Windows
30 días de prueba con limitaciones en la cantidad de datos de entrada, después debe pagarse una licencia
Existe una licencia estudiantil (¡nosotros conseguimos una!)
Múltiples técnicas de modelado (redes neuronales, árboles de decisión, entre otras)
Construcción gráfica de los modelos
Resultados presentados en tablas y gráficos (2D y 3D)
Sitio web: http://www.tiberius.biz
4
Qué problemas resuelve
Tiberius es ideal para:
Modelado de respuesta de clientes
Modelado de valores de divisas (tipos de cambio)
Predicción de riesgo crediticio
Modelado de procesos industriales
En general, cualquier problema que requiera construir un modelo predictivo
Tiberius incluye:
Redes neuronales
Árboles de decisión
Curvas de regresión
Categorizador de variables
Visualización de datos en 3D
Herramientas para monitorear los modelos
Recodificación de datos
Procesos batch
Entre otras características...
5
Fuentes de datos soportadas
Tiberius puede abrir nativamente los siguientes archivos:
Microsoft Excel (.xls)
Microsoft Access (.mdb)
dBase (.dbf)
Archivos de texto separados por tabulaciones (.tab)
Archivos de texto separados por comas (.csv)
Instalando los drivers de bases de datos apropiados:
IBM SPSS - Statistical Package for the Social Sciences (.sav)
Cualquier base de datos compatible con ODBC:
Oracle
SQL Server
MySQL
Teradata
SAS
6
Exportación de los resultados
Tiberius Weight File (.twf)Microsoft Excel Open XML Macro-Enabled Spreadsheet (.xlsm)Visual Basic Project (.vbp)HTML (.html)Archivos de texto plano (.txt)
7
Funcionamiento
8
Parametrización de input y output
Se elige la fuente de datos y se definen las variables de input y de output deseadas.
9
Configuración y entrenamiento del modelo
Para el caso de problemas de clasificación, se configura la red neuronal y se la entrena con el set de datos dado en el paso anterior.
10
Resultados
Funcionamiento
11
Resultados – Predicciones
Una vez construido el modelo, la herramienta utiliza los resultados obtenidos a partir de los datos de entrenamiento para predecir la clase de los datos de prueba.
12
Resultados – Importancia de las variables
Una vez que el modelo ha sido construido, es útil determinar qué atributos de entrada son los más relevantes.
13
Resultados – Histogramas
Histogramas (separados por clase)
de los datos en bruto, los resultados
finales del modelo y los errores del
mismo.
Estos histogramas muestran gráfica-
mente por qué ciertas variables son
importantes y por qué otras no.
14
Resultados – Gráficos de dispersión
Se muestran los datos en bruto del conjunto de entrada.
15
Demo
Veamos a la herramienta en acciónmediante un ejemplo de clasificaciónde flores usando redes neuronales
16
Conclusiones
Ventajas:Facilidad de usoSoporta múltiples formatos de datos de entrada, incluyendo los datos almacenados por los principales motores de bases de datos del mercadoModelado visualResultados mostrados gráficamente
Desventajas:Es software comercial, si no se compra una licencia hay un límite en la cantidad de datos de entrada
17
¡Muchas gracias!
Gabriel CartucciaRodrigo Varela