traitement automatique des données chapitre 4 – le logiciel...
Post on 16-Jul-2020
7 Views
Preview:
TRANSCRIPT
03/01/2018
1
Traitement automatique des données
Chapitre 4 – Le logiciel SPSS –
Dr. Bouaziz A. 2017/2018
Faculté des Sciences Economiques Commerciales et de Gestion
Département des Sciences Commerciales
MASTER2 -Finance et Commerce International- (S3)
Introduction
Analyse des données
Le traitement des données par ordinateur
Logiciels appropriés
SPSS Software Définition et caractéristiques
Installation
Démarrer SPSS
Personnalisation du logiciel
Survol sur l’interface
Travaux pratiques: méthodes d’analyse TP0
TP00
TP1 TP5
TP2 TP6
TP3 TP7
TP4 TP8
Plan
10/06/2016 Bouaziz Amira 2 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 2 2017/2018
03/01/2018
2
Introduction
● Analyse des données
● Le traitement des données par ordinateur
● Logiciels appropriés
● SPSS Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
● Travaux pratiques: méthodes d’analyse ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8…
Agenda
10/06/2016 Bouaziz Amira 3 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 3 2017/2018
Introduction (1/1)
10/06/2016 Bouaziz Amira 4 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 4 2017/2018
∑ Données
Analyse de données
Découverte de l’information
Extraction de l’information
Analyse des caractéristiques
Intelligence commerciale
∑ Décisions
Data analysis / analytics
Knowledge discovry/ mining
Knowledge extraction
Pattern analysis
Business intelligence
03/01/2018
3
● Introduction
Analyse des données
● Le traitement des données par ordinateur
● Logiciels appropriés
● SPSS Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
● Travaux pratiques: ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8
Agenda
10/06/2016 Bouaziz Amira 5 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 5 2017/2018
Analyse des données (1/7)
10/06/2016 Bouaziz Amira 6 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 6 2017/2018
Pourquoi l’analyse des données
Que peut-on
apprendre à
partir de ces
données ? Comment extraire les phénomènes, les lois, les connaissances que recèlent ces données que nous ne pouvons appréhender directement? Sachant que: le monde est
fondu dans les données: «
tout est données »
- Projeter les points de données sur X-Y ou Y-z, que pouvons nous apprendre?
- Le taux de la création de données accélère chaque année!
- Comment transférer des grandes masses de données en information … connaissance … intérêt?
03/01/2018
4
Analyse des données (2/7)
10/06/2016 Bouaziz Amira 7 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 7 2017/2018
- Ensemble de méthodes descriptives ayant pour objectif de résumer et
visualiser l’information pertinente contenue dans un grand tableau de
données
Ou
- Synthétiser, structurer l’information contenue dans des données
multidimensionnelles (n individus, p variables).
Ou
- Extraction des caractéristiques ou informations pertinentes depuis
une masse de données, où ces informations:
- implicites,
- antérieurement inconnue,
- potentiellement utiles,
- non triviales
Définitions
Analyse des données (3/7)
10/06/2016 Bouaziz Amira 8 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 8 2017/2018
- Télécommunication
- Études de développement de société
- Détection d’intrusion
- Le monde de business
- L’intelligence artificielle
- L’analyse de données biologiques
- Sciences et apprentissage
Différentes utilisations de l’ADD
03/01/2018
5
Analyse des données (4/7)
10/06/2016 Bouaziz Amira 9 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 9 2017/2018
- Fournir la prédiction de payement et la politique de l’analyse de crédit
des clients
- Classification et regroupement des consommateurs pour un marketing
ciblé
- Détection de de l’action de blanchir l’argent et d’autres crimes
financières
Utilisation en Business – exemple 1 : Finance –
- Analyse multidimensionnel des ventes, consommateurs, produits,
époque, et région
- Analyse de l’efficacité des opérations de ventes
- Rétention des consommateurs / analyse de la fidélité du consommateur
- Recommandation et comparaison de produits
Utilisation en Business – exemple 2 : Ventes en détail –
Analyse des données (5/7)
10/06/2016 Bouaziz Amira 10 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 10 2017/2018
Point de rencontre de plusieurs disciplines
Statistique Visualisation
Algorithmique
Applications Technologie BDs
Computation évoluée
Apprentissage de la maching
Reconnaissance des
caractéristiques
- Quantité explosive de données; Giga à Tera à Petabits
- Dimensionnalité élevée de données: micro-tableaux à 1000 dimensions
- Différence des types de données: web, documents, transactions, classes…
- Complexité élevée de données: multimédia, programmes parallèles, détecteur de
données, …
- Différence des domaines de données: business, science, société…
- Nouvelles applications sophistiquées
Pourquoi?
03/01/2018
6
Analyse des données (6/7)
10/06/2016 Bouaziz Amira 11 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 11 2017/2018
Objectif: depuis les données à la décision (exemple illustratif)
Données
Information
Connaissance
Décision/Compétence
- Client - Stock - Ventes - Démographie - Géographie
- X habite à la région R - Y a A ans - Z gâche de l’argent à
la cité V situé à R
- Une quantité du produit P est vendue à la région R
- Les familles ayant le profile F utilisent M% du produit p à la période N
- Faire des promotions sur P à R durant N
- Envoyer de la pub à propos du P à F
Analyse des données (7/7)
10/06/2016 Bouaziz Amira 12 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 12 2017/2018
Prise de décision
Présentation de l’info
Extraction /
découverte de l’information
Exploration des données
Résumés statistiques, requêtes, rapports
Prétraitement/ intégration des données
Sources de données Papiers, Fichiers, Documents web, Expérimentations scientifiques, SGBD
Administrateur de BD
Analyste de données
Analyste de business
Utilisateur final
Processus de la prise de décision en Business: découverte de l’information
Techniques de visualisation
03/01/2018
7
● Introduction
● Analyse des données
Traitement des données par ordinateur
● Logiciels appropriés
● SPSS Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
● Travaux pratiques: ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8
Agenda
10/06/2016 Bouaziz Amira 13 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 13 2017/2018
Traitement de données par ordinateur (1/2)
10/06/2016 Bouaziz Amira 14 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 14 2017/2018
- Machine: mémoire, processeur, périphériques d’entrées, afficheurs, détecteurs…
- Ensemble de logiciels: système d’exploitation, logiciels d’application (Analyse et
traitement de données: SPSS),
- Autres: services Internet, services du cloud computing, big data (BDs), …
Boite noire:
Résultat
Données
Format brut caractères alphanumériques, …
Format interprétable Graphiques, taux,
03/01/2018
8
Traitement de données par ordinateur (2/2)
10/06/2016 Bouaziz Amira 15 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 15 2017/2018
Tableaux alphanumériques, … Graphiques interprétables
● Introduction
● Analyse des données
● Traitement des données par ordinateur
Logiciels appropriés
● SPSS Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
● Travaux pratiques: ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8
Agenda
10/06/2016 Bouaziz Amira 16 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 16 2017/2018
03/01/2018
9
Logiciels appropriés (1/1)
10/06/2016 Bouaziz Amira 17 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 17 2017/2018
- Des logiciels spécialisés pour l’analyse de données en statistique et
économétrie: open source, domaine publique, propriétaires, ...
- open source: R software, JASP, Orange, …
- domaine publique: CSPro, Epi Info
- Propriétaires: Analytica, Matlab, Mathematica, SPSS Statistics, MedCalc, SAS,
Statistica, …
Logiciels statistiques:
- Contexte et domaine d’étude (étudiant/ expert, publique/ spécialisé)
- Convenance avec les systèmes d’exploitations
- Supporter les différentes méthodes d’analyse et structures de données:
régression, séries de temps, [ANOVA!], …
- Interface, visualisation, contrôle de données, langage de développement/
programmation
- …
Choix?
● Introduction
● Analyse des données
● Traitement des données par ordinateur
● Logiciels appropriés
SPSS Statistics Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
● Travaux pratiques: ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8…
Agenda
10/06/2016 Bouaziz Amira 18 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 18 2017/2018
03/01/2018
10
SPSS Software (1/7)
10/06/2016 Bouaziz Amira 19 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 19 2017/2018
- Statistical Package for Social Sciences (SPSS): un logiciel utilisé pour
l’analyse statistique (écrit en Java)
- Première version: 1968 par SPSS
- Dernière version: 2017 (25)
- Licence: propriété d’IBM Cor. (acheté en 2009) (www.ibm.com/us-
en/marketplace/spss-statistics)
- Supporte les systèmes d’exploitation: Windows, Linux, Mac, Unix
- Plusieurs versions: 22
- Interface graphique conviviale
- Séparation des fichiers des données
- Fonctionnalités accessibles à travers des menus déroulants organisés et
regroupés: plusieurs fonctions statistiques
- Possibilité d’ajouter des modules pour augmenter les fonctionnalités
Définition et caractéristiques:
SPSS Software (2/7)
10/06/2016 Bouaziz Amira 20 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 20 2017/2018
Afin d’installer SPSS 22, suivre les instructions sur le guide de
l’installation joint en annexe
[guide installation SPSS 22]
Installation:
03/01/2018
11
SPSS Software (3/7)
10/06/2016 Bouaziz Amira 21 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 21 2017/2018
Démarrer SPSS 22:
SPSS Software (4/7)
10/06/2016 Bouaziz Amira 22 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 22 2017/2018
Démarrer SPSS 22:
03/01/2018
12
SPSS Software (5/7)
10/06/2016 Bouaziz Amira 23 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 23 2017/2018
Démarrer SPSS 22:
SPSS Software (6/7)
10/06/2016 Bouaziz Amira 24 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 24 2017/2018
Survol sur l’interface (1/2): présentation des différentes parties Boutons de
redimensionnement
Barre de menus de commandes
Nom du fichier
Barre d’outils
Afficheur des données
Afficheur des variables
03/01/2018
13
SPSS Software (7/7)
10/06/2016 Bouaziz Amira 25 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 25 2017/2018
Survol sur l’interface (2/2): vue de données / vue de variables
Vue des variables
Vue des données
Outils
Analyse
Résultats
Questionnaire établi: - Coder les variables (questions) - Saisir les variables
Réponses recueillies depuis les questionnaires distribués: - Entrer les instances recueillies
Établir la méthode d’analyse la plus convenable (décidée) À valider ou rejeter une (plusieurs ) hypothèse (s)
● Introduction
● Analyse des données
● Traitement des données par ordinateur
● Logiciels appropriés
● SPSS Statistics Software ● Définition et caractéristiques
● Installation
● Démarrer SPSS
● Personnalisation du logiciel
● Survol sur l’interface
Travaux pratiques: méthodes d’analyse ● TP0
● TP00
● TP1 TP5
● TP2 TP6
● TP3 TP7
● TP4 TP8
Agenda
10/06/2016 Bouaziz Amira 26 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 26 2017/2018
03/01/2018
14
Travaux pratiques (TP0)
10/06/2016 Bouaziz Amira 27 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 27 2017/2018
- Se familiariser avec l’environnement du travail SPSS
- Exploiter son premier questionnaire
- Créer son premier fichier de données « .sav »
- Saisie de variables (toutes les questions)
- Personnaliser la vue de variables
TP0 Exploration de la vue des variables
Travaux pratiques (TP00)
10/06/2016 Bouaziz Amira 28 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 28 2017/2018
- Saisie de données
- Gestion des fichiers « .sav » et des observations
- Importer des données depuis Excel
TP00 Exploration de la vue des données
03/01/2018
15
Travaux pratiques (TP1)
10/06/2016 Bouaziz Amira 29 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 29 2017/2018
- Calcul et recodage des variables
- Gestion des valeurs manquantes
- Test de normalité: KS
- Test de fiabilité de l’outil de recueil de données: Alpha de crombakh
TP1 Prétraitement + Interprétation
Travaux pratiques (TP2)
10/06/2016 Bouaziz Amira 30 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 30 2017/2018
- Analyse descriptive: variables quantitatives
- Analyse des fréquences: variables qualitatives
- Tableaux d’effectifs et de fréquences, histogrammes, Tukey box plot
- Diagrammes à bâtons, diagrammes à secteurs
TP2 Analyse descriptive + Interprétation
03/01/2018
16
Travaux pratiques (TP3)
10/06/2016 Bouaziz Amira 31 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 31 2017/2018
- Récupérations des fichiers échantillons depuis SPSS
- Test T à échantillon uniques (v. quant)
- Test T à échantillons indépendants (v. quant)
- Test T à échantillons appariés (v. quant)
- Test Anova: analyse des variances, test d’indépendance (v. quant/
v.qual) [+ Lecture et interprétation du Test Levene]
TP3 Tests de comparaison de moyennes + Interprétation
Travaux pratiques (TP4)
10/06/2016 Bouaziz Amira 32 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 32 2017/2018
- Lecture des tableaux croisés simples/effectifs (v. qual /v. qual)
- Appel aux variables de contrôle: étude de cas et interprétation
TP4 Test de Khi2 + Interprétation
03/01/2018
17
Travaux pratiques (TP5)
10/06/2016 Bouaziz Amira 33 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 33 2017/2018
- Réalisation d’une corrélation linéaire simple « Pearson » (v. quant/ v.
quant)
- Lecture et interprétation des résultats
TP5 Corrélation
Travaux pratiques (TP6)
10/06/2016 Bouaziz Amira 34 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 34 2017/2018
- Réalisation d’une régression linéaire simple
- Lecture et interprétation des résultats
TP6 Régression
03/01/2018
18
Travaux pratiques (TP7)
10/06/2016 Bouaziz Amira 35 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 35 2017/2018
Réalisation d’une ACP
Interprétation et considérations
TP7 Analyse des composantes principales (ACP)
Travaux pratiques (TP8)
10/06/2016 Bouaziz Amira 36 Informatique 2 2 2016/2017 Traitement automatique des données Chap4 36 2017/2018
- Conseils: Diagrammes, couleurs, et présentations
- Exemples
TP8 Rapports de synthèse
top related