Élaborer une table de données…pas si compliqué mais élémentaire !!!
Photo : André Gagné
Photo : web
Photo : web
Par : Les professionnels du CEF
2008
Pourquoi cette présentation ?
• Au moment des analyses, ça permet d’éviter une perte de temps énorme liées à des manipulations évitables !
• Faciliter la compréhension de tous, plusieurs années plus tard !!!
?
Les feuilles de données (1/2)
• Écrire lisiblement
• Prévoir le nom de la personne qui prendra les données
• La date
• S’organiser en lignes…
• Prévoir les cas litigieux et s’arranger pour les contourner :
• % de fermeture ou d’ouverture ?!• p.p.m = mg/kg ou mg/litre ?!
Les feuilles de données (2/2)Fiche placette centrale 400m²
Date: Equipiers
Coordonnées
Peuplement Azimut
Altitude
% fermeture au centre: Exposition
Pente
Inventaire écoforestier:Densité: Pente: Situation topo: Texture sol:Hauteur: Exposition: Type d'humus: Type dépôt :Perturbation: Drainage: Prof. Humus: Prof. Dépôt:
Arbres sur pied (vivants ou morts)(dhp>9 cm)
No EspèceDHP (2
cm)État (9
classes)No Espèce
DHP (2 cm)
État (9 classes)
No EspèceDHP (2
cm)
État (9 classes
)
Localisation : chiffre site
Remarque :
La table de données Les noms de variables (1/5)
• Les plus simples et courts possibles mais compréhensibles !
• Une variable = une colonne• Plusieurs temps pour la même variable = plusieurs
colonnes
• Décomposer les indicateurs : sapin irrigué et fertilisé dans le bloc 2
bloc espece fertilisation irrigation traitement
2 sab oui oui 2-sab-fer-irr
sujet temps1 temps2 temps3
a 10.2 14.3 18.7
La table de données Les noms de variables (2/5)
• Les variables indicatrices au début du tableau suivies des variables réponses
• Avec majuscules, tout en minuscules…restez constant, certains logiciels sont sensibles (R) !!!
• À éviter :– les caractères spéciaux (/$%?&)– les espaces
Soyez clair et précis, prévoyez une feuille de commentaires où vous expliquerez toutes les
abréviations Ou
si vous utilisez Excel Insertion / Commentaires
Les noms de variables (3/5)
latéralelatérale
Les noms de variables (4/5)
• La colonne « remarque » dans la feuille de données = une cote de validité dans le tableau de données qui permet :
–inclusion dans l’analyse
ou
–exclusion dans l’analyse
VÉRIFIER LES DONNÉES
Les noms de variables (5/5)
VÉRIFIER LES DONNÉES
Vérifier les données
Sélection d’une colonne, clic droit en bas à droite de votre feuille
Graphiques et tableaux croisés dynamiques
Les tableaux croisés dynamiques (1/6)
• Pour valider les données et dégager des tendances en faisant des graphiques
Les tableaux croisés dynamiques (2/6)
Sélection de la plage de données
Les tableaux croisés dynamiques (3/6)
Les tableaux croisés dynamiques (4/6)
Les tableaux croisés dynamiques (5/6)
Les tableaux croisés dynamiques (6/6)
On ne peut pas importer ces tableaux dans un logiciel de traitement statistiques
• Sous peine de devoir recommencer la saisie ou de devoir faire des manipulations plus ou moins complexes
Date Point Parcelle Echelle haut midh midb bas502 1 A 10 50 40 20 70502 1 B 10 0 0 10 10502 1 C 10 0 0 10 10502 1 D 10 40 50 40 50502 1 I 25 0 70 100 100502 1 J 25 0 0 25 70502 1 K 25 95 90 90 60502 1 L 50 50 60 70 50502 1 M 50 60 50 80 70502 1 N 50 95 85 95 100515 2 A 10 20 50 40 100515 2 B 10 0 5 15 75515 2 C 10 20 40 10 20515 2 D 10 100 100 100 100515 2 I 25 20 30 75 100515 2 J 25 50 10 10 80515 2 K 25 20 80 100 100515 2 L 50 20 20 45 85515 2 M 50 5 30 30 85
La règle d’or Une ligne = un échantillon
Données originales (1/6)
• Avant toutes manipulations, garder une copie de la table originale et manipuler sur une copie en créant des sauvegardes régulières
Exemple : terrain2008ori.xls
terrain2008_05092008.xls
terrain2008_06092008.xls
etc.
Données originales (2/6)
• Dans votre classeur Excel, la feuille la plus à gauche contiendra SEULEMENT les données originales dans un tableau CONTINU
Date Point Parcelle Echelle haut midh midb bas502 1 A 10 50 40 20 70502 1 B 10 0 0 10 10502 1 C 10 0 0 10 10502 1 D 10 40 50 40 50502 1 I 25 0 70 100 100
Date Point Parcelle Echelle haut midh midb bas502 1 A 10 50 40 20 70502 1 B 10 0 0 10 10502 1 C 10 0 0 10 10502 1 D 10 40 50 40 50502 1 I 25 0 70 100 100502 1 J 25 0 0 25 70
Données originales (3/6)
• Ne JAMAIS laisser de cellules vides
bloc couleur valeur
1 rouge 12
vert 18
bleu 44
2 rouge 15
vert 16
bleu 14
bloc couleur valeur
1 rouge 12
1 vert 18
1 bleu 44
2 rouge 15
2 vert 16
2 bleu 14
Données originales (4/6)
• Les données manquantes doivent être indiquées par « . »
• Attention, différencier une valeur manquante de la valeur nulle (0) !!!
bloc couleur valeur
1 rouge 12
1 vert .
1 bleu 44
2 rouge 0
2 vert 16
2 bleu 14
Données originales (5/6)
• Être constant dans les codes :
ABBA ≠ abba ≠ Abba
• Codage des données numériques avec « . » ou « , » qu’est-ce que l’ordinateur utilise ?Si on ne sait pas…utiliser la touche décimale de la partie calculatrice du clavier
bloc couleur valeur
1 Rouge 12
1 vert .
1 bleu 44
2 rouge 0
2 vert 16
2 bleu 14
Données originales (6/6)
• Inclure les cas où les espèces n’ont pas été observées
(écologie !!!)
Espèce Site Abondance
A 1 2
B 1 5
A 2 4
C 2 3
B 3 5
C 4 2
Espèce Site Abondance
A 1 2
B 1 5
C 1 0
A 2 4
B 2 0
C 2 3
A 3 0
B 3 5
C 3 0
A 4 0
B 4 0
C 4 2
Analyses sur les tables
Une feuille pour les données originales, les autres pour les
tableaux-croisés dynamiques ou les graphiques
• Aller de gauche à droite, en gardant TOUJOURS une feuille contenant les données brutes
Table de données vs base de données
• Une table est organisée en lignes et en colonnes
• Une base de données est un ensemble de fichiers et de tables permettant de stocker un grand nombre d’informations
Conclusion
• Rester logique et structuré
• Les données brutes
• Sauvegardes
• Une feuille « commentaires » (les unités de mesure, les abréviations, les notes personnelles…)
Questions ?