info cognitives
DESCRIPTION
Info CognitivesTRANSCRIPT
IFT 703IFT 703Informatique cognitiveInformatique cognitive
IntroductionIntroduction
André Mayers Automne 2010
PlanPlan
Description du plan de cours Introduction à l’informatique cognitive
◦ Intelligence artificielle
◦ Psychologie cognitive
◦ Neuropsychologie
Introduction aux architectures cognitives◦ Historique
2
Sciences cognitivesSciences cognitives
Les sciences cognitives ont pour objet l’étude des systèmes intelligents dans leurs aspects représentationnels et computationnels.
Les systèmes intelligents sont des systèmes complexes de traitement de l'information capable d'acquérir, conserver, utiliser et transmettre des connaissances.
Les sciences cognitives s’intéressent◦ à la théorie abstraite des processus intelligents,
◦ à l’intelligence des machines artificielles,
◦ à l’étude de l’intelligence humaine et animale.
Les sciences cognitives étudient les phénomènes suivant◦ la perception, l’attention, le langage, les mécanismes de
résolution de problèmes (conception, planification…)
3
Les disciplines des sciences cognitivesLes disciplines des sciences cognitives
4
Philosophie
Linguistique
Anthropologie
Neurosciences
Informatique
Psychologie
Informatique cognitiveInformatique cognitive
Discipline des sciences cognitives But de l’informatique cognitive :
◦ Concevoir des modèles computationnels des processus cognitifs
Architecture cognitive◦ Modèle complet de la cognition humaine
Intégration de modèle computationnel de l’usager dans les systèmes homme-machine◦ Systèmes tutoriels intelligents
◦ Habitats intelligents
◦ Contrôle de systèmes complexes Centrales nucléaires ou électriques
5
Intelligence artificielleIntelligence artificielle
Résoudre des problèmes pour lequel il n’existe pas d’algorithmes dédiés connus◦ Fouille dans un espace d’état
Symbolique Forage de donnée, réseau de neurones, algorithme génétique
Deux approches◦ Intelligence générale
◦ Simulation de l’intelligence naturelle ou humaine
6
Psychologie Psychologie
Le behaviorisme considère les processus cognitifs comme une boîte noire et essaie de prédire le comportement (sortie de la boîte noire) en fonction des stimuli (entrée de la boîte noire).
La psychologie cognitive essaie de prédire le comportement en fonction des stimuli et d’hypothèses sur la boîte noire et ses processus◦ L’individu a un état interne qui influence son comportement
◦ La méthode scientifique aide à choisir l’hypothèse la plus plausible Les liens entre un concept théorique et les expériences le mettant en
valeur peuvent être complexes (entre une particule atomique et sa trace sur une photographie).
◦ Les processus cognitifs doivent être plausibles compte tenu des connaissances que nous avons sur le cerveau
7
Psychologie cognitivePsychologie cognitive
Étude de la pensée et de ses mécanismes pris dans un sens large. ◦ la perception
◦ la résolution de problèmes
◦ la mémoire
◦ les fonctions exécutives attention planification prise de décision …
4 approches ◦ Traitement de l’information
utilisation de symboles et d’abstraction
◦ Basé sur la biologie voir aussi neuropsychologie
◦ Basé sur les processus de l’évolution
◦ Une combinaison des trois précédentes
8
9Approche traitement de l’informationApproche traitement de l’information
Modèle modale◦ Atkinson & Shiffrin (1968)
◦ Information encodée sous sa forme perceptuelle dans la mémoire sensorielle
◦Information est transmise dans la mémoire à court terme (MCT) Capacité limitée et dégradation rapide de l’information
◦ Information est ensuite transmise avec une certaine probalité dans la mémoire à long teme (MLT) Capacité infinie et dégradation lente
9
Approche traitement de Approche traitement de l’information l’information
Module exécutif central : sélectionne et manipule le contenu des modules esclaves
Boucle phonologique : ◦ tampon à court terme : encode l’information sous sa forme verbale
◦ boucle articulatoire : processus de rafraichissement de l’information
Tablette Visuo-spatiale Visuo-spatial sketchpad: encode sous l’information sous sa forme spatiale ou visuelle
10
Modèle de la mémoire de travail
Baddeley et Hitch’s (1974)
NeuropsychologieNeuropsychologie
La neuropsychologie est une discipline scientifique et clinique qui étudie les fonctions mentales supérieures dans leurs rapports avec les structures cérébrales au moyen d'observations menées auprès de patients présentant des lésions cérébrales accidentelles, congénitales ou chirurgicales.
Son objectif est la compréhension du système cognitif normal et anormal par le biais de l'étude de ses dysfonctionnements.
11
Architecture cognitiveArchitecture cognitive
Architecture informatique◦ ensemble de structures fixes permettant à un système d’être
programmé
Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des
processus cognitifs indépendance de la tâche modéliser
◦ une théorie générale de la cognition,
◦ intègre plusieurs théories spécifiques perception, attention, mémoire …
◦ une explicitation de la boîte noire
13
Architecture cognitive computationnelleArchitecture cognitive computationnelle
Une architecture cognitivive pouvant servir de devis pour concevoir un programme
Un modèle informatique d’une architecture cognitive ◦ de simuler avec un ordinateur des comportements complexes
◦ de générer des hypothèses qui pourront être validés expérimentalement
14
Caractéristiques des architectures cognitivesCaractéristiques des architectures cognitives
Degré de dépendance par rapport à un domaine. ◦ généralisation possible
Degré de spécification ◦ sa distance d’un modèle computationnel
Étendue des fonctions cognitives modéliser explicitement◦ attention, mémoire, processus subsymboliques
Adéquation aux résultats expérimentaux
15
Architecture cognitive : définitionArchitecture cognitive : définition
“The fixed (or slowly varying) structure that forms the framework for the immediate processes of cognitive performance and learning” ◦ Newell, 1990, p. 111
“The functional architecture includes the basic operations provided by the biological substrate, say, for storing and retrieving symbols, comparing them, treating them differently” ◦ Pylyshyn, 1984, p. 30
“ A specification of the structure of the brain at a level of abstraction that explains how it achieves the function of the mind” ◦ Anderson, 2007, p. 7
La notion d’architecture cognitive permet de ne pas s’enfarger ◦ dans la complexité du cerveau humain (1012 cellules) en faisant
abstraction du but des structures du cerveau
◦ dans la multiplicité des explications du comportement humain en faisant abstraction du cerveau qui doit les produire
16
Les niveaux d’une architecture cognitive Les niveaux d’une architecture cognitive (Newell)(Newell) Tout dans la nature peut être décrit à différents niveaux
◦ La matière peut être décrit au niveau subatomique, atomique, moléculaire, nano, …
il en est de même pour les architectures cognitives
Un niveau dans une architecture consiste ◦ en un medium qui est manipulé
◦ des composantes qui permet les opérations de base
◦ des lois de composition qui permet d’assembler les composantes
◦ du système formé à l’aide des lois de composition
◦ des lois comportementales qui décrit le comportement du système les lois comportementales découlent du comportement de ses
composantes et de la façon dont elles sont assemblées.
17
Les niveaux de traitementLes niveaux de traitement
Le niveau du milieu est l’architecture qui manipule le contenu du niveau supérieur et est en même temps le contenu manipulé par le niveau du bas.
Une architecture offre des outils pour manipuler le contenu, p. ex. un traitement de texte offre des outils pour manipuler du texte.
18
Description d’un niveauDescription d’un niveau
Un niveau peut être décrit de deux façons ◦ autonome
Un programmeur n’a pas besoin de connaître le niveau de la logique des circuits
Un concepteur de circuits logiques n’a pas besoin de connaître les lois régissant le magnétisme ou le courant électrique
◦ par réduction au niveau précédent On explique les circuits logiques en terme des circuits
électriques
19
Description autonome du niveau connaissance Description autonome du niveau connaissance d’un agentd’un agent
La principale caractéristique du niveau connaissance est que son comportement est uniquement déterminé par ses connaissances et non par sa structure ou ses composantes.
Un agent au sens de l’intelligence artificielle possède ◦ des connaissances et des buts
◦ des composantes pour percevoir et agir dans son environnement
Le principe de rationalité ◦ Si un agent a la connaissance qu’une de ses actions lui permettra
d’atteindre un de ses buts alors il choisit cette action
Que pensez d’un thermostat ?
20
Médium connaissance
Composantes sans importance selon Newell
Lois de composition sans importance selon Newell
Système agent au sens AI
Lois comportementale le principe de rationalité
La description du niveau connaissance avec le La description du niveau connaissance avec le niveau sous-jacentniveau sous-jacent
21
Attribut \ Niveau
Connaissance Symbolique
Médium Connaissance Structure symbolique, Attributs subsymboliques
Composantes N. A.Sous-systèmes symboliques, de perception et moteur
Lois de composition
N. A.Échange de structures symboliques entre les sous-systèmes
SystèmeAgent intelligent
Système symbolique complet (architecture cognitive)
Lois comportementales
Principe de rationalité
Processus symbolique (Modèle mathématique des traitements de symboles)
Les niveaux d’architecture pour un agent intelligent Les niveaux d’architecture pour un agent intelligent informatiséinformatisé
Connaissance◦ le médium est constitué des connaissances
Programme ◦ le médium sont les symboles
Registre, ◦ le médium est le vecteur de bits
◦ les actions sont les transferts entre les registres ou la mémoire
Circuit logique ◦ le medium est le bit
Circuit électrique ◦ le médium est le courant électrique
Matériel ◦ le médium est l’électron avec toutes ses propriétés
22
Le niveau intelligence d’une architecture Le niveau intelligence d’une architecture cognitivecognitive Comme au niveau intelligence, les composantes et la structure
ne sont pas importantes alors une description autonome du niveau intelligence d’une architecture cognitive est la description de la « logique » de ses comportements en fonction de son environnement. ◦ Pas très réjouissant comme constatation pour des informaticiens
La solution est de le décrire en le réduisant au niveau précédent, i.e. au niveau d’un système de symbole ou programme. ◦ Tous les programmes ou systèmes de symboles ne sont pas des
agents intelligents, ils doivent respecter le principe de rationalité.
Il ne faut pas non plus s’enfarger dans les détails du programme et l’idéal est de créer une abstraction au niveau symbolique ainsi que le modèle mathématique décrivant les manipulations symboliques. ◦ C’est à ce niveau d’abstraction que nous décrirons les architectures
cognitives comme ACT-R et SOAR Nous décrirons les modules de ACT-R et l’espace problème de SOAR
◦ C’est aussi à ce niveau que vous devrez décrire les architectures dans vos travaux et présentations
23
La description du niveau connaissance avec le La description du niveau connaissance avec le niveau sous-jacent (bis)niveau sous-jacent (bis)
24
Attribut \ Niveau
Connaissance Symbolique
Médium Connaissance Structure symbolique, Attributs subsymboliques
Composantes N. A.Sous-systèmes symboliques, de perception et moteur
Lois de composition
N. A.Échange de structures symboliques entre les sous-systèmes
SystèmeAgent intelligent
Système symbolique complet (architecture cognitive)
Lois comportementales
Principe de rationalité
Processus symbolique (Modèle mathématique des traitements de symboles)
Comment la cognition est-elle possible dans Comment la cognition est-elle possible dans l’univers physique ?l’univers physique ?
Comment expliquer les fonctions mentales à partir du cerveau ?◦ Comment expliquer une maison à un extraterrestre ?
C’est certain qu’il faut décrire l’architecture d’une maison, mais est-ce suffisant ?
Il faut aussi expliquer pourquoi l’architecture est ce qu’elle est pour répondre aux besoins humains
Ce sont les contraintes (humain, économique… ) du marché qui font que les maisons ont la forme qu’elles ont actuellement.
Ce sont les contraintes de l’évolution (survie, biologie) qui font que nous avons notre cerveau actuel et ses fonctions cognitions cognitives
◦ Une architecture cognitive permet d’expliquer la fonction cognitive à partir du cerveau. ce n’est pas toujours le cas
25
3 alternatives pour expliquer la cognition3 alternatives pour expliquer la cognition
Une architecture qui ne tient pas compte du cerveau ◦ Le paradigme classique du traitement de l’information
Une architecture qui ne tient pas compte de la fonction cognitive ◦ Le paradigme du connexionnisme sans l’esprit
Un paradigme qui fait abstraction de l’architecture ◦ L’analyse rationnelle de la fonction cognitive i.e. la fonction
cognitive est le résultat d’une adaptation à l’environnement.
26
Alternative 1 pour expliquer la cognitionAlternative 1 pour expliquer la cognition
Le traitement de l’information classique◦ le paradigme “information processing” classique de la
psychologie
◦ présente des théories validées par des expérimentations expliquant la fonction cognitive voir la théorie de Sternberg pour expliquer si un nombre fait partie
d’une liste dans la WM sa théorie ne tenait pas compte de la vitesse à laquelle un neurone
peut être excitée
◦ ignorer le cerveau, c’est comme concevoir une maison sans tenir compte des contraintes des matériaux pour la construire
27
Alternative I1 pour expliquer la cognitionAlternative I1 pour expliquer la cognition
Le connexionnisme sans l’esprit ◦ Une description exacte et fonctionnelle du cerveau
◦ C’est comme expliquer une maison à un extraterrestre sans tenir compte des fonctions de ses parties pour un être humain.
◦ La cognition est un effet de bord du cerveau Construire une maison avec des briques, du bois… sans contraintes et
constater à la fin que l’être humain puisse y vivre
◦ C’est comme expliquer le fonctionnement d’un ordinateur sans expliquer l’intention en arrière de chaque structure
◦ C’est comme expliquer la physiologie en terme d’interactions entre les cellules du corps en faisant abstraction des fonctionnalités des organes.
◦ Rumelhart and McClelland (1986) ont conçu un réseau de neurones qui apprenait les participes passés comme un enfant en faisant par exemple les erreurs de surgénéralisation classique du début de l’apprentissage (runned au lieu de ran).
◦ Ignorer l’esprit, c’est considéré que ce réseau de neurones a été premièrement construit et constater ensuite qu’il fait les participes passés
28
Alternative III pour expliquer la cognitionAlternative III pour expliquer la cognition
L’analyse rationnelle de la fonction cognitive en faisant abstraction de l’architecture. ◦ Une des contraintes imposées à la façon dont le cerveau permet
la cognition est que les deux sont le résultat d’une évolution dans un environnement réel Le raccourci est de se concentrer sur l’adaptation de la cognition à
l’environnement en faisant abstraction de l’architecture qui doit supporter les fonctions cognitives
◦ C’est un courant très actif actuellement et toutes les variantes sont basées sur l’approche bayésienne Il ne s’agit pas d’expliquer comment les calculs bayésiens sont
exécutés mais tout simplement, sachant qu’il y a adaptation l’environnement, d’élaborer une théorie prédisant le comportement cognitif en conséquence.
29
L’approche bayésienne de la cognitionL’approche bayésienne de la cognition
1. L’évolution fait en sorte que nos capacités sont fonction de la probabilité qu’un évènement survienne a priori
◦ Pr(pluie), Pr(cumulonimbus)…
2. Nous sommes en mesure de connaître les situations dans lesquelles certains événements se produisent
◦ Pr(cumulonimbus | pluie)
3. Connaissant les probabilités conditionnelles et les probabilité a priori, nous pouvons connaître la probabilité a posteriori que nous sommes dans tel situation étant donné qu’un tel événement est survenu
◦ Pr(pluie | cumulonimbus) = Pr(cumulonimbus| pluie) * Pr(pluie) Pr(cumulonimbus).
4. Basé sur l’information précédente, i.e. les probabilités a posteriori des situations actuelles, il s’agit de choisir l’action qui maximise l’atteinte des besoins de l’individu
◦ se mettre à l’abri si la situation la plus probable est qu’il pleuve
30
Architecture cognitiveArchitecture cognitive
Architecture informatique◦ ensemble de structures fixes permettant à un système d’être
programmé
Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des
processus cognitifs indépendance de la tâche modéliser
◦ une théorie générale de la cognition,
◦ intègre plusieurs théories spécifiques perception, attention, mémoire …
◦ une explicitation de la boîte noire
31
Architecture cognitive computationnelleArchitecture cognitive computationnelle
Une architecture cognitivive pouvant servir de devis pour concevoir un programme
Un modèle informatique d’une architecture cognitive ◦ de simuler avec un ordinateur des comportements complexes
◦ de générer des hypothèses qui pourront être validés expérimentalement
32
Caractéristiques des architectures cognitivesCaractéristiques des architectures cognitives
Degré de dépendance par rapport à un domaine. ◦ généralisation possible
Degré de spécification ◦ sa distance d’un modèle computationnel
Étendue des fonctions cognitives modéliser explicitement◦ attention, mémoire, processus subsymboliques
Adéquation aux résultats expérimentaux
33
Architecture cognitive : les débutsArchitecture cognitive : les débuts
1957◦ General Problem Solver
Herbert Simon et Allen Newell généralise Logic Theorist un résolveur de problème universel espace problème (problem space)
résoudre un problème consiste à explorer et construire un graphe à partir d’un état initial pour trouver un état final.
méthode faible (weak method) méthode de résolution pouvant être appliquée à plusieurs domaines comme
l’analyse moyens-fins (means-ends analysis, hill-climbing …
manipule des structures symboliques logique, géométrie, jeux d'échecs
34
1980 1980
validation expérimentale (protocole verbal)◦ K. Anders Ericsson et Herbert Simon
◦ 2 systèmes sont faiblements équivalents s’ils représentents la même fonction et fortement équivalents si c’est le même algorithme
37
Les architectures à base de systèmes de Les architectures à base de systèmes de productionproduction 1943
◦ Les systèmes de production sont apparus sous forme théorique
1972 ◦ implantation de systèmes de production
◦ Human problem solving de Newell
38
Évolution des architectures basés sur les systèmes Évolution des architectures basés sur les systèmes de productionde production
39
ACT* : dispersion de l’activationACT* : dispersion de l’activation
L’activation part des objets (unit) actuellement actifs et via ses attributs (element) se propage à d’autres objets dans la mémoire à long terme.
42
19831983
SOAR 1 (State, Operator And Result)◦ John Laird, Allen Newell, et Paul Rosenbloom
◦ Expliquer le comportement intelligent en proposant l’architecture de base de tout système intelligent
◦ Mécanisme sophistiqué d’apprentissage de nouvelles connaissances
◦ Initialement peu de fondement psychologique à l’architecture Possible de produire des comportements plausibles et non plausibles Difficile de modéliser les connaissances sémantiques et épisodiques
avec l’architecture SOAR Attention les règles de production ne sont pas des connaissances
procédurales Il ajoutent des préférences dans la mémoire de travail et complète l’information
qui est déjà dans la mémoire de travail mais cette mémoire de travail n’a aucun rapport avec sa partie correspondante en psychologie
43
1983 : 1983 : CPM-GOMSCPM-GOMS
Cognitive, Perceptual, Motor GOMSGoals, Operators, Methods and Selection rules46
Calcul du temps nécessaire pour Calcul du temps nécessaire pour percevoir un objet avec GOM/CPMpercevoir un objet avec GOM/CPM
47
Description d’un ordinateur à deux niveauxDescription d’un ordinateur à deux niveaux
49
Aspects Register-Transfer Level
Symbol Level
Medium Bit Vectors Symbols, expressions
Components Registers Functional Units
Memories Operations
Composition Laws Transfer Path Designation, association
Systems Digital Systems Computers
Behavior Laws Logical Operations Sequential interpretation