| Seance |
Contenu du cours |
Contenu des tps |
| 24/09/08 |
Introduction
aux methodes empiriques:
- le T(raitement) A(utomatique du) L(angage) N(aturel):
les
approches empiriques basées sur les corpus
- les données qualitatives et quantitatives, le concept
de distribution de fréquence, la disctinction type vs. token, la
loi de Zipf et les n-grammes
|
- Lectures conseillees:
- Liens utiles:
|
| 01/10/08 |
Les
Donnees Textuelles:
- la notion de corpus (balisé)
- quelques exemples de corpus textuels: la Penn
Treebank, le
British National Corpus, le NEGR@ corpus, ...
|
|
| 08/10/08 |
Perl 1:
|
- tp3.pdf:
- structures de controle
- n-grammes
- entropie de Shannon
- permutations et combinaisons
|
| 15/10/08 |
Perl 2:
- expressions rationelles
- hash tables
|
- tp4.pdf:
- indexation
- jeu de Shannon
- generateur de mots
|
| 22/10/08 |
L'exploitation
des Corpus:
- attachement des syntagmes prépositionnels
- mesures de précision, de rappel et d'exactitude
|
-
tp5.pdf:
- attachement de syntagmes prepositionels:
- donnees d'entrainement et de test: quads
- devineur de langues:
|
| 29/10/08 |
L'apprentissage
bayesien 1:
- la probabilité simple
et la probabilité
conditionnelle, le théorème de Bayes, les variable
aléatoires et les fonctions de probabilités
- l'algorithme Naive Bayes et classification de textes
|
|
| 05/11/08 |
L'apprentissage
bayesien 2:
- l'algorithme Naive Bayes et classification de textes
|
|
| 12/11/08 |
L'apprentissage
des roles thematiques 1: |
|
| 19/11/08 |
L'apprentissage
des roles thematiques 2:
|
- tp8.pdf:
- alignement, traces, distance
|
| 26/11/08 |
L'apprentissage
symbolique:
|
|
| 03/12/08 |
L'apprentissage
du Lexique Verbal:
- la classification automatique des verbes en classes
sémantiques
|
|
| 10/12/08 |
|
|
| 17/12/08 |
Conclusions
|
|
| | |
| | |
| | |
| | |
|
|
|
|
|
|
|
|
|
|
|
|