Voici le sujet de TP du cours "neural computing". Il s'agit d'identifier, grâce à un réseau de neurones, la langue utilisée dans des messages courts (des tweets)... Date limite de rendu 03/03/14 23h59. (Attention -1 point par jour de retard).

Ce TP peut etre réalisé seul ou en binôme (mais pas de trinôme!).

[update!] Vu que certains d'entre vous galèrent pour l'étape de paramétrisation (passer du texte à des valeurs numériques utilisable dans un réseau de neurones). Je vous donne une base de code supplémentaire ("freq.c") attaché à cet article. Notez que si vous utilisez l'apprentissage supervisé (avec FANN) il vous faudra encore "normaliser" les données (c'est à dire les "étaler" dans [-1;+1]).

Vous pouvez aussi faire de l'apprentissage "non-supervisé" comme vu dans le TD3, dans ce cas vous n'avez pas besoin de faire l'étape de normalisation, et le résultat de l'apprentissage étant plutôt visuel, cela peut être vu comme plus simple.