Réactions et critiques : retour sur le lancement

29/3/2022

Le 9 novembre dernier, nous avons lancé publiquement Cedille, le plus grand modèle de génération de textes en français à ce jour. Nous avons pris la décision de proposer une plateforme de test accessible à tous afin de laisser la communauté découvrir le modèle librement. Jusqu'à présent, plus de 90’000 textes ont déjà été générés: des discours philosophiques, de la poésie et bien d'autres types de contenus intéressants.


Réactions de la communauté sur Twitter


Nous avons reçu d'excellentes réactions sur Twitter, ainsi que quelques critiques sur le contenu généré sur cedille.ai. Vous trouverez ci-dessous quelques exemples des capacités du modèle :

Le professeur de philosophie français et utilisateur de Twitter MrPhi a fait passer un test de Turing à Cedille en lui faisant écrire Nietzsche. Le journaliste Agar (@akaAgar) a écrit que Cedille fonctionne très bien avec les formats journalistiques et qu'il voudrait l'utiliser pour créer une gazette de nouvelles imaginaires.


Un autre utilisateur a donné à Cedille une phrase de l'un de ses jeux, et a tweeté à propos de l'énorme potentiel pour les jeux de rôle grâce au modèle. D'autres cas d'utilisation consistaient à proposer la première ligne de la page wikipedia de Dofus (le célèbre jeu de rôle en ligne), ou encore à insérer la mission de leur entreprise pour produire une phrase d'accroche.


Avec plus de 1’000 comptes créés, les premières semaines post-lancement ont été riches en tests !


La transparence au cœur de nos préoccupations


Le projet est encore en Bêta et sa disponibilité en libre accès permet à tout le monde de jouer avec le modèle, de le tester correctement et de recueillir des retours pertinents. Les critiques concernant une partie du contenu généré sont par ailleurs justifiées. Nous avons fourni beaucoup d’efforts pour réduire la toxicité du modèle et avons pu constater des améliorations notables, cependant beaucoup de travail reste encore à faire à ce sujet. Notre position est que la transparence envers la communauté demeure un des points les plus importants du projet et qu'elle l'emporte sur les risques potentiels encourus en raison de contenus jugés comme inappropriés.


Par crainte de ce type de réactions, la majorité des grandes entreprises dans ce domaine ne donnent pas accès à leurs modèles. Nous pensons au contraire qu'il est préférable que le public soit au courant des développements et des risques liés à la génération de textes en NLP/NLG.


Le modèle est ainsi disponible en open-source, ce qui permet à d'autres professionnels de la recherche de l'utiliser pour analyser ce type de résultats. Nous espérons que notre approche pourra aider les chercheurs à trouver des solutions aux problèmes de toxicité. Nous sommes conscients des risques et nous nous efforçons de les atténuer au maximum.


Essayez-le vous-même

La première version du modèle est accessible sur une plateforme de test dédiée, générez vos propres textes!
Essayez Cedille