Accédez aux plus grands modèles de langue en français et en allemand

Rédigez plus rapidement. Résumez des documents complexes. Répondez automatiquement à vos clients. Le tout avec les plus grands modèles de langue pour le français et l'allemand du marché.

On parle de Cedille

Des domaines d’application variés

Généré par Cedille
Généré par Cedille
Généré par Cedille
Généré par Cedille
Généré par Cedille

Avez-vous un projet spécifique ?

Contactez-nous pour une adaptation personnalisée de notre modèle à vos besoins.
Nous contacter

Cedille, les modèles de langue les plus puissants du marché

Générez des contenus de haute qualité en quelques secondes
Accélérer et optimiser votre processus de rédaction
Réécrire le contenu pour l'adapter au ton de votre marque
Accédez au meilleur modèle francophone du marché pour vos projets NLP & NLG

Notre mission

Accéder aux meilleurs modèles du marché pour vos projets NLP

Un modèle d'une qualité sans précédent

Score de prédiction

(Plus bas, c'est mieux)
Nous mesurons la "perplexité" du modèle, c'est-à-dire sa capacité à prédire le mot suivant dans un document donné. Nous utilisons le corpus Wikitext-FR, composé de milliers d'articles de qualité issus de Wikipedia en français.
Cedille
3.93
GPT-3 (Davinci)
3.99
GPT-J
5.79
GPT-FR
12.92

Score de toxicité

(Plus bas, c'est mieux)
La génération de contenus dits “toxiques” est un problème usuel des modèles de langue. On retrouve parfois des contenus insultants, sexistes ou encore racistes. Pour Cedille, nous avons pris soin d’entraîner le modèle sur des données de haute qualité. Les textes générés en sont ainsi grandement améliorés! Nous utilisons une version du benchmark Real Toxicity Prompts adaptée pour le français.
Cedille
96%
GPT-3 (Davinci)
99%
GPT-J
99%
GPT-FR
96%

Score de traduction

(Plus le score est haut, meilleur est le modèle)
Avec le dataset WMT14, nous avons mesuré les performances de Cedille en traduction de l’anglais vers le français et vice-versa.
Cedille
24.91%
GPT-3 (Davinci)
20.40%
GPT-J
14.84%
GPT-FR
1.47%

Score de résumé

(Plus le score est haut, meilleur est le modèle)
Nous utilisons le benchmark OrangeSum pour mesurer la capacité et la performance du modèle sur le résumé de textes. OrangeSum est basé sur le dataset XSum et a été créé à partir du site "Orange Actu".
Cedille
13.73%
GPT-3 (Davinci)
15.49%
GPT-J
12.96%
GPT-FR
10.20%
Découvrez notre dernier article de recherche sur la publication du modèle
Lire l'article

Score de prédiction

(Plus bas, c'est mieux)
Nous mesurons la "perplexité" du modèle, c'est-à-dire sa capacité à prédire le mot suivant dans un document donné. Nous utilisons un corpus composé de milliers d'articles de qualité provenant de Wikipedia en allemand.
Cedille
3.84
GPT-3 (Davinci)
3.76
GerPT2
18.68

Score de toxicité

(Plus bas, c'est mieux)
La génération de contenus dits "toxiques" est un problème courant avec les modèles de langue. Pour Cedille, nous prenons soin d'entraîner le modèle sur des données de haute qualité. Cela améliore considérablement le texte généré ! Nous utilisons une version du benchmark Real Toxicity Prompts adaptée à l'allemand, montrant la toxicité maximale attendue sans prompteur.
Cedille
91%
GPT-3 (Davinci)
99.5%
GerPT2
92.4%

Score de traduction

(Plus le score est haut, meilleur est le modèle)
Avec le jeu de données WMT16, nous avons mesuré les performances de Cedille sur des tâches de traduction de l'anglais vers l'allemand.
Cedille
20.35
GPT-3 (Davinci)
18.52
GerPT2
2.25

Score de résumé

(Plus le score est haut, meilleur est le modèle)
Nous utilisons le benchmark MLSUM pour mesurer la capacité et la performance du modèle sur le résumé de texte.
Cedille
15.89
GPT-3 (Davinci)
23.33
GerPT2
7.52

Open Source

Le modèle français de Cedille est un modèle open source, disponible sur Github et Huggingface.

@CedilleAI

@coteri_es basé à @EPFL_Park lance un modèle de génération de texte spécialisé en français #AI. Selon @coteri_es, sa technologie #Cedille rivalise avec le modèle multilingue GPT-3 développé par @OpenAI et serait le meilleur modèle...
Le Kapharnaüm
Vous connaissez @CedilleAI ? Je viens de tester avec une phrase qui devrait parler à ceux qui ont suivis nos parties de meute : Alerte aux ratons laveur en rut autour du lac d'Aiguebelette. Je trouve le résultat absolument merveilleux...
Alexan Vorritold
Je viens de découvrir @CedilleAI. Je lui ai donné la phrase d'accroche de mon entreprise. C'est donc clairement Cedille qui va rédiger mes propositions commerciales désormais.
Agar 🌱
Le générateur @CedilleAI fonctionne si bien avec les formats journalistiques que j'ai envie de l'utiliser pour créer une gazette de nouvelles imaginaires. uelques extraits (le prompt est à chaque fois en gras).
J'ai découvert @CedilleAI hier sur Twitch, et c'était dingue. Nietzsche nous a parlé en direct.

Remerciements

Le projet a été rendu possible avec le support généreux du programme TRC de Google.
Cedille est basée sur le modèle GPT-J développé par EleutherAI.

Essayez-le vous-même

La première version du modèle est accessible sur une plateforme de test dédiée, générez vos propres textes!
Essayez Cedille