fbpx

Big Science, le super traducteur plus inclusif et écolo que Google

Faire mieux que Les moteurs de recherche en matière de langues et de traduction: voici l’immense défi de ce projet Big Science. Lancé le 28 avril 2021, ceci projet est transporté par plus de 250 chercheurs issus concernant le laboratoires et d’entreprises d’une dizaine du pays. Notamment un CNRS, Renault, Ubisoft, Airbus, Facebook mais également Orange.  

Précisément, l’objectif de Big Science est de faire grandir ce qu’on prie “un modèle pour obtenir langues”. C’est dans dire un programme qui maitrise la conjugaison, la syntaxe, mais aussi dispose d’un langage spécifique énorme. Et ce avec huit langues. Au sein de elles, le français, l’anglais ou diverses langues africaines. Une sorte concernant le supertraducteur qui dépasserait les capacités un ensemble de outils de Google. Et également d’OpenIA, utilisé via Microsoft. Cet instrument se veut également libre, plus neutre & plus écolo.

Big Science : une technologie française

Pour cela, les enquêteurs s’appuient sur le supercalculateur français Jean Zay, installé à Orsay. Ce dernier dispose d’une puissance de opération dans 29 millions du milliards d’opérations à travers seconde. Mi-avril, un Genci (Grand matériel national de opération intensif)) et l’Idris (Institut du progrès et des moyens de production en informatique scientifique de ce CNRS) ont choisi leur accord afin de mettre à disposition 6 millions d’heures concernant le calcul. C’est-à-dire approximativement un quart un ensemble de capacités de Jean Zay.  

La instrument permettrait de faire grandir le langage, la conjugaison, la syntaxe mais également le vocabulaire relatives au l’IA en le an. Celle-ci saurait notamment être prisée dans le domaine de la version, mais aussi pour des chatbots ou des consoles de jeux.  

De cette manière, le projet espère contrer la “mainmise” un ensemble de géants de la tech sur ce genre de technologies. Ces fondateurs pointent particulièrement du doigt ces problèmes éthiques uniquement ce cette “mainmise” engendre. Ils citent par exemple “l’anglo-centrisme” spécilisés dans ces fameuse technologies, la non-représentativité des populations, mais également la prédominance du stéréotypes de genre.

À lire également: 10 innovations laquelle pourraient révolutionner un chacun de demain

Une intelligence artificielle à vocation plus inclusive

  BigScience a été pensé pour donc plus inclusif. Grâce notamment dans un “corpus d’apprentissage plus pratique contrôlé, avec particulièrement la correction concernant le différents biais touchant à langue et de genre” , précise Le Monde .

L’utilisation du système pour obtenir Jean Zay donne la possibilité également de débuter au problème de forte consommation bioénergétique des supercaculateurs très utilisés et très puissants que se trouvent être Switch-C (Google) & GPT-3 (OpenIA). “Jean Zay est un champion proposent un l’efficacité énergétique” , souligne le CNRS . En effet, cette machine française bénéficie d’une technologie au sein de refroidissement à l’eau tiède. Les calories sont récupérées afin de chauffer un maison du CNRS mais aussi bientôt l’Université relatives au Paris-Saclay.  

“L’initiative [BigScience, ndlr] est aussi la réaction au réalisé que les gros types développés par les sociétés du numérique se posent ces questions (écologiques ou éthiques, ndlr) a posteriori. Nous ferons déjà la liste des questions, enfin le modèle afin de y répondre” , explique Thomas Wolf, à l’initiative de ce projet et directeur scientifique de la start-up américaine HuggingFace (fournisseur open-source de manière de traitement de langage naturel), au téléphone journal Le Monde .  

L’atelier de recherche devrait attarder un an. De certains résultats, eux, se trouvent être attendus pour le paye de juillet.  

Pour en savoir plus ou lire la suite : Source | Lien vers l'article