Vincent Desjardins – CC BY 2.0 – Wikimedia

La BNF : un réservoir de données pour les IA

Bibliathèque

5

Vincent Desjardins – CC BY 2.0 – Wikimedia

Abonnez-vous pour tout dévorer et ne rien manquer.

Déjà abonné ? Se connecter

Abonnez-vous

Un consortium des trois startups de l'IA générative Artefact, Mistral AI et Giskard, en partenariat avec la Bibliothèque nationale de France (BNF) et l'Institut national de l'audiovisuel (INA), a été sélectionné par Bpifrance après un appel à projets nommé « Communs numériques pour l’intelligence artificielle générative ». L'idée est d'utiliser les données du domaine public rassemblées par ces deux institutions pour entrainer les IA de ces entreprises, sans pour autant leur en laisser l'exclusivité, nous explique la bibliothèque.

En mars dernier, les startups françaises d'IA générative Artefact, Mistral AI et Giskard, en se rassemblant dans le consortium ARGIMI, ont obtenu un financement de Bpifrance. Objectif, mettre en œuvre un projet bâti en partenariat avec deux très importantes institutions de la culture française : la Bibliothèque nationale de France (BNF) et l'Institut national de l'audiovisuel (INA), expliquait la semaine dernière Politico.

Le projet financé ici, suite à un appel lancé en juin par Bpifrance, est de profiter des importants fonds conservés dans ces établissements. Leurs grands modèles de langage pourront être entrainés sur des masses de données venant notamment du domaine public, et très bien étiquetées, pour créer « un modèle en accessibilité ouverte utile à tous ».

Des outils « communs » d'IA

Abonnez-vous pour tout dévorer et ne rien manquer.

Déjà abonné ? Se connecter

Abonnez-vous

Commentaires (5)


Le seul biais que je vois à ça ce sont tout les textes avec des termes... je vais dire surannés. Le vocabulaire des IA en français va devenir intéressant.
Mais c'est une très bonne chose que la BNF utilise et monétise son fond.
Mais c'est une très bonne chose que la BNF utilise et monétise son fond.


Vraiment ?

Berbe

Mais c'est une très bonne chose que la BNF utilise et monétise son fond.


Vraiment ?
Quel est le problème ?
Linagora et OpenLLM etaient aussi sur ce sujet non ?
On est effectivement dans de bons cas d'usage de l'IA : trier, synthétiser, rechercher et qualifier une quantité massive de données. Et autant dire que la BNF et l'INA en sont une.

Bon, plus qu'à attendre que le ministère de la culture se sorte les doigts pour définir les modalités de dépôt individuel des livres numériques et mes trucs pourront en faire partie.
Fermer