Si l’informatique revêt la plupart du temps la forme de nouveaux matériels ou logiciels, elle se met également au service de domaines très divers. Cette fois, elle rencontre l’histoire du peuple juif, qu’elle pourrait bien aider dans la quête de son passé, grâce à une intelligence artificielle conçue pour trier et assembler des centaines de milliers de très anciens documents.
Un fragment de l'un des nombreux documents de la Genizah du Caire.
Des centaines de milliers de documents à trier
La Guenizah du Caire est une collection unique de documents. Elle compte environ 200 000 pièces et représente un ensemble particulièrement hétéroclite de renseignements. On y trouve ainsi des documents juridiques, des recettes de cuisine, des correspondances privées, des contrats, des livres de prières, de la poésie et ainsi de suite. Une véritable avalanche de détails sur la vie du peuple juif à travers des documents datant d’une période de plus d’un millénaire (870 à 1880).
Collecter, rassembler, organiser et trier ces documents a déjà été fait à plusieurs reprises. La collection représente un trésor historique en plus de pouvoir renseigner sur le passé de tout un peuple à travers les siècles, et donc de suivre son évolution. Seulement voilà, le travail se heurte à une difficulté de taille : les documents sont en désordre. Pourquoi ? Parce qu’une guenizah est essentiellement une « remise ». Les documents portant le nom de Dieu ne doivent en effet pas être détruits, mais enterrés. Le processus de reconnaissance et d’appairage est également rendu complexe par un autre problème : la plupart de ces documents sont en langue arabe mais avec un alphabet hébraïque.
Un grand travail de numérisation
Le travail d’identification, de compréhension et de recherche est particulièrement lent et rébarbatif et n’a produit à ce jour qu’environ 4 000 documents reconstitués. C’est ici qu’intervient l’informatique. Elle a commencé par un très long travail de numérisation, sur 301 000 fragments de papiers, répartis sur toute la planète dans des musées et des collections privées.
Puis, comme l’indique le New York Times, 450 000 photographies en haute qualité ont été prises sur fond bleu afin d’en faire ressortir les détails et les éléments significatifs. Mais si la numérisation est une étape cruciale, elle n’accélère pas nécessairement le travail général, même si un site web avait été mis en ligne pour aider les chercheurs.
L'utilisation de l'intelligence artificielle
La phase suivante est beaucoup plus récente. Elle consiste en un projet lancé par l’université de Tel Aviv (Israël) : unir la puissance de calculs d’une centaine d’ordinateurs pour les faire travailler sur l’identification et le rassemblement des fragments. L’opération, lancée le 16 mai, porte sur précisément 157 514 fragments, analysés un par un et automatiquement sur la base de 500 indices. Le nombre de combinaisons possibles est de 12 405 251 341.
Sur le site officiel du projet, on peut voir que les opérations de comparaison ont été complétées à hauteur de 25,4 %. À ce rythme, les calculs devraient être terminés le 26 juin si rien ne vient enrayer la machine. 3 632 comparaisons sont effectuées à chaque seconde, ce qui laisse encore 708 heures de calculs.
Yaacov Choueka, ancien professeur de sciences informatiques et à la tête du projet, indique que le travail réalisé sert en fait deux objectifs. D’une part, il doit permettre de pouvoir se plonger avec plus de précisions dans une période historique manquant parfois cruellement de détails. D’autre part, il représente une nouvelle opportunité pour l’outil informatique de répondre avec efficacité à des questions inédites posées par la recherche.
Des informations précieuses et un oeil humain irremplaçable
Et les informations contenues peuvent se révéler précieuses pour les historiens. Par exemple, une partie des fragments traite de la vie de tous les jours des Juifs résidant au Caire. De là, ils importaient des moutons de Sicile et préparaient des portions de nourriture chaude dans des récipients fermés. Ils contiennent également des informations sur le commerce du lin et du savon qui prenait place entre l’Égypte, l’actuelle Tunisie et la Sicile.
Mais attention : si l’outil informatique permet de réaliser en un temps record des opérations qui auraient nécessité plusieurs générations de chercheurs, il ne peut pas répondre à toutes les questions. Certaines paires de fragments seront ainsi immédiatement détectées, mais pas toutes. Le projet doit présenter une liste des probabilités existant entre plusieurs morceaux, et ce sont bien les chercheurs qui confirmeront ou pas les résultats donnés par l’intelligence artificielle.
Commentaires (390)
#1
Et en plus maintenant, il y a une application pour en faire des résumés, elle est pas belle la vie ? " />
#2
#3
C’est pas nouveau.
Ca a été initié sur les manuscrits de Qumran.
#4
Sympa, on dirait le boulot de Daniel Jackson ! A quand la google trad ?
(naon pitié, surtout pas !)
#5
SI on peut les aider, je sais un peu lire ce genre de texte, en langue arabe mais avec les caractères hébreu anciens.
Mais il n’y a pas de lien vers leur site dans l’article…
#6
#7
#8
J’adore ce genre de projet.
En connaissant mieux notre passé on appréhendera mieux notre futur.
Edit :
Ha merde, “Tel-aviv university” …
#9
#10
Ils vont peut-être retrouver le dernier morceau de l’Ancien Testament
Dieu : Vous êtes trop cons. Je vous ai envoyé mon fils, et vous l’avez laissé crever de faim sur une croix. Je vous avais promis une Terre Sainte, et bien maintenant, démerdez-vous " />
#11
#12
Les mecs qui ont inventés tout ça doivent se marrer là-haut… oops " />
#13
#14
#15
#16
#17
#18
#19
“La viande de porc ne doit pas être mangée, mais savourée !” " />
#20
#21
Le problème reste bien que le peuple juif des écrits anciens n’a plus vraiment de rapports avec les individus s’en réclamant aujourd’hui.
Le problème étant bien que le mythe d’une ascendance directe est plus que nécessaire pour revendiquer israël, d’où sa construction depuis le 17ème siècle. (voirhttp://fr.wikipedia.org/wiki/Comment_le_peuple_juif_fut_invent%C3%A9 pour les rares qui souhaiteraient comprendre ou avoir un point d’entrée)
#22
#23
petite blague à la popek :
Qu’est-ce que c’est des traces de griffes sur un comptoir ?
un Juif qui a pris sa monnaie
" />
#24
#25
#26
Ben, le juif descend du singe, comme tout le monde. Pas la peine de faire tout un foin pour ça." />
#27
#28
#29
#30
#31
#32
Sur le site officiel du projet, on peut voir que les opérations de comparaison ont été complétées à hauteur de 25,4 %. À ce rythme, les calculs devraient être terminés le 26 juin si rien ne vient enrayer la machine. 3 632 comparaisons sont effectuées à chaque seconde, ce qui laisse encore 708 heures de calculs.
Heuuu… c’est moi ou ça parait quand même vachement long comme processus, comparé au nombre relativement faible de données à traiter (12 405 251 341 combinaisons possibles avec 500 indices).
J’ai l’impression que le matos destiné au projet doit pas être très performant. S’ils ont le même matos qu’à ma fac (des sempron 2200+), c’est pas étonnant que ça soit si long.
#33
#34
#35
#36
#37
#38
#39
#40
#41
#42
Une news qui parle des Juifs et on a droit a un florilège de commentaires clichés… Y a encore du boulot" />
#43
#44
#45
#46
#47
#48
#49
#50
#51
#52
Mais que fakt l’uejf ? Les propos antisémites tenus ici sont tout simplement infâmes…. Pcinpact va devoir passer à la caisse, en mémoire de nos belles soeurs et de nos beaux frères déportés ! On déduit la tva pcq vous faites qd même du sacré bon boulot lol
#53
#54
#55
#56
#57
la plupart de ces documents sont en langue arabe mais avec un alphabet hébraïque.
En araméen ?
#58
#59
#60
#61
Pour continuer, en plaisantant sur la supposée richesse des juifs avec force smileys et gros second degré qui n’est pas évident que pour les étroits d’esprit (qui je le répète, font partie des gens que je considère très dangereux, tout bien pensants qu’ils soient), plus personne ne peut venir ici le redire sérieusement sans que ce soit très manifeste que c’est un nuisible.
#62
#63
Et si on peut plus rigoler des juifs qui viennent voler le travail de nos nègres et piquer le pain de nos arabes, où va t-on ?
" />" />" />" />" />
#64
#65
#66
#67
#68
#69
@Drepanocytose
Ne le prends pas mal mais pour ma part je te trouve naïf quand tu penses que tu peux empêcher avec des smileys ces blagues de renforcer les préjugés inconscients, et lorsque tu affirmes que ces préjugés ne peuvent pas causer de haine (même si, effectivement, ils ne sont parfois que prétexte).
#70
#71
" /> Sur pcInpact c’est lol mdr on se moque des youpins et des négros mais c’est second degré xpdr tkt gros " />" /> Et puis c’est eux qui le disent alors pourquoi pas nous XD
C’est bon les gars vous avez gagné, je rends les armes.
#72
#73
#74
#75
#76
#77
#78
#79
#80
#81
J’étais sur en ouvrant les commentaires que ça parlerait de dieudo " />
#82
#83
#84
#85
#86
#87
#88
#89
#90
#91
#92
#93