664e édition des LIDD : Liens Intelligents Du Dimanche

Qui veut tenter le One Billion Row Challenge ?

664e édition des LIDD : Liens Intelligents Du Dimanche

Comme tous les dimanches, voici notre sélection des liens les plus intéressants de ces derniers jours. Ils proviennent des commentaires les plus intéressants, utiles et/ou originaux de la semaine, mais aussi de nos recherches.

Le 17 mars à 00h00

Commentaires (15)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar
Et donc, si je calcule bien, la 666e édition sera publiée seulement deux heures avant le passage à l’heure d’été (double, en fait, n’ayant jamais repris notre fuseau horaire normal après 1945, alors que c’était pourtant censé avoir lieu en novembre de cette année-là) ? Je savais que c’était une invention diabolique ! :devil:
votre avatar
Impressionnant le hack fait autour du Freestyle
votre avatar
Vous êtes un dev, vous ne savez pas quoi faire ce dimanche ? Alors participez, en retard, au One Billion Row Challenge. C’est ce que vient de faire Ben Hoyt. Alors que la compétition initiale était en Java, il a opté pour le langage Go et propose neuf solutions pour passer de plus de 100 secondes à 3,4 secondes seulement pour traiter un fichier avec un milliard de lignes.
Il faut quand même pas mal de RAM pour pouvoir atteindre ce genre de performance. En allant jeter un oeil aux conditions & règles du challenge, on se rend compte qu'ils font tourner les tests sur une machine disposant de 128Go RAM. Donc suffisamment pour que le fichier de test puisse tenir dans le cache disque de l'OS.

Dès lors que le cache est trop petit, les performances seront forcément plombées par le matériel, car même avec bon bon débit de 2Go/s, il faudrait 6,5s rien que pour lire les données. Pour le vainqueur, le programme tourne en 1.535s. Cela n'enlève rien à la performance, mais il faut commencer à avoir un sacré config pour espérer faire tenir le fichier en entier dans le cache. Minimum 32Go, car bien que 16 soit en théorie possible, il resterait moins de 3 Go pour tout le reste... (os, application, service, autres fichiers mis en cache, ...)

Du coup, je propose sur Next le OBRC, mais avec 50 000 000 enregistrements, au lieu de d'1 milliard. Le fichier ainsi généré ne fait plus que 658Mo, qui pourra être mis en cache beaucoup plus facilement pour des tests.

Quitte à faire tourner ensuite sur une bonne grosse config, et pour le fun (le challenge étant terminé), sur 1 milliard d'enregistrement comme prévu initialement.
votre avatar
Première fois que je vois Lucie Ronfaut en vidéo. J'ai suivi pendant plusieurs semaines son podcast « Soluce » avec Hugo Terra sur le jeu vidéo.
votre avatar
Vu que ça parle des fuseaux horaires et que dans le lien ça parle de l'IANA.

J'ai vu il a quelques mois l'annonce d'un changement d'heure pour la base Vostok ... quelques heures avant :non:

https://mm.icann.org/pipermail/tz/2023-December/033317.html

Ils sont passé d'UTC+7 a UTC+5 (alors que c'était un UTC+6 annoncé publiquement..)

La raison ? C'est plus simple pour bosser avec les gens de la base Progress qui est en UTC+5 (avant ils bossaient surtout avec Mirny qui était en UTC+7)

(Vu l'endroit, ils se basent pas sur le soleil pour vivre, vu que c'est soit la nuit permanente, soit le jour permanent ou une petite zone d'entre deux)
votre avatar
Je viens de lire tout le fil… Pas gonflé, le gars qui décide de ce changement de son propre chef, comme ça, pour prendre effet dès le lendemain ! XD

(Y en a un qui rappelle utilement que la TZDb n’a jamais été gérée et maintenue que par trois personnes à temps partiel, dont seulement deux maxi à la fois, et ce depuis plus de 37 ans… La base sur laquelle tous les systèmes informatiques tournant sur autre chose que Windows se réfèrent pour leur gestion des fuseaux horaires ! Paie ton XKCD 2347 /o\)

Et Paul Eggert qui se rend compte que ça faisait au moins 10 ans que le fuseau défini pour Vostok était faux, car il était réglé sur UTC+6, alors que le Russe disait qu’ils étaient sur UTC+7 depuis au moins aussi longtemps qu’il faisait des hivernages en Antarctique… La raison de cette erreur ? L’heure de Vostok dans la TZDb était définie comme « 6 heures de retard sur la Nouvelle-Zélande », NZ étant définie comme UTC+12, et ce d’après un e-mail de 2001 ; en oubliant qu’en heure d’été, la NZ est sur UTC+13…

Vraiment, ces saletés d’heures d’été, faut arrêter !
votre avatar
Je pense que la décision avait été prise avant, mais qu'ils avaient oublié de penser a l'informatique.

Mais oui une base antarctique est très autonome par principe (physiquement coupé du monde durant l'hiver etc) et ils sont très peu de monde.
Sans compter que le fuseau horaire est sans impact réel pour eux.
votre avatar
Les deux derniers liens sont en anglais : ça serait bien de le présiser pour éviter de cliquer pour rien :/
votre avatar
Tu passes la souris (évidemment, faut faire ça depuis un ordi) sur les liens et tu vois l’adresse e destination affichée en bas, mais un petit « (EN) » suffisamment court pour rester discret ne serait pas malvenu après, certes.

Sinon, je rappelle que nous vivons dans un monde où c’est l’anglais, la langue internationale que tout le monde se doit de maîtriser aussi parfaitement (au moins à l’écrit), sinon plus que sa propre langue maternelle (si celle-ci devait être différente). Au pire, DeepL ou les outils de traduction instantanée (que ça fasse partie du navigateur ou via une extension), ça existe.
votre avatar
Sinon, je rappelle que nous vivons dans un monde où c’est l’anglais, la langue internationale que tout le monde se doit de maîtriser aussi parfaitement (au moins à l’écrit), sinon plus que sa propre langue maternelle
En lisant ça, je me demande ce que l'ont fait tous ici sur un site francophone. Il y a tellement plus de sites en langue anglaise parlant de tech ! Remboursez ! :fumer:
votre avatar
Parce que t’en lis pas ? Moi, si. Il y a même des sites, pas seulement dédiés à l’informatique, possédant une déclinaison en français pour lesquels je préfère consulter l’originale, parce que plus complète (toutes les actus ne sont pas traduites).
votre avatar
Je préfère les sites en Klingon.
votre avatar
Je suis sur tablette et je comprends l’anglais niveau college (et encore).

C’est pour ça que je ne surf que sur des sites francophone.
votre avatar
Pareil jusqu’en 2008, quand j’ai décidé de lire une traduction de fans en anglais (j’ai acheté la version officielle parue depuis) d’une série de romans japonais. Au début, je m’aidais avec Google Traduction (y avait que ça, à l’époque) pour les tournures qui m’échappaient ; mais au fil du temps, j’y ai eu de moins en moins recours. Et depuis, j’arrive à lire 95% de l’anglais qu’on peut trouver sur Internet sans avoir à recourir à un outil comme DeepL.

Franchement, je recommande, car c’est vraiment ça (ainsi que la motivation qui allait avec) qui m’a appris à comprendre l’anglais écrit. Et vu que, malgré tout, l’anglais est la langue de la science, de l’informatique et d’Internet, c’est pas pour rien que je dis que c’est incontournable de comprendre cette langue, étant donné le monde dans lequel on vit.

Et sur tablette, un appui long du doigt n’affiche pas une infobulle avec l’adresse du lien ? C’est le cas sur ma Surface RT (qui devient de moins en moins utilisable sur les sites actuels, car le JS ne marche plus depuis longtemps et le CSS est parfois pété aussi, selon les sites).
votre avatar
C’est pas bête, et puis on précise déjà s’il s’agit d’une vidéo, d’un podcast, d’un article, etc. donc why not :)

664e édition des LIDD : Liens Intelligents Du Dimanche

  • L’OSINT, une révolution de la preuve

  • Le CNRS plonge dans… « la tête de Vladimir Poutine »

  • Internet Exploreuses

  • Les minerais de la transition énergétique.

  • Alice Recoque ou l’histoire méconnue d’une pionnière de l’informatique

  • L’Entscheidungsproblem- La fin des mathématiques ?

  • Les maths, l’école, les filles et les stats

  • Le débarras des LIDD

  • Une édition spéciale devs

Fermer