Connexion
Abonnez-vous

[Dossier] Internet, mode d’emploi : une URL c’est quoi ? (partie 1)

C’est plus complexe qu’il n’y parait

[Dossier] Internet, mode d’emploi : une URL c’est quoi ? (partie 1)

Next vous propose cette semaine un dossier sur le fonctionnement d’Internet, pour de vrai ! Tout le monde voit à peu près ce qu’est Internet, mais assez peu de personnes (dans le grand public en tout cas) arrivent à réellement appréhender toutes les opérations quasi instantanées qui se déroulent pour simplement vous afficher une page.

Le 25 mars à 08h55

Dans la première partie de notre dossier, nous allons partir de la base : votre navigateur. Peu importe celui qui est sous vos yeux (Chrome, Firefox, Safari, Opera, Vivaldi…), vous utilisez certainement une URL pour accéder à vos sites favoris.

Alors oui, Internet ne se résume évidemment pas au Web, qui en est simplement une composante, mais il faut bien commencer quelque part. Nous avons décidé de prendre un exemple simple : que se passe-t-il vraiment dans les tuyaux numériques lorsque l’on fait une recherche sur un moteur comme Google ? On utilise une URL avec des paramètres (longue de plusieurs centaines de caractères) et on contacte plusieurs serveurs. C’est la version simple.

URI : URL et URN sont dans un bateau…

Avant de comprendre ce que sont les URL, introduisons un autre sigle : URI ou identifiant de ressource uniforme. Comme l’explique Mozilla, un URI « est une chaîne [de caractères] qui fait référence à une ressource ». Deux sous-catégories sortent du lot :

Il reste 88% de l'article à découvrir.

Déjà abonné ? Se connecter

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Commentaires (40)

votre avatar
Très bon article.
La partie sur les ancres pourrait être détaillée en parlant des Text Fragments, une version spéciale des ancres commençant par #:~:text= afin que le navigateur surligne un texte présent dans la page, un exemple en cliquant ici. La version standard d'une ancre faisant scroller le navigateur vers le tag a ayant un attribut href correspondant à l'ancre, exemple en cliquant ici.
votre avatar
Yes !
et du coup on va descendre dans le modèle OSI pour aller vers les AS, BGP, et leurs potes?
votre avatar
Le but c’est de décrire entièrement le fonctionnement, bon jusqu’à un certain niveau évidemment. Donc oui l suite c’est DNS, mais après viendra BGP, les CDN, l’interco (peering, transit, IX). Ça va déjà faire une bonne semaine :D
votre avatar
Une autre précision, le nom de domaine peut être une adresse IP, mais cela va sans doute rejoindre la suite du dossier avec les DNS.
votre avatar
Me semble qu'en fait c'est "host" ou "hostname" et pas domain name. On peut avoir une IP, un hôte définit dans le fichier host...
votre avatar
Je parlais de nom de domaine en référence à l'image qui parle de Domain Name mais effectivement c'est plus Hostname qui devrait être dans l'image, le Hostname pouvant être une adresse IP ou un nom de domaine. Utilisez un hôte définit dans le fichier host de sa machine est peut être possible (je ne sais pas si un navigateur résout cela) mais ce n'est utilisable que localement, donc pas une URL pour Internet.
votre avatar
Je sais que ça marchait à une époque, typiquement si le navigateur utilise gethostbyname...
votre avatar
Le bon terme est fqdn il me semble
votre avatar
fqdn : Fully qualified domain name (fqdn)

Dans ma vue "dev", c'est Hostname comme pour MDN, le nom de domaine pouvant être un domaine avec des sous-domaines comme admin.next.ink par exemple.
votre avatar
Cette illustration est géniale <3
votre avatar
« Ces paramètres prennent la forme d'une liste de paires avec des clefs/valeurs associées, chacune séparée par une esperluette (&) [oui, c’est le vrai nom, pas et commercial ou américain, ndlr]. Le serveur web peut utiliser ces paramètres pour effectuer des traitements supplémentaires avant de renvoyer la ressource. Chaque serveur web applique ses propres règles pour la gestion des paramètres », explique Mozilla.
Je me souviens d'une époque où justement, le W3C recommandait de remplacer l'esperluette par un autre caractère (le point virgule par ex), car & pose problème en XML vu qu'il faut l'écrire &amp;

Il y a donc quelques arnaques sur certaines URL :)

cf. https://www.w3.org/TR/1999/REC-html401-19991224/appendix/notes.html#h-B.2.2
votre avatar
next.ink Next
Mince, ça ne permet même pas de se connecter sur le compte de l'auteur ! :D
Et même pas si on tape le mot de passe dans la page de connexion :fumer:
votre avatar
Ca aurait pu etre le piratage le plus simple de l’histoire :tristan:
votre avatar
Je ne vois pas comment on peut se passer du //. Si on ne l'a pas, que signifie toto:80 ? Machine 'toto' sur port 80, ou protocole 'toto' et adresse 80 ?
votre avatar
Contrairement à ce qui est écrit ici :
On ajoute ensuite un caractère de séparation, le « : », si le protocole est précisé (ce n’est pas une obligation)
le scheme est obligatoire (RFC 3986), donc les ":" aussi.

C'est pour cela que le // ne sert à rien si l'on suit les RFC.

Par contre, comme les navigateurs ont essayer d'abord de corriger les erreurs des utilisateurs puis de leur simplifier la vie, puis ensuite de les embrouiller en mélangeant zone de saisie de l'URL et zone de saisie de recherche via un moteur de recherche prédéfini, le scheme est devenu optionnel dans l'utilisation courante d'un navigateur (mais uniquement pour la saisie dans la zone d'adresse) qui essaiera https puis http ou l'inverse ou un seul suivant sa configuration.

Donc la réponse théorique à ta question est : protocole toto et adresse 80

Remarque, dans le cas où le navigateur reconstitue l'URL complète, le // n'est jamais saisi non plus, ce qui prouve bien son inutilité. on tape directement next.ink et pas //next.ink
votre avatar
Mais pour un fichier local file:/// les 3 slash sont bien obligatoires ?
votre avatar
Seul le dernier slash est réellement utile dans ce cas. Il signale le début du path. L'absence de host avant ce premier slash implique qu'il s'agit d'une ressource locale.
votre avatar
votre avatar
Ca donnerait http:toto: 80 au lieu de http://toto: 80.
Pas grande différence au final.
votre avatar
Je suis encore troublé de lire une url, j'ai toujours dit un pour le locator, c'est le son el de la fin qui encourage ?
on dit bien un manuel.
votre avatar
Un Manuel /accentportugais :sucre:
votre avatar
tu as raison dans l'absolu, maintenant dans les usages on voit le plus souvent une URL, je suppose que le féminin vient spontanément en raison d'une espèce de métonymie avec le mot adresse

(une URL, le Wi-Fi. Et gameboy hein, on dit quoi pour gameboy ? :troll:)
votre avatar
Je me suis en fait jamais posé autant de question… pour moi une url c’est une adresse et donc… féminin
Maintenant je suis plein de doute :xzombi:
votre avatar
C'est toujours compliqué, car s'il y a des règles d'usages, il y a toujours des exceptions !

Ainsi, pour un acronyme français, il faut, en théorie, utiliser le genre que l'on utiliserait si l'acronyme était remplacé par sa signification.

Pour un acronyme anglais (ou tout autre langue étrangère), il faudrait faire de même, en utilisant sa traduction française.

Exemple :
- un CA : masculin, car "Conseil d'Administration"
- la COVID : féminin, car le D, pour "disease" se traduit par maladie.

Ca, c'était pour la partie théorie "facile". En pratique, il peut y avoir de nombreuses exceptions. Par exemple :
- LASER, qui est devenu un nom commun, et qui est un abus de langage pour dire "dispositif LASER" est masculin, alors que son acronyme light amplification by stimulated emission of radiation voudrait que l'on utilise un féminin
- un HLM : généralement masculin, alors que pourtant, c'est une Habitation à Loyer Modéré. Ici, c'est l'usage qui a rendu l'emploi du masculin possible. Dans le cas présent, les deux sont acceptées.

Bref, il y a la théorie, et la pratique. Et en pratique, la règle est simple : c'est le bordel, démerdez vous :francais:

[edit] Et juste pour répondre au troll sur la gameboy, c'est féminin car sous-entendu une console Gameboy. Voilà, qui rajoute de la complexité, quand un terme est sous-entendu (comme pour le LASER).
votre avatar
Sauf que Nintendo a toujours dit LE Gameboy :devil:

(pardon pour le hors sujet !)
votre avatar
et le DS, le Switch aussi :censored:
votre avatar
Ah oui ? Sérieux ? Jamais vu ^^
votre avatar
Objection!

L'usage à l'époque, des utilisateurs, de la presse spécialisée, des commerçants, bref de tout le monde, c'était LA Game Boy (en 2 mots je vous prie M. @AlexandreLaurent ).

Or la langue, c'est l'usage qu'on en fait.

Si Nintendo et une poignée d'afficionado disent LE, quand bien même ils disposent du sceptre de royauté, dans la mesure où une écrasante majorité disait LA, de facto, Game Boy est féminin.

Nintendo a décidé pour nous. Nous avons presque unanimement décidé de ne pas en tenir compte. Que valent 3 documents officiels face à des millions?
votre avatar
Haha mes velléités autoritaristes s'inclinent face au pouvoir des foules, bravo pour ce plaidoyer :p
votre avatar
HLM c'est parce qu'on parle par abus de langage de "logement HLM" que c'est devenu masculin :)
votre avatar
C'est généralement une ellipse d'une adresse URL.
votre avatar
Je pense que c'est effectivement cet abus de langage qui a rapproché le féminin d'URL… avant que le mot "adresse" finisse par être omis car rentre en jeu la "règle" des 3 syllabes.
votre avatar
On ne dit ni "un" ni "une", mais "the url" :-D
Et si on parle français, on dit généralement "une" adresse.
votre avatar
reste à savoir si un url est une adresse, le terme n'existe pas dans l'acronyme, apparemment.
Pour le laser, là franchement je n'ai jamais su que ça en était un, et je ne me suis jamais demandé non plus, bon après, si on met amplificateur à la place de amplification, ça peut passer, mais location à la place de locator aussi pour url :reflechis:
votre avatar
IT Crowd <3
votre avatar
This is the Internet.
votre avatar
This, Jen, is the Internet.
votre avatar
Pour l'exemple de RFC, c'est dommage de ne pas avoir pris la 1149 ou la 2324 :francais:
votre avatar
Sans connaitre les numéros, je me suis dit que je pouvais certainement répondre par une erreur HTTP 418… j’aurais du répondre en live, mais j’ai vérifié (et je peux donc répondre erreur 418) :D
votre avatar
Je connaissais l’existence de la 1149 mais pas de la 2324 (et donc ni le code d’erreur 418).
La prochaine qu’on me demande un service que je ne suis pas sensé rendre, je répondrai erreur 418 …:windu:

[Dossier] Internet, mode d’emploi : une URL c’est quoi ? (partie 1)

  • URI : URL et URN sont dans un bateau…

  • En premier dans une URL, le schéma (alias le protocole)

  • Les « // » sont « inutiles », c’est Tim Berners-Lee qui le dit !

  • Des données d’authentification, optionnelles

  • Nom d’hôte et son port (d’attache)

  • Et voilà les paramètres

  • Sans oublier l’ancre

  • Quelle est la limite de longueur des URL ? Bonne question…

  • Une recherche sur Google = une URL de plus de 800 caractères

  • Dans la suite : le serveur DNS et les adresses IP

Fermer