2. Le World Wide Web

par Nicolas Martignoni

français
Deutsche Übersetzung


Table des matières

1. Notions théoriques

2. Le World Wide Web

2.1. L'hypertexte

2.2. Utilisation d'un navigateur

2.2.1. La fenêtre de navigation

2.2.2. La barre de navigation

2.2.3. Le champ d'URL

2.2.4. La barre d'états

2.2.5. Menus contextuels et menus habituels

2.3. Surfer sur Internet

2.3.1. Les signets ou bookmarks

2.3.2. L'historique de la session

2.4. Rechercher de l'information

2.4.1. Moteurs de recherche et catalogues

2.4.2. Recherche des informations

2.4.3. Évaluer les informations trouvées

2.4.4. Exercices de recherche documentaire

2.5. Protection de la sphère privée

2.6. Sécurité lors de transactions

3. Autres services d'Internet

4. Publication d'un site Web

Glossaire


Le Web est un service d'Internet que l'on désigne aussi sous les termes WWW, acronyme de World Wide Web (c'est-à-dire «toile [d'araignée] mondiale») ou encore W3 (lire «W au cube», par analogie avec les mathématiques, où W W W = W3). C'est ce service qui a contribué à l'explosion de l'utilisation d'Internet par le grand public, grâce à sa facilité d'emploi. Il faut toutefois se garder de confondre Internet et le Web.

top2.1. L'hypertexte

Le Web a été inventé au CERN en Suisse. Il se base sur ce que l'on appelle l'hypertexte. Un hypertexte est un ensemble de documents liés les uns aux autres à l'aide de liens ou hyperliens (dans le jargon «link» et «hyperlink»). En sélectionnant un de ces liens, on passe d'un document à l'autre en suivant un thème, une idée, etc. Un hypertexte se différencie d'un texte habituel, par exemple d'un livre, par le fait qu'il ne se lit pas linéairement, c'est-à-dire du début à la fin.

Les liens d'un hypertexte sont en général soulignés et de couleur différente dans le texte. Une image d'un texte peut aussi cacher un hyperlien. Le document que vous lisez est un exemple d'hypertexte.

Exemple d'hypertexte

Un hypertexte peut contenir des documents de nombreux types: textes, images, animations, musique et autres sons enregistrés, etc. L'hypertexte est donc un support idéal pour le multimédia.

L'outil permettant d'utiliser l'hypertexte, notamment sur le Web, s'appelle un navigateur, (adaptation du terme anglais «browser») ou logiciel de navigation, parce qu'il permet de «naviguer» ou de «surfer» sur Internet. Le premier des navigateurs fut Mosaic. Les programmes de navigation les plus utilisés actuellement sont Communicator, Explorer, iCab et Opera.

Initialement destinés uniquement à l'accès au Web, les navigateurs offrent maintenant l'accès à presque tous les services d'Internet, par le biais des URLs. Ainsi le courrier électronique, le transfert de fichiers FTP, les messageries, etc. peuvent être consultés ou utilisés grâce aux logiciels de navigation. C'est aussi pour cette raison que le WWW prend autant d'ampleur.

Les documents hypertextes publiés sur Internet ont en commun le langage dans lequel ils sont écrits: HTML (HyperText Markup Language). Ce langage s'apparente aux langages de programmation. Des commandes ou balises (en anglais tags) indiquent comment composer le texte, c'est-à-dire comment il apparaîtra à l'écran. Par exemple, pour afficher un texte en gras, on devra spécifier dans le code <B>ce texte est en gras</B>. Même si cette méthode semble peu pratique par rapport à l'édition dans un traitement de texte, elle a un énorme avantage: un texte HTML peut être écrit et lu sur n'importe quel environnement informatique, le résultat sera le même, indépendamment de l'ordinateur.

top2.2. Utilisation d'un navigateur

Le logiciel de navigation s'installe sur l'ordinateur de l'utilisateur. Il lui permet d'accéder aux différents services d'Internet en tant que client, notamment au Web, grâce à l'hypertexte.

top2.2.1. La fenêtre de navigation

Fenetre de navigation

Après démarrage du programme, le navigateur affiche une fenêtre dont les principaux éléments sont:

Dans cette fenêtre s'affiche le document (ou la page) désiré. En cliquant sur un lien, on charge dans la fenêtre un nouveau document.

top2.2.2. La barre de navigation

Barre de navigation

Les boutons Back (retour) et Forward (en avant) permettent de revenir à la page précédemment consultée, respectivement à revenir si l'on a utilisé le bouton Back. En maintenant le bouton de la souris enfoncé sur l'un de ces boutons, on peut choisir parmi une liste des pages récemment consultées lors de la session.

Le bouton Reload (recharge) permet de recharger la page affichée et Home (maison) charge une page particulière appelée page d'accueil (dans le jargon «homepage»), configurée par l'utilisateur.

Les boutons Search et Netscape permettent de consulter des sites utiles pour les débutants. Le bouton Images permet de charger ou recharger les graphiques d'une page, Print de l'imprimer et Stop d'interrompre le chargement d'une page.

Le bouton Security donne des informations sur l'état de la sécurité de la page consultée, c'est-à-dire si sa transmission a été cryptée ou non. Elle permet en outre de vérifier si le cryptage est authentique.

top2.2.3. Le champ d'URL

Le champ d'URL est très important. Il contient l'URL de la page affichée dans la fenêtre. Cela permet de noter l'adresse pour une éventuelle réutilisation, ou pour la communiquer à d'autres personnes.

Ce champ permet en outre de taper directement l'URL d'un site ou d'une page. Il est ainsi possible d'accéder directement à une adresse Internet lue par exemple dans un journal. Lorsque l'on tape un URL, il est absolument indispensable de respecter strictement l'orthographe de celui-ci (majuscules/minuscules, pas d'espace, respect de la ponctuation, etc.), sans quoi la page ne sera pas trouvée sur le réseau.

Dans les navigateurs récents, il n'est pas nécessaire de saisir les caractères «http://». En tapant «www.cscfr.ch», le logiciel devinera qu'il s'agit de l'adresse d'un site WWW et complétera de lui-même l'URL. Pour les sites dont l'adresse est du type «www.firme.com», par exemple «www.apple.com» ou «www.adobe.com», il suffit de saisir dans le champ de l'URL le nom de la firme, par exemple «apple» ou «adobe», et le navigateur fait le reste.

top2.2.4. La barre d'états

La barre d'états affiche sous la forme d'un cadenas fermé Cadenas ferme ou ouvert Cadenas ouvert suivant que la page consultée est sécurisée ou non. Il est impossible de modifier l'état de sécurisation d'une page. Cette sécurité est en effet offerte par le serveur. En outre apparaissent temporairement l'état de la communication, le pourcentage déjà chargé de la page demandée et/ou la vitesse de transfert. Lorsqu'une page est entièrement chargée, la barre d'état est vide (voir figure ci-dessus). Lorsque le pointeur est situé sur un lien, la barre des menus affiche l'URL correspondant à ce lien.

Barre d'etats

top2.2.5. Menus contextuels et menus habituels

En cliquant n'importe où et en maintenant le bouton de la souris enfoncé, un menu apparaît, qui peut être différent suivant l'objet désigné par le pointeur. Un tel menu, changeant d'après le contexte, et appelé menu contextuel. Ces menus sont très utiles pour effectuer différentes actions. La figure suivante montre le menu apparaissant lorsque le pointeur désigne un lien.

Outre ces quelques spécificités, le logiciel de navigation est un programme tout à fait ordinaire. Il se pilote de manière standard avec des menus. Les menus File (pour Fichier) et Edit (pour Édition) fonctionnent comme partout ailleurs.

Menu contextuel

Le menu View permet de configurer les options d'affichage de la fenêtre de navigation. Il est ainsi possible d'augmenter ou de diminuer la grandeur du texte affiché. En outre ce menu permet notamment de visualiser le fichier source de la page, c'est-à-dire sa description en HTML.

Le menu Go comporte trois commandes permanentes, Back, Forward et Home, qui ont le même effet que les boutons du même nom. De plus, ce menu stocke l'adresse des pages déjà visitées lors de la session. Cela permet de revenir rapidement à une page consultée précédemment.

Le menu Bookmarks (en français, les signets), permet de stocker et d'organiser des adresses de sites que l'on visite souvent. Nous verrons plus bas comment cela fonctionne.

À l'aide du menu Communicator, on peut accéder à d'autres fenêtres, comme celle de l'historique de la session (sous-menu Tools, commande History), dont nous parlerons plus bas. Les autres services à disposition dans le navigateur (courrier électronique, messageries, etc.) sont également accessibles par ce moyen. Ce menu permet en outre de rendre actives les autres fenêtres de navigation éventuellement ouvertes, lors de la consultation simultanée de plusieurs sites.

Comme dans toutes les applications, le menu Help (Aide) permet d'obtenir des informations sur le fonctionnement du logiciel. Dans le cas des navigateurs, il est nécessaire d'être connecté à Internet pour obtenir cette aide, car les fichiers d'explications se situent le plus souvent sur le site du distributeur du programme.

top2.3. Surfer sur Internet

Surfer sur le Web, c'est tout simplement utiliser un navigateur pour consulter des pages WWW, en profitant de leur structure en hypertexte. Nous avons vu plus haut le principe de fonctionnement de l'hypertexte.

Les liens les plus visibles sont ceux qui sont dans le texte. Il sont, comme on l'a déjà dit, soulignés et de couleur différente du texte normal. Il est cependant essentiel de se souvenir que les images peuvent aussi faire office de liens. En principe, une image qui sert de lien est entourée d'un cadre de couleur différente. Toutefois, ce cadre n'est pas obligatoire. Pour découvrir ces liens, il s'agit donc de se fier à l'intuition, en promenant le pointeur sur les images.

Certaines images, appelées en anglais «imagemaps», recèlent plusieurs liens distincts. En cliquant en différents endroits de l'image, on accède aux différents liens. Cette méthode est employée sur les sites très graphiques (c'est-à-dire contenant beaucoup d'images).

De façon générale, ce n'est pas une bonne idée que d'imprimer les pages WWW. Elles ne sont en effet pas prévues pour un tel usage et le résultat est presque toujours décevant. Si l'on a besoin de garder une page pour un usage ultérieur, il est plus judicieux de l'enregistrer (commande Save As). Le résultat ne sera pas non plus optimal, puisque les images seront perdues, mais aura tout de même l'avantage indéniable de préserver tous les liens, et donc de conserver au document son caractère hypertexte. Il faudra à cet effet enregistrer le document sous son format original, c'est-à-dire à l'aide de l'option Source (voir figure ci-dessous).

Fenetre Save As

Pour enregistrer un site en entier, on utilisera un logiciel spécialisé dans cette tâche, permettant de télécharger tous les fichiers (images, sons, etc. y compris) du site. WebDevil ou WebWhacker sont des logiciels permettant cette opération.

top2.3.1. Les signets ou bookmarks

Internet recèle un bon nombre de sites contenant des informations de référence. Il peut être intéressant de revisiter de tels sites. Un moyen simple pour cela est de noter l'URL du site, et de le taper dans le champ d'URL du navigateur la prochaine fois que l'on veut y accéder.

Il y a cependant une méthode bien plus pratique et plus efficace pour arriver au même résultat: les signets (en anglais «bookmarks»). Lorsqu'on lit un livre, on place un signet ou bien on corne la page où l'on veut revenir. De façon analogue, les programmes de navigation permettent de stocker les adresses des sites préférés d'un utilisateur.

Pour ce faire, il suffit d'activer la commande Add Bookmark du menu des Bookmarks, lorsque l'on est en train de visiter le site intéressant. Le menu Bookmarks contient alors une entrée supplémentaire, désignant le site en question. Pour accéder ultérieurement au site, il suffira de sélectionner cette nouvelle entrée. Les signets sont enregistrés sur le disque dur de l'utilisateur et restent donc à disposition lors des prochaines sessions.

Menu des bookmarks

Le nombre de signets d'un utilisateur augmente rapidement. Il devient alors nécessaire d'organiser ces signets, et de les organiser intelligemment, sans quoi l'on risque de ne plus s'y retrouver. Cela signifie notamment qu'il faut classer les signets par thèmes, et surtout les assortir immédiatement d'un commentaire personnel, par exemple une description sommaire de ce qu'il contient. Pour cela, il faut évidemment avoir lu la majorité de la page en question.

L'organisation que nous venons de décrire est facilitée par les navigateurs. On sélectionne la commande Edit Bookmarks du menu Bookmarks (voir la figure ci-dessus). Il est alors possible de créer pour les signets des dossiers et des sous-dossiers, de les trier et, au moyen de la commande Get Info du menu Edit, de taper un commentaire pour chaque dossier et chaque signet (voir la figure ci-dessous).

Fenetre des bookmarks

Il est judicieux d'enregistrer cette précieuse liste de signets sur une disquette, afin de pouvoir l'utiliser sur un autre ordinateur, comme s'il s'agissait d'une page WWW ordinaire. Pour cela, lorsqu'on est dans la fenêtre Bookmarks, on utilise la commande Save As du menu File.

top2.3.2. L'historique de la session

L'historique d'une session (en anglais «history») consiste en une liste des pages consultées précédemment lors de la session. Nous avons déjà vu qu'en maintenant enfoncé un court instant le bouton Back, on peut sélectionner un des derniers sites visités.

Menu de l'History

La fenêtre History offre elle aussi une liste des pages consultées. Depuis cette fenêtre, on peut directement enregistrer un signet, ou encore revisiter un site. Si l'on ferme la fenêtre du navigateur, l'historique de la session est perdue.

top2.4. Rechercher de l'information

top2.4.1. Moteurs de recherche et catalogues

Internet est un média qui met à disposition un très grand nombre de ressources, comme une énorme bibliothèque. Il est donc nécessaire de disposer d'outils efficaces pour retrouver les informations qui s'y trouvent.

Il n'existe pas de catalogue au sens habituel du terme pour Internet. Les nouveautés et les changements journaliers sont trop nombreux pour tenir un tel catalogue à jour. Les outils utilisés pour la recherche d'informations sur le Net sont différents. Il s'agit des moteurs de recherche et des catalogues (appelés aussi parfois annuaires).

Les moteurs de recherche (en anglais «search engines») sont des ordinateurs qui parcourent et indexent le Web 24 heures sur 24, 365 jours par an. On les appelle aussi des robots (en anglais «spider» ou «crawler»). Ils construisent de la sorte une énorme base de données des mots se trouvant sur les pages Web du monde entier. Ils permettent de faire une recherche ciblée sur un ou plusieurs mots-clef, par le biais de sites spécialisés. Le plus connu des moteurs de recherche est Google . Un autre est Lycos, ou encore Altavista. Un moteur de recherche est comparable à l'index d'un livre.

Un catalogue ou annuaire est un site contenant des liens sur le WWW, classés par sujets. Ils sont composés par des rédacteurs (humains) à l'aide de moteurs de recherche. Le plus célèbre des catalogues est Yahoo. En général, un moteur de recherche permet d'affiner le résultat d'une recherche dans un catalogue. On peut comparer un catalogue d'Internet à celui d'une bibliothèque ou à la table des matières d'un livre.

Actuellement, les plus grands sites de recherche cumulent les deux types, moteur et catalogue.

top2.4.2. Recherche des informations

La recherche d'informations sur le Web n'est certainement pas aussi facile qu'elle en a l'air au premier abord. Nous allons voir pourquoi à l'aide d'un exemple et tenter de découvrir de meilleures stratégies de recherche.

Admettons que je recherche des informations sur la notation musicale, notamment sur les logiciels permettant l'écriture de cette notation. Mon premier réflexe, en tant que débutant, est de me connecter à un site de recherche, par exemple Google. Une fois la page apparue, je tape dans le champ «logiciel de notation musicale», puis je clique sur le bouton recherche Google.

Recherche Altavista 1

Après quelques secondes, une nouvelle page est chargée, avec des liens. En procédant de cette manière, deux cas de figures se présentent en général: le plus souvent, plusieurs milliers de liens contiennent les termes cherchés (dans ce cas, j'en ai obtenu 3'770); parfois au contraire, il n'y a que trop peu de liens.

Dans les deux cas, le résultat de la recherche est peu utilisable. Voici les causes possibles d'un tel échec.

Tout d'abord, faire une recherche sur un terme en français limite terriblement la recherche: l'énorme majorité des sites sont écrits en anglais, que cela plaise ou non. Il est donc judicieux d'utiliser des termes anglais avec au besoin leur traduction française. Dans notre cas, une recherche sur «software notation music» aurait donné plus de liens. De plus, les lettres accentuées ne sont pas prises en compte dans Google, mieux vaut donc les supprimer.

En résumé pour augmenter le nombre de liens trouvés, il faut utiliser des mots anglais, sans accents ni majuscules.

Recherche Altavista 2

Maintenant, nous sommes sûrs d'avoir obtenu une liste de liens très abondante, certainement riche de plusieurs milliers de liens (dans ce cas environ 347'000). On remarque très vite que beaucoup de ces liens ne correspondent pas à ce que nous cherchons, et que de toute manière, il est exclu de les passer tous en revue. Comment augmenter la pertinence des liens trouvés? Nous avons pensé, en tapant «software notation music», que Google chercherait strictement cette chaîne de caractère.

En fait, il cherche de cette manière tous les documents contenant tous les trois mots, où qu'ils se trouvent dans le texte. De plus, la façon d'écrire notre recherche est un peu artificielle. En bon anglais, on aurait plutôt écrit: «music notation software», mais le nombre de lien trouvé ainsi est sensiblement le même.

Pour lier obligatoirement deux ou plusieurs termes, il faut les mettre entre guillemets. Dans notre cas, il faudra taper «"music notation software"». Dans ce cas, les trois termes écrits l'un après l'autre sont recherché et le nombre de pages trouvées tombe à 23'800, ce qui est déjà plus raisonnable. Les premières pages de résultats vous fourniront déjà ce que vous cherchez, puisque Google fait son classement des sites en fonction de la popularité de ces derniers. Ce sont donc les sites les plus référencés du web qui apparaitront en premier.

Admettons maintenant que je cherche de tels programmes uniquement pour le Macintosh. Comment faire? Il serait aberrant de mettre encore entre guillement le mot «macintosh», qui n'aurait en effet que peu de chances d'être accolé aux trois autres termes. Voici comment faire:

Recherche Altavista 3

Cette fois, le nombre de liens est de 8'470 et leur pertinence est à coup sûr garantie dans les premières pages de résultats. On remarque que plus la recherche comporte de mots, plus le nombre de liens trouvés diminue et plus la recherche est précise. De façon analogue, le signe - (moins) permettra d'exclure de la recherche un terme non désiré.

Pour des recherches plus pointues, on utilisera le mode de recherche avancé. Chez Google, ce mode est appelé «Recherche avancée». Il permet de choisir des critères beaucoup plus précis, comme par exemple la langue, le format, la date, etc.

La figure ci-dessous montre une telle recherche. Il signifie: on cherche tous les documents du Web en n'importe quelle langue, publiés durant les 365 derniers jours, contenant obligatoirement le mot «midi» et l'expression «music notation software» et contenant au moins l'un des mots «mac» ou «macintosh», et qui ne contiennent pas le mot «sequencer». Ces mots peuvent figurer n'importe où dans la page.

Recherche avancee Altavista

Il y a encore d'autres possibilités d'affiner les critères de recherche. Pour plus d'informations à leur sujet, il suffit d'activer le lien «conseils de recherche».

top2.4.3. Évaluer les informations trouvées

Une fois l'information trouvée, il est absolument indispensable d'y jeter un oeil critique. En effet, s'il est compliqué et difficile de publier un livre ou d'écrire dans une revue, il est très facile de le faire sur Internet. N'importe qui peut y mettre n'importe quoi. Voici quelques clefs pour évaluer une source d'information sur Internet (voir à ce sujet l'excellent article de Robert Harris ou encore ce site canadien).

top2.4.4. Exercices de recherche documentaire

Voici quelques exercices de recherche documentaire. Utilisez dans un premier temps le mode de recherche simple d'un moteur de recherche. Amusez-vous bien !

top2.5. Protection de la sphère privée

Une connexion à Internet n'est pas totalement anonyme, contrairement à l'opinion de la majorité. En effet, les serveurs WWW sur lesquels on se branche reçoivent automatiquement le numéro IP de l'ordinateur. Il est donc possible de retrouver les personnes qui sont venues visiter tel ou tel site.

En outre, lors de la consultation d'un site, un serveur Web a la possibilité d'enregistrer des données à l'insu du visiteur. Cela signifie que certains sites enregistrent des informations privées sur le disque dur de l'ordinateur de l'internaute. Tous les hôtes du même domaine que le serveur peuvent récupérer ces informations, lorsque l'utilisateur retourne dans ce domaine. Ces données confidentielles, appelées «cookies», sont utilisées la plupart du temps à des fins commerciales: il est possible à une entreprise de savoir à quels produits vous vous intéressez et de vous envoyer de la publicité en conséquence.

Les cookies peuvent aussi être utilisés pour personnaliser votre accès à un site que vous consultez régulièrement. Ils ne fonctionnent donc pas uniquement pour espionner votre façon de surfer. Ils sont enregistrés sur votre disque dur dans un fichier appelé «MagicCookie», ou «cookies.txt» ou encore dans un dossier nommé «Cookies». Il est toujours possible d'effacer ces fichiers ou dossier manuellement sans conséquences néfastes.

Les cookies ne sont en aucun cas assimilables à des virus. Ils n'en demeurent pas moins des atteintes à la sphère privée. Les navigateurs récents permettent de filtrer manuellement les sites ayant le droit d'enregistrer des cookies, et même de les interdire complètement (voir la figure suivante).

Preferences pour cookies

Une discussion complète de ce problème et des traces que l'on laisse sur les différents serveurs visités se trouve auprès du site de la Commission Nationale de l'Informatique et des Libertés en France.

top2.6. Sécurité lors de transactions

Le commerce sur Internet est en pleine croissance. On vend quasiment de tout sur Internet: des logiciels, de la nourriture, des voyages, des disques compacts, etc. Les paiements des clients aux vendeurs se font essentiellement de deux façons: par carte de crédit ou par argent virtuel, la première des deux étant actuellement la plus courante.

Lorsque l'on fait un achat sur un site WWW à l'aide d'une carte de crédit, le vendeur demande des informations confidentielles, à savoir le numéro de la carte de crédit et sa date d'expiration. Dans la plupart des cas, quand le serveur n'est pas capable de traiter le cryptage des données, ces informations naviguent en clair sur le réseau. Il est donc théoriquement possible de les intercepter afin de les utiliser frauduleusement. En réalité, ce risque est faible. Il est notamment plus faible que celui de se faire intercepter un numéro de carte de crédit lu au téléphone ou encore transmis par télécopie.

Le plus grand risque d'utilisation frauduleuse de ces données est chez leur destinataire (le vendeur), à qui l'on est contraint de se fier, même si les données sont cryptées. Si l'on a pas une totale confiance dans le destinataire des informations, il vaut mieux s'abstenir de transmettre un numéro de carte.

Petit à petit, les transactions bancaires viennent sur Internet. Il est dans ce cas nécessaire de garantir un secret absolu dans les deux sens de la transaction. C'est pourquoi, pour effectuer des transactions bancaires, l'utilisateur doit télécharger un programme de cryptage adéquat, comme SafeLine ou encore SecureNet. La technique n'en est dans ce domaine qu'à ses balbutiements, mais elle semble prometteuse.