1. Theoretische Begriffe
1.1. Geschichte des Internet
1.1.1. Die Geburt des Internet: 1969
1.1.2. Forschung und Entwicklung: 1970-1983
1.1.3. Das Netz der Wissenschaftler: 1983-1985
1.1.4. Die Revolution des «personal computer»: 1985-1990
1.1.5. Vom Mangel an Adressen und dem Aufkommen des WWW: die 90'er Jahre
1.2. Wie funktioniert das Internet
1.2.1. Dezentralisierung
1.2.2. Datenübertragung und Routing
1.2.3. Das Client-Server Prinzip
1.3. Die Internet-Adressen
1.3.1. IP-Adressen und Namensadressen
1.3.2. Die URLs (Uniform Resource Locator)
1.3.3. Web-URLs : <http://host.domain.org/repertoire/index.html>
1.3.4. E-mail URLs: <mailto:michel.martin@etatfr.ch>
1.3.5. FTP URLs: <ftp://ftphost.domain.org>
1.3.6. URLs für Diskussionsforen: <news:comp.sys.mac.programmer.tools>
1.3.7. Lokale URLs: <file:///dossier/repertoire/fichier.txt>
2. Das World Wide Web
3. Andere Dienste des Internet
4. Publikation einer Web-Site
Das Internet kennt heutzutage fast jeder, doch seine Entstehungsgeschichte ist vielen unbekannt. Dieses Kapitel soll die Geburt und den Werdegang des Internet, sowie einige wichtige historische Gegebenheiten, welche bei der Entwicklung wichtig waren, darstellen. (Siehe zu diesem Thema auch: die Internet Timeline, von Robert Hobbes Zakon.)
Der Ursprung des Internet, wie wir es heute kennen, geht auf das Jahr 1969 zurück. Die Geburt des Internet geht einher mit einem Projekt des US-amerikanischen Verteidigungsministeriums. Dieses hatte die Sicherstellung der Übertragung von numerischen Informationen im Kriegsfall (namentlich bei einem nuklearen Angriff) als Ziel. In jener Zeit war das Telefon das einzige Kommunikationsmittel, welches für ein solches Projekt in Frage kam. Beim Telefonnetz besteht das Problem, dass die Knotenpunkte (Telefonzentralen) von tragender Bedeutung für das Funktionieren des Systems sind, weshalb sie sich als geeignete Ziele anbieten, um die gesamte Kommunikation lahmzulegen.
Deshalb musste man ein Kommunikationsnetz vorsehen, welches in der Lage sein sollte die Verbindungs-Route zu ändern, wenn die Verbindung über einen bestimmten Knotenpunkt nicht mehr möglich war. D.h. das Netz sollte total dezentralisiert sein.
Die Kommunikationswissenschaftler hatten eine theoretische Lösung anzubieten: Man sollte ein Gewebe (in englisch «web») von Datagramm-Netzen konstruieren und Protokolle verwenden, um den Datenverkehr auf diesem Netz von Netzen dynamisch zu steuern.
Das DARPA (Defense Advanced Research Projects Agency) führte schliesslich das Programm ein, welches zum Vorläufer des Internet werden sollte: das Arpanet. Im September 1969 wurde Arpanet in der Universität von Kalifornien (UCLA) installiert und im Dezember 1969 waren vier amerikanische Universitäten angeschlossen.
Während 10 Jahren blieb Arpanet in den Händen von Militär und Wissenschaft. Die Übertragungsprotokolle wurden in dieser Zeit durch mehrere Entwicklungsgruppen laufend erweitert und verbessert. Im Jahre 1971 waren 15 Universitäten, welche insgesamt 23 Zentralrechner (Hosts) zählten, an Arpanet angeschlossen und das erste Programm für die elektronische Post wurde entwickelt. 1972 stieg die Zahl der beteiligten Universitäten bereits auf 40 und die erste E-Mail wurde verschickt.
Das Jahr 1973 stand im Zeichen der Internationalisierung des Projektes: eine Universität von London und eine Uni in Norwegen konnten sich an das Netz anschliessen. 1975 erklärte das DARPA das Projekt Arpanet als Erfolg. 1979 wurde das erste Diskussionsforum (newsgroup) eröffnet. Die Zahl der Hosts steigt in den Jahren 1981/82 von 213 auf 235. Der Ausdruck «Internet» wird im Jahre 1982 zum ersten Mal verwendet.
1983 wurden die Hauptprotokolle (inklusive IP und TCP) definitiv in Arpanet aufgenommen. Obwohl das Militär Arpanet verlässt, um sein eigenes Netz zu gründen, besteht dieses mittlerweile bereits aus 500 Knoten.
Im August 1983 sind 562 Hosts (hauptsächlich Universitäten) auf dem Arpanet vertreten. In jener Zeit war nicht daran zu denken, einen Computer auf einen Bürotisch zu stellen, füllten damalige Rechner doch ganze Büroräume aus. Die Benutzer arbeiteten auf Terminals, welche mit den Rechenmaschinen verbunden waren.
Nur wenige industrielle Firmen waren an das Internet angeschlossen. Die Dienstleistung des Netzes, welche den grössten Anklang fand, war die elektronische Post, die es möglich machte, innerhalb von Minuten mit Kollegen schriftlich zu kommunizieren.
Im Jahre 1984 übernimmt die NSF (National Science Foundation) die Kontrolle und die Wartung des Arpanet, während die Zahl der Hosts die Tausendergrenze überschreitet. In diesem Jahr wird auch der Ausdruck «cyberspace» vom Romanschriftsteller William Gibson geprägt.
Insbesondere dank der Entwicklung der «Personal Computer» sowie der LANs (Local Area Network = lokales Netzwerk), wird es möglich, Netzwerke untereinander zu verbinden. Was man als «subnetting» bezeichnet, d.h. die Konstruktion von Unter-Netzen wird im Jahre 1985 standardisiert. Diese Technologie öffnet die Tür zur Verbindung der LANs mit den WANs (Wide Area Network).
1986 starten die NSF und die NASA das Programm «Supercomputer Centers», dessen Ziel es ist, möglichst vielen Leuten (und nicht nur den reichsten Universitätszentren) die Rechenleistung der Supercomputer (wie der berühmten Crays) zur Verfügung zu stellen. Zu diesem Zweck verband man alle amerikanischen Universitäten und fasste den Entschluss, dieses Netzwerk auf den Protokollen des Internets aufzubauen: das NSFNet entstand. Auch aus diesem Grund stieg die Zahl der Hosts zwischen Februar und November 1986 sprunghaft von 2308 auf 5089 an.
Die Bezeichnung der Bereiche (Domäne) wird stabil im Jahre 1987. Bis dahin waren statische Tabellen für die Verbindung zwischen den Namen der Hosts und deren IP Adressen verwendet worden. Dieses Vorgehen wird durch das exponentielle Wachstum des Internet unhaltbar, zählt dieses mittlerweile doch schon 28'174 Hosts..
Im Jahre 1987 ereignet sich auch die grösste «Sicherheitspanne» der Geschichte des Internet. Der «Internet-Wurm». Robert Morris, ein 23-jähriger Informatikstudent der Universität Cornell, schreibt ein experimentelles Programm. Einen sogenannten «Wurm» (ein Programm, welches sich selbst reproduziert und sich im Netz verbreitet) und schleust diesen am 2. November 1987 ins Internet. Dieses Programm verbreitet sich mit extrem grosser Geschwindigkeit. Ganze Netzwerke werden blockiert. Andere werden vom Netz genommen, um die Schäden in Grenzen zu halten. Unter den Internet-Hosts werden 6000 temporär unbrauchbar gemacht. Ein ähnlich geartetes Problem ist auch in unserer Zeit nie vollkommen auszuschliessen.
Die Anzahl der Hosts steigt weiter: von 56'000 im Jahr 1988 auf 150'000 im Jahr 1989.
1990 wurde Arpanet offiziell durch das, was wir heute als Internet kennen, abgelöst. Es bestand nunmehr aus mehr als 300'000 Hosts welche in 2063 Netze aufgeteilt waren. Auch im Jahre 1991 stieg die Anzahl der angeschlossenen Computer drastisch an: von 376'000 im Januar auf 617'000 im Oktober.
Man stösst an die Grenzen der IP-Adressen, welche zur Verfügung stehen. Eine IP-Adresse besteht zwar aus einer Folge von 32 Bits (0 oder 1), womit theoretisch mehr als 4 Milliarden eindeutig bestimmbare Adressen definiert werden könnten. Der verwendete Mechanismus zur Belegung der Adressen hat jedoch den Nachteil, dass er viele Adressen nicht belegt. Durch verschiedene Methoden hat man versucht, die Anzahl der Adressen zu erhöhen. Die Lösung, welche gefunden wurde, nennt sich CIDR (Classless Internet Domain Routing). Sie erlaubt eine effizientere Belegung der 32 Bits einer IP-Adresse. Aufgrund des enormen Wachstums des Internet muss früher oder später eine andere Lösung gefunden werden. Man könnte z.B. die Länge einer IP-Adresse auf 128 Bits erhöhen, was eine praktisch nicht limitierte Anzahl von eindeutigen IP-Adressen zur Folge hätte.
Die 90'er Jahre markierten auch den Beginn des WWW (World Wide Web), welches ab 1988 im CERN in der Schweiz entwickelt und im NCSA (National Center for Supercomputing Applications) der Universität von Illinois verbessert wurde. Das Ergebnis ist NCSA Mosaic: das erste Hypertext-Navigationsprogramm mit graphischer Oberfläche, welches 1992 erscheint.
Dies hat eine wahre Explosion von WWW-Seiten zur Folge und verhilft dem Internet zum endgültigen Durchbruch. Die Anzahl der Hosts nimmt in den folgenden Jahren schwindelerregende Ausmasse an. 1992: 1'000'000, 1993: 2'000'000, 1994: 3'500'000 Hosts in annähernd 40'000 verbundenen Netzen. Die Wachstumsrate beträgt 20% pro Monat.
Die ersten Suchmaschinen treten auf. Im Jahr 1995 zählt das Internet mehr als 6,5 Millionen Hosts und über 60'000 untereinander verbundene Netze. Die Schallmauer von 10 Millionen Hosts wird im ersten Halbjahr des Jahres 1996 durchbrochen. Im Juli 1997 sind bereits gegen 20 Millionen Computer an das Internet angeschlossen.

Das Internet ist ein Netzwerk welches, aus einer grossen Anzahl von Computern (Hosts) besteht, die untereinander verbunden sind, so dass Daten ausgetauscht werden können. Es basiert auf einigen wichtigen Basisprinzipien die hier kurz beschrieben werden sollen.
Das erste Funktionsprinzip des Internet ist die Dezentralisierung. Es existiert in der Tat weder ein zentraler Rechner, noch sonst eine zentrale Stelle, welche für die Führung des Internet zuständig wäre.
«Internet ist eine anarchische Verbindung von Netzen, welche unterschiedliche Besitzer haben» (frei nach Christian Huitema, Le Routage dans l'Internet, Eyrolles 1995, Seite 2). Deshalb besitzt das Intenet keine eigentliche Bauart. Was das Internet charakterisiert, ist vielmehr die Art und Weise des Datenaustauschs zwischen den Hosts.
Wie funktioniert denn nun der Datenaustausch auf dem Internet?
Die Meldung, welche verschickt werden soll, wird zunächst in viele kleine Pakete zerlegt. Jedes dieser Pakete trägt die Adressen des Absenders und des Empfängers, sowie eine Ordnungszahl, welche seine Position innerhalb der Meldung angibt. Ein Paket, welches mit diesen Informationen ausgestattet ist, nennt man ein Datagramm.
Die Pakete werden dann an das Netz geschickt, welches dafür verantwortlich zeichnet, dass sie am richtigen Ort ankommen.
Jedes Paket ist unabhängig, d.h. der Weg vom Ausgangs- zum Zielort kann für jedes Paket unterschiedlich sein. Es ist daher unmöglich vorauszusagen, über welche Zwischen-Knoten (die Router) die Pakete laufen werden.
Die Router berechnen tatsächlich jeweils den optimalen Weg für ein Paket. Dieser Weg ändert sich je nach aktueller Situation des Netzes. Die Berechnung des optimalen Weges für ein Paket nennt man Routing.

Illustration nach Louis Perrochon, School Goes Internet, dpunkt Verlag, Heidelberg 1996.
Es gibt keine Garantie dafür, dass das Netz kein Paket verliert. Geht einmal ein Paket verloren, so wird es vom Absender erneut gesendet.
Der Computer des Empfängers erhält nun die Pakete in willkürlicher Reihenfolge und ordnet diese gemäss der Ordnungsziffer. Hat er einmal die gesamte Meldung erhalten, so sendet er mit dem gleichen Prinzip eine Botschaft an den Absender, um den Erhalt der Meldung zu quittieren.

Illustration nach Louis Perrochon, Op. Cit.
Dank der Verbindung von vielen Netzwerken im Internet gibt es eine grosse Anzahl von möglichen Wegen, welche ein Paket von einem Host zum anderen nehmen kann. Deshalb ist es möglich, dass Pakete auf einen anderen Weg ausweichen können, wenn einmal ein Knotenpunkt des Netzes ausfällt.
Es ist wichtig, den Unterschied eines solchen Netzes zum Telefonnetz zu verstehen: das Telefonnetz baut eine Verbindung vom Anrufer zum Empfänger auf, welche während des Gesprächs aufrechterhalten bleibt. Jegliche Information geht durch dieselbe Verbindung. Falls aus irgend einem Grund (Überlastung) eine solche Leitung nicht zustande kommt, so gibt es keine Kommunikation. Im Internet ist dies anders: die Pakete werden trotzdem übertragen, jedoch mit geringerer Geschwindigkeit.
Die Datenübertragung auf dem Internet funktioniert nach dem Client-Server Prinzip. Als Server bezeichnet man einen Computer (normalerweise sehr leistungsfähig und zuverlässig) oder ein Computerprogramm, welches Dienstleistungen zur Verfügung stellt, die von mehreren Benutzern gleichzeitig gebraucht werden können (d.h. von mehreren Computern, welche an einem Netzwerk angeschlossen sind). Der Client ist der Computer oder das Programm, welche die Dienste des Servers in Anspruch nimmt.
Jede Übertragung von Daten geschieht nach gleichem Muster: der Client beginnt die Übertragung mit einer Anfrage an den Server. Dieser antwortet in gewünschter Art und Weise und wenn die Anfrage befriedigt wurde, wird die Transaktion abgeschlossen.
Damit das Prinzip des Routing, wie es oben beschrieben wurde, funktioniert, ist es unabdingbar, dass jeder Host den gewünschten Empfänger auf dem Netz ausfindig machen kann. Deshalb besitzt jeder Computer, der an das Internet angeschlossen ist ,eine eindeutige Adresse: die IP-Adresse.
Eine IP-Adresse besteht aus vier Zahlen zwischen 0 und 255 (Zahlen mit 8 Bit), welche durch einen Punkt getrennt werden. So ist z.B. 156.25.83.172 eine zulässige IP-Adresse. Die Zahlen haben eine besondere Bedeutung: ein Teil der Zahl bezeichnet das Netz resp. das Unter-Netz in welchem sich der entsprechende Host befindet. Die restlichen Zahlen bezeichnen in eindeutiger Weise den Host selbst.
Jeder weiss, dass sich menschliche Wesen (im Gegensatz zu Computer) Zahlen nur sehr schlecht merken können. Deshalb gibt es auf dem Internet einen Dienst, welcher es ermöglicht, jeder IP-Adresse eine Namensadresse zuzuordnen. Dieser Dienst heisst in englisch «domain name service» (DNS). Er besteht im wesentlichen aus einer grossen Datenbank die auf verschiedenen speziellen Hosts auf dem Internet abgespeichert ist. Diese Computer kümmern sich dann um die Zuordnung zwischen den IP- und den Namensadressen.
Eine Namensadresse besitzt eine hierarchische Struktur von der Form: «host.domain.ch».
Die erste Ebene der Struktur wird durch den letzten Teil der Adresse repräsentiert. Sie gruppiert ganze Klassen von Benutzern wie z.B: «edu», «com» oder «gov», oder die Benutzer eines ganzen Landes, wie: «ch», «de» ou «fr». Die folgende Tabelle gibt die wichtigsten Endungen der Internet-Adressen und deren Bedeutung an:
| Geographische Domänen | Logische Domänen | ||
|---|---|---|---|
| ch | Schweiz | edu | Bildung |
| fr | Frankreich | com | Firmen |
| de | Deutschland | net | Netzwerken |
| it | Italien | gov | US Regierung |
| us | Vereinigte Staaten | mil | US Militärorganisationen |
| uk | Grossbritannien | int | Internationale Organisationen |
| ca | Kanada | org | Andere Organisationen |
In dieser ersten Ebene sind die Domänen (Bereiche) gespeichert wie z.B. «whitehouse.gov» oder «unifr.ch», welche die zweite hierarchische Ebene bilden. Der Name jeder Domäne ist eindeutig. Die Endung gehört zum Domänen-Namen dazu, d.h. dass «bluesky.ch» und «bluesky.fr» zwei verschiedene Domänen -Namen sind. Ein Domänen -Name hat im allgemeinen eine Ähnlichkeit mit dem Namen der Firma oder der Organisation welche die Domäne verwaltet. Die letzte Ebene der Struktur ist der Name des Hosts in der entsprechender Domänen. Es kann vorkommen, dass Zwischenebenen existieren. Sie bezeichnen in diesem Fall Unterdomänen. Ein Beispiel einer Adresse mit einer Unterdomäne ist «server.csc.edufr.ch».
Zusammenfassend kann man sagen, dass eine Namensadresse besteht aus:
Die Funktion des DNS ist die Übersetzung einer vom Benutzer eingegebenen Namensadresse in die entsprechende IP-Adresse. Der Vorteil der Namensadressen besteht nicht nur in der besseren Benutzerfreundlichkeit. Falls ein Zentralrechner umzieht oder einfach seine IP-Adresse ändert, so muss nur die DNS auf den neusten Stand gebracht werden. Die Namensadresse bleibt dieselbe (sie entspricht nun einfach einer anderen IP-Adresse) wodurch für den Benutzer alles beim alten bleibt.
Das Internet bietet Zugang zu ganz verschiedenen Dingen: einem Server (d.h. einem Computer), einem Briefkasten (d.h. einer Person) oder zu Daten (d.h. zu Information). Man braucht also ein Mittel, womit man all die verschiedenen Dinge, welche das Internet bietet, ansprechen kann. Die Lösung nennt man im englischen «Uniform Resource Locator», oder abgekürzt URL. Umgangssprachlich verwendet man häufig das Wort «Internet-Adresse» wenn man eigentlich eine URL meint.
Um eine URL vom umgebenden Text abzugrenzen verwendet man eine spezielle Schreibweise, indem man die URL zwischen die Zeichen < (kleiner als) und > (grösser als) setzt. Diese Abgrenzungszeichen gehören allerdings nicht zur URL, weshalb man beim Eintippen einer solchen Adresse die Zeichen < und > wegzulassen hat.
Hier einige Beispiele von URLs:
Mit einer URL kann man also ganz verschiedene Sachen ansprechen. Der Hauptunterschied ist der erste Teil der URL: «http://», «mailto:», «ftp://», «news:» oder «file://». Mit Hilfe dieses Teils entscheidet man, welches Protokoll oder Programm im vorliegenden Fall verwendet werden muss.
Manchmal ist es notwendig, nach dem Namen des Zentralrechners noch den Zugangspfad (path) der Datei oder des Dienstes anzugeben, welcher verwendet wird. Dabei müssen die Verzeichnisse durch Schrägstriche (in englisch slash) abgetrennt werden.
Wir werden nun die wichtigsten URL's und ihre Funktion beschreiben.
Die URLs welche am weitesten verbreitet sind, sind diejenigen welche eine Web-Seite bezeichnen. Das Präfix «http://» zeigt an, dass das HTTP-Protokolll (Abkürzung für «HyperText Transfer Protocol») verwendet werden soll. Danach folgt der Name des Zentralrechners, sowie das Verzeichnis, auf welchem die Seite gespeichert ist. Schliesslich wird noch die Startseite angegeben, welche als erste aufgerufen wird. Im Beispiel von oben heisst der Zentralrechner «host.domain.org», das Verzeichnis ist «repertoire» und die Startseite trägt den Namen «index.html».
Kopiert man eine URL aus einem Heft oder Buch, so ist es wichtig, die Gross- resp. Kleinschreibung zu beachten.
Die URLs welche den Briefkasten eines Benutzers der elektronischen Post bezeichnen sind mit der Vorsilbe «mailto:» versehen. Der Rest der E-Mail-Adresse besteht aus zwei Teilen, die durch das typographische Zeichen @ getrennt werden. Dieses Zeichen heisst im englischen «at symbol» und steht für die örtliche Präpositon «at» (bei, in).
Der Teil der Adresse, welcher nach dem @ steht, bezeichnet den Namen des Zentralrechners, auf welchem sich der Briefkasten des Benutzers befindet. Oftmals ist er mit dem Domänennamen identisch.
Der Teil, welcher vor dem @ steht dient dazu, den Benutzer in eindeutiger Weise zu identifizieren. Da es sich meist um eine Person handelt, wird in diesem Teil vorzugsweise der Name und der Vorname des Benutzers auftreten.
Bei E-Mail-Adressen wird nicht zwischen Gross- und Kleinschreibung unterschieden. Normalerweise schreibt man die Adressen ausschliesslich in Kleinbuchstaben.
Die URLs, welche den Transfer von Dateien mittels FTP ermöglichen, haben dieselbe Syntax wie die Web-URLs. Der einzige Unterschied ist das Präfix, «ftp://» anstelle von «http://».
Der Zugangspfad der Datei, welche übermittelt (heruntergeladen) werden soll, wird an den Namen des Zentralrechners angefügt, wobei Schrägstriche verwendet werden, um Verzeichnisse anzugeben.
Um an den Diskussionsforen teilzunehmen, verwendet man eine URL mit dem Präfix «news:». Der Rest der Adresse besteht aus dem Namen des Diskussionsforums, welches gewählt wird. In unserem Beispiel heisst das Forum «comp.sys.mac.programmer.tools».
Oftmals ist es nützlich, auf eine Datei, welche lokal auf der Festplatte gespeichert ist, zugreifen zu können. Dafür gibt es eigens einen Typ von URLs mit dem Präfix «file://» (das englische Wort «file» bedeutet «Datei»).
Nach dieser Vorsilbe gibt man den Pfad der Datei in der Hierarchie der Festplatte an, wobei man mit dem obersten Verzeichnis («root») beginnt, welches durch einen Schrägstrich symbolisiert wird. Deshalb enthalten die lokalen URLs 3 aufeinanderfolgende Schrägstriche.
|
Inhaltsverzeichnis |
Nächstes Kapitel |