Was ist ein Byte?

Was ist ein Byte?

Immer dann, wenn es um Angaben wie Platzverbrauch und Speichermengen geht, hören wir den Begriff "Byte", "Megabyte" oder "Gigabyte". Aber was ist das eigentlich, das Byte?

Ausgesprochen wird der Begriff "Bait". Und um zu erklären, was das eigentlich ist, muß man sich den Computer als das vorstellen, was er ist : eine ausgesprochen dämliche Ansammlung von Plastik, Schrauben und allerlei kupfernen Leiterbahnen.

Ein Computer kann mit Zahlen nichts anfangen, Buchstaben kennt er auch nicht und Ihre Sprache erst recht nicht. Alles, was ein Computer verarbeiten kann, ist Strom. Und dabei gibt es nur zwei Möglichkeiten. Entweder der Strom fließt oder er tut es eben nicht. Daraus müssen wir jetzt etwas machen, nämlich ein Zahlensystem.

Ein Zahlensystem kennen wir bereits : das Dezimalsystem. Das ist jenes, welches wir Menschen täglich benutzen. Es enthält als Elemente die Ziffern 1 bis 9 und die 0. Zur Darstellung von Zahlen stehen uns also zehn Symbole zur Verfügung. Und "Dezimal" leitet sich vom lateinischen Wort "decimus" ab, welches "der Zehnte" bedeutet.

Wir müssen jetzt aber ein System konstruieren, in welchem wir mit zwei Symbolen auskommen müssen, um alle erdenklichen Zahlen darzustellen. Denn wir haben ja nur die zwei Zustände "Strom fließt" und "Strom fließt nicht" zur Verfügung.
Da das lateinische Wort für die Zahl 2 "duo" ist, nennen wir unser Werk "Dualsystem". Der Einfachheit halber benutzen wir die Symbole 0 (Null) und 1 (Eins), um Zahlen darzustellen.

Nehmen wir an, der Strom fließt und kennzeichnen diesen Zustand mit "1".
Schalten wir den Strom aus, fließt eben kein Strom. Diesen Zustand nennen wir "0".

Schon haben wir die ersten beiden Zahlen dargestellt, nämlich 0 und 1.

Und jetzt haben wir ein Problem. Wie sollen wir die "Zwei" darstellen? Wir machen es uns einfach. Da wir mit einer Stelle nicht mehr auskommen, nehmen wir einfach eine zweite hinzu und stellen die "Zwei" durch "10" dar.
Nun können wir auch die "Drei" als "11" schreiben.

Für die "Vier" müssen wir allerdings schon wieder eine Stelle hinzufügen. Wir erhalten "100". Und so geht es weiter.

5 = 101
6 = 110
7 = 111.

Zahlen können wir somit hervorragend darstellen.
Selbst eine Zahl wie eine Million : 11110100001001000000.

Wie aber können wir nun beispielsweise ein "A" darstellen? Das ist ja nunmal keine Zahl. Da wir aber Zahlen darstellen können, könnten wir nun jedem Buchstaben einfach eine Zahl zuordnen.

Und genau diesen Weg wählte man auch im Jahr 1968, als ein System entwickelt wurde, welches jedem von insgesamt 127 Zeichen eine bestimmte Kombination aus Nullen und Einsen zugeordnet hat, den American Standard Code for Information Interchange, kurz ASCII.

Dieser neue ASCII-Code, auch Zeichensatz genannt, bildete die Grundlage für die modernen Zeichensätze, die man heute auf den Computern findet. Er verwendete eine Darstellung, bei der jedes der 127 Zeichen durch eine siebenstellige Kombination aus Nullen und Einsen repräsentiert wurde.

Mit dem Vorrat von 127 Zeichen können wir nun alle Zeichen der englischen Sprache sowie einige Steuerzeichen darstellen. Steuerzeichen werden nicht als solche dargestellt, sondern dienen Maschinen zu Steuerung, wie etwa der Zeilenumbruch, der Rückschritt oder der Wagenrücklauf. Die ersten 32 Zeichen des ASCII sind solche Steuerzeichen.

NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
SP ! " # $ % & ' ( ) * + , - . /
0 1 2 3 4 5 6 7 8 9 : ; < = > ?
@ A B C D E F G H I J K L M N O
P Q R S T U V W X Y Z [ \ ] ^ _
` a b c d e f g h i j k l m n o
p q r s t u v w x y z { | } ~ DEL

In dieser Tabelle, die alle Zeichen des ASCII enthält, finden wir unser "A" an der Position Nummer 65. Überführen wir nun die Zahl 65 in unser Dualsystem, erhalten wir die Zahl 1000001. Das war's.

Aber Moment! Wir können jetzt Englisch darstellen. Aber im Englischen gibt es kein "Ä", kein "Ö" und auch kein "Ü". Und die Benutzer in Frankreich und den skandinawischen Ländern benutzen ebenfalls derartige Zeichen. Wir müssen also unseren Code etwas erweitern und fügen noch eine Stelle hinzu, so dass wir nun acht Stellen zur Verfügung haben, um unsere Einsen und Nullen unterbringen zu können.

Jetzt haben wir 256 mögliche Kombinationen aus Einsen und Nullen und können nicht nur unsere deutschen Umlaute, sondern auch französische, spanische und schwedische, die so genannten diakritischen Zeichen darstellen.

Um all diese Zeichen darstellen zu können, benötigen wir somit acht Stellen in unserem Dualsystem. Und genau diese Folge von acht Stellen nennen wir Oktett oder - Byte. Und jede der Nullen oder Einsen, die wir verwenden, nennen wir "Binary Digit" (binäre Ziffer) oder kurz "Bit".

Mit einem Byte können wir also jedes beliebige Zeichen darstellen, welches es in unserer Sprache gibt. Aber was, bitteschön, sind denn dann Kilobyte, Megabyte oder Gigabyte?

Die Naturwissenschaften kennen für bestimmte Größenordnungen auch bestimmte Vorsilben. Und wir alle kennen das Kilogramm oder den Kilometer. "Kilo" entstammt dem Griechischen "chilioi" und bedeutet "tausend". Also sprechen wir von "Eintausend Gramm" oder "Eintausend Metern". Weiter steht "Mega" für "eine Million" und "Giga" für "eine Milliarde".

Ist also ein Kilobyte eintausend Bytes?

Nein, leider ist es nicht so einfach. Denn in unserem Alltag arbeiten wir immer auf der Basis der Zahl 10. Um nun "Eintausend" zu bekommen, müssen wir 10 x 10 x 10 rechnen.
Wir können das abkürzen und schreiben 10 hoch 3, oder 103.

Im Dual- oder auch Binärsystem geschieht alles auf der Basis der Zahl 2. Um nun auf die selbe Weise eine "Eintausend" darzustellen, müssen wir die Zwei solange mit sich selbst multiplizieren, bis wir einen so großen Wert erhalten.

2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 = 1024.

Erst dann, wenn man die Zwei zehn Male mit sich selbst multipliziert hat, bekommen wir einen hinreichend großen Wert. Das führt zu dem etwas mißverständlichen Umstand, dass ein Kilobyte eben nicht 1000 Byte sind, sondern 1024 Byte. Diese Anzahl von Zeichen entspricht in etwa einer halben DIN A4-Seite.

Und während 1000 mal 1000 Gramm eine Million Gramm (ein Megagramm oder - besser - eine Tonne) sind, nennen wir 1024 mal 1024 Bytes ein Megabyte. Daraus folgt der Umstand, dass ein Megabyte 1.048.576 Bytes sind, etwa 512 DIN A4-Seiten.