Unicode Zeichenkodierungssysteme:
UTF-8: kodiert mit einer variablen Menge von einem bis vier Byte. Bytegruppen müssen innerhalb der Bytes markiert werden und mit einem Algorithmus ausgelesen.
Fragen zu Zeichensätzen:
Was versteht man unter einem Character Set (Zeichenvorrat)?
Die Gesamtheit der Zeichen, die für eine bestimmte Anwendung oder Sprache zur Verfügung stehen (Buchstaben, Ziffern, Sonderzeichen (Interpunktionszeichen, diakritische Zeichen, typografische Satzzeichen).
Was ist ein Code Space (Coderaum, Codemenge)?
Ein Code Space bezieht sich auf den gesamten Bereich der möglichen Code Points eines Zeichensatzes. Es ist der Bereich der numerischen Werte, die verwendet werden, um jedem Zeichen im Zeichensatz einen eindeutigen Code Point zuzuordnen.
Was ist eine Code Page (Zeichensatztabelle)?
Code Pages sind tabellarische Zuweisungen von Code Points zu Binärcodes, welche wiederum zur Speicherung, zum Transfer oder Ähnlichem von elektronischen Geräten verarbeitet werden können.
Jeder Zeichensatz hat (ausgenommen Kodierungssysteme mit Methoden) seine eigene Code Page.
Die Code Page dient als Mapping zwischen den Code Points und den entsprechenden Zeichen des Zeichenvorrates.
Sie unterscheiden sich von Methoden wie UTF-8, da Code Pages tabellarische Zuweisungen von Code Points zu Binärcodes sind und keine Algorithmen beinhalten.
Was ist ein Encoded Character?
Ein Encoded Character ist die binäre Darstellung eines bestimmten Code Points aus einem Zeichensatz, der einem bestimmten Zeichen eindeutig zugeordnet ist. Sie sind beispielsweise in der Code Page enthalten.
Was ist ein Code Point?
Einer der eindeutig zugewiesenen Werte (für einen Buchstaben) aus der Spalte im Code Spaces.
Das Wort Glyphe (gr.) bedeutet „das Eingegrabene, Eingeritzte“.
Glyphe = grafische Darstellung eines Silbenzeichens oder Schriftzeichens in Form eines Buchstabens, Satzzeichens, Sonderzeichens, einer Arabischen Ziffer oder einer Ligatur.
Das „Bild“ eines Zeichens wird also durch eine Glyphe oder mehrere Glyphen dargestellt.
In einem Schriftschnitt kann ein Buchstabe einer Vielzahl von Glyph-Varianten entsprechen. Gleichzeitig finden sich in Ligaturen (wie dem »fi« in Typografie) mehrere Buchstaben in einer Glyphe zusammen.
Darüber hinaus können Fragmente von Buchstaben, beispielsweise „Diakritika“ (an Buchstaben angebrachte kleine Zeichen wie Punkte, Striche, Häkchen, Bögen oder Kreise, die eine vom unmarkierten Buchstaben abweichende Aussprache oder Betonung anzeigen und die dem Buchstaben über- oder untergesetzt, aber auch vor- oder nachgestellt sind) eigene Glyphen belegen.
Eine Glyphe im Kontext der digitalen Typografie ist die kleinste grafische Einheit, aus der letztendlich das Schriftbild erzeugt wird. D.h., um Texte grafisch zu setzen, werden Zeichensätze benötigt.
Ein Zeichensatz enthält zum einen Glyphen, also die grafische Beschreibung der zu verwendenden Zeichen.
Darüber hinaus muss klar sein, durch welche Glyphen ein Buchstabe oder ein Text dargestellt werden soll.
In der digitalen Typografie ist zudem eine Metrik erforderlich, das heißt ein Regelwerk, wie die einzelnen Glyphen eines Textes positioniert werden sollen. Diese Informationen können auf unterschiedlichste Arten abgespeichert werden:
Für vektorbasierte Zeichensätze haben sich hierfür beispielsweise TrueType und OpenType als Formate durchgesetzt.
Für pixelbasierte Zeichensätze gibt es ebenfalls diverse Formate. Die meisten dieser Formate sind jedoch eher im Hinblick auf eine effiziente Ausgabe und nicht auf gestalterische Freiheit optimiert. Beispielsweise werden die einzelnen Glyphen oft entweder nur als (einfarbige) Bitmap-Muster oder als Graustufenbilder definiert.