Karakter kódolások

A karakterkódolás azt definiálja, hogy melyik karakternek (betű, számjegy, írásjel,...), milyen szám felel meg. A szöveges állományban, illetve a memóriában ezek a számok vannak eltárolva. Egy szöveg helyes megjelenítéséhez tudnunk kell, milyen kódolást használ.

A hazai informatikai gyakorlatban a következő kódolások a legjellemzőbbek:
  • ASCII
  • ISO 8859-1 (ISO Latin-1)
  • ISO 8859-2 (ISO Latin-2)
  • cp-1250 (winlatin)
  • UTF-8
  • IBM-852

Kódtáblák

ASCII

American Standard Code for Information Interchange) A latin ábécén alapul és az angol nyelvben és sok nyugat-európai nyelvben használatos betűket tartalmazza. A kódrendszer 128 karakterhelyet tartalmaz, az első 32 karakter (0–31), valamint a 127 kódú karakter vezérlőkódokat tartalmaz, a többi kód megjeleníthető karaktereknek felel meg.


ISO 8859-1 (ISO Latin-1)

A "kalapos" magyar ékezetek.


ISO 8859-2 (ISO Latin-2)

"Rendes" ékezetek.

cp-1250 (winhu)



Unicode, UTF-8

IBM-852

A TURBO Pascal szerkesztő környezete használta.