Umlaute in LaTeX

LaTeX Extra > LaTeX Pakete > Inputenc Die Seite als PDF Inputenc Paket

1 Umlaute ohne Pakete

Da es sich bei L^AT_EX um ein Programm handelt, das ursprünglich in den USA entwickelt worden ist, sind deutsche Umlaute (ebenso wenig wie die Sonderzeichen andere Sprachen) nicht vorgesehen. Der Grund hierfür liegt daran, dass Latex primär nicht für das im Deutschen verwendete erweiterte lateinische Alphabet entwickelt wurde, sondern für die eingeschränkte Fassung, die im englischsprachigen Sprachraum verwendet wird. Daher bildet eine ASCII Zeichen Tabelle den Ausgangspunkt der erlaubten beziehungsweise möglichen Zeichen, die innerhalb von L^AT_EX verwendet werden können.
Dies hat zur Folge, dass wenn deutsche Umlaute innerhalb von L^AT_EX, ohne die entsprechenden Pakete einzubinden, verwendet werden, es entweder zu einer Fehlermeldung kommt oder die Datei fehlerfrei kompliert wird, aber die Umlaute nicht nicht vorhanden sind.

Eingabe:

\documentclass{minimal}
\begin{document}

Umlaute ohne Paket: ä,ü,ö,Ä,Ü,Ö 

\end{document}

Ausgabe:
Umlaute ohne Paket: , , , , ,

Die indirekte Verwendung der deutschen Umlaute ä, ü, ö, Ä, Ü, und Ö ist ohne zusätzlichen Pakete möglich, wobei für die Eingabe \"A, \"O, \"U, \"a, \"o, \"u und \ss{} für das scharf s genutzt werden.
Falls diese Variante nicht funktioniert gibt es noch diese: {\"A}, {\"O}, {\"U}, {\"a}, {\"o}, {\"u} und {\ss}.
Ein Vorteil der indirekten Eingabe ist, dass es möglich ist, eine Latexdatei auf verschiedenen Betriebssystemen und mit verschiedenen Editoren zu bearbeiten. Die Umlaute beziehungsweise ihre Verwendung tragen dazu bei, dass der Dateiaustausch zwischen den einzelnen Nutzer zum Teil erschwert wird.

1.1 Zwischenschritt

Einen Zwischenschritt stellt die Verwendung von ngerman dar, dabei werden die Umlaute und das scharf s immer noch indirekt eingefügt. Da das ngerman Paket immer seltener verwendet wird und daher nicht mehr bei allen Installationen vorhanden ist, kann das babel mit der Option ngerman als Alternative verwendet werden.

Eingabe:

\documentclass[ngerman]{minimal}
\usepackage{babel}
\begin{document}
Umlaute mit ngerman aus babel: "A, "O, "U, "a, "o, "u und "s
\end{document}

Ausgabe:
Umlaute mit ngerman aus babel: Ä, Ö, Ü, ä, ö, ü und ß
Die direkte Verwendung wird durch das Einbinden entsprechender Pakete möglich.

2 Direkte Verwendung der Umlaute

Wird das Paket inputenc eingebunden und die vom Editor verwendete Zeichencodierung als Option gesetzt können Umlaute direkt verwendet werden. Diese Variante setzt voraus, dass die Kodierung des Editors beziehungsweise des IDEs bekannt ist.

\usepackage[Option(en)]{inputenc}

Beim einbinden von inputenc können mehrere Optionen geladen werden. Dies ist nur dann sinnvoll, wenn in einem Dokument mehrere Kodierungen vorhanden sind. Die zuletzt gesetzte Option legt dabei den Standard fest. Durch den Befehl \inputencoding{Kodierung} kann auf eine andere Kodierung gewechselt werden. Insgesamt bietet Inputenc 23 verschiedene Kodierung an.

Tabelle 1: mögliche Optionen von inputenc

ascii	ASCII Kodierung für den Bereich 32-127 (Da es sich bei den ersten 32 Zeichen um nicht druckbare Steuerzeichen handelt. Wobei das 33ste Zeichen das Leerzeichen ist, sodass es insgesamt 95 druckbare Zeichen gibt.)
latin1	ISO Latin-1 bzw. ISO 8859-1 umfasst die folgenden Sprachen Afrikaans, Albanisch, Baskisch, Dänisch, Deutsch, Englisch, Estnisch, Färöisch,Finnisch, Französisch, Irisches Gälisch, Isländisch, Italienisch, Katalanisch, Niederländisch, Norwegisch, Portugiesisch inkl. Brasilien, Rätoromanisch, Schottisches Gälisch, Schwedisch, Spanisch, Swahili und Wallonisch. Es umfasst die am häufigsten in Westeuropa (und zum Teil darüber hinaus) verwendeten Sprachen.
latin2	ISO Latin-2 bzw. ISO 8859-2 umfasst die folgenden Sprachen Albanisch, Bosnisch, Deutsch, Kroatisch, Polnisch, Rumänisch, Serbisch (in lateinischen Zeichen), Serbokroatisch (in lateinischen Zeichen), Slowakisch, Slowenisch, Ober- und Niedersorbisch, Tschechisch und Ungarisch. Es deckt unter anderen die süd- und westslawischen Sprachen ab.
latin3	ISO Latin-3 bzw. ISO 8859-3 umfasst die folgenden Sprachen teilweise Türkisch, Maltesisch und Esperanto.
latin4	ISO Latin-4 bzw. ISO 8859-4 umfasst die folgenden Sprachen Estnisch, Lettisch, Litauisch, Grönländisch und Samisch und deckt damit die nordeuropäischen Sprachen ab.
latin5	ISO Latin-5 bzw. ISO 8859-5 versucht, alle Zeichen der kyrillischen Alphabete abzudecken, wird aber kaum verwendetet.
latin9	ISO Latin-9 bzw. ISO 8859-15 umfasst neben dem Eurozeichen auch die Sonderzeichen des Französisch, Estnisch und Finnischen.
latin10	ISO Latin-10 bzw. ISO 8859-16 umfasst ie Sonderzeichen von Albanisch, Deutsch, Finnisch, Französisch, Italienisch, irisches Gälisch Kroatisch, Polnisch, Rumänisch, Slowenisch und Ungarisch.
decmulti	Das DEC Multinational Character Set ist eine 8 Bit Erweiterung von ASCII.
cp850	Codepage 850 ist die DOS Kodierung für Westeuropa.
cp852	Codepage 852 ist die DOS Kodierung für Mitteleuropa.
cp858	Codepage 858 wie cp850 nur mit Eurozeichen.
cp437	Codepage 437 ist die DOS Kodierung für Englisch (USA).
cp437de	Codepage 437 (deutsche Version).
cp865	Codepage 865 ist die DOS Kodierung für Nordeuropa.
applemac	Kodierung für Mac OS.
macce	Kodierung für Mac OS Mitteleuropa
next	Next encoding.
cp1250	Windows 1250, Kodierung mittel- und osteuropäische Sprachen, für Windows Betriebssysteme, wie Albanisch, Deutsch, Polnisch, Rumänisch, Tschechisch, Serbokroatisch (lateinische Zeichen), Slowakisch, Slowenisch und Ungarisch.
cp1252	Windows 1252 Windows Kodierung für Westeuropäische Sprachen.
cp1257	Windows 1257 Windows Kodierung für baltische Sprachen.
ansinew	Synomum für cp1252
utf8	UTF-8 Unicode Kodierung (defacto Standard)

2.1 Setzen der Option

Die folgenden Optionen decken zumindest in Westeuropa, die gebräuchlichsten Kodierung ab.

Windows
\usepackage[ansinew]{inputenc} beziehungsweise \usepackage[utf8]{inputenc}

Linux
\usepackage[latin1]{inputenc} beziehungsweise \usepackage[utf8]{inputenc}

Mac
\usepackage[applemac]{inputenc}

2.2 Probleme mit Umlauten

Für den Fall, dass die Kodierung unbekannt ist, kann das Paket Selinput verwendet werden. Dieses kann die Kodierung selbst erkennen und die entsprechenden Anpassungen vornehmen. Hinweis: Falls das Beispiel kopiert wird sollten sowohl das ä, das ß und das Symbol mit der selbst verwendeten Tastatur getippt werden, andernfalls kann es zu einem Fehler kommen.

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\usepackage{eurosym}
\usepackage{selinput}
\SelectInputMappings{
   adieresis={ä},
   germandbls={ß},
   Euro={~}
   }
\begin{document}
ä, ö, ü, Ä, Ö, Ü, ß
\end{document}

Kopierter Quellcode Bei kopiertem Quellcode kann es, sehr vereinfacht formuliert, durchaus vorkommen, dass der kopierte Text seine eigene Kodierung mitbringt. Im diesem Fall bietet es sich an den Text abzutippen, wenn es der Umfang zulässt. Wenn der Text beziehungsweise die Datei aber zu lang sind kann auch die Kodierung geändert werden. Das inputenc Paket stellt dazu den Befehl \inputencoding{Kodierung} bereit. Angenommen in ein Dokument mit latin1 Kodierung soll eine Datei mit utf8 Kodierung eingefügt werden, dann funktioniert das wie folgt.

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\inputencoding{latin1}
...
\begin{document}
Text in latin1
\inputencoding{utf8} % Kodierung auf utf8 geaendert 
\input{Datei}
\inputencoding{latin1} % Kodierung wieder zurueck auf latin1
Wieder in latin1
\end{document}

Umlaute und Mathematik Wenn Umlauten innerhalb von mathematischen Umgebungen und Gleichungsumgebungen verwendet werden sollte dies entweder über den Befehl \textrm{Umlautwort} oder über Befehl \text{Umlaut} erfolgen, letzterer setzt die Verwendung des Paketes amsmath voraus.

2.3 Hinweis

Wenn Umlaute verwendet werden bietet es sich immer an auch das fontenc Paket miteinzubinden. Die hier gezeigt Option T1 (Westeuropa) passt für die deutsche Sprache.

\usepackage[utf8 oder ansinew oder...]{inputenc}
\usepackage[T1]{fontenc}

3 Quellen

Quelle:https://www.ctan.org/pkg/inputenc

3.1 Für die Kodierungen

Wir verwenden Cookies. Wenn Sie weiter auf unseren Seiten surfen, stimmen Sie der Nutzung von Cookies zu. mehr Informationen hier