Geschäftsführer, Webdesigner & Web-Entwickler, staatlich geprüfter Mediengestalter
Die Sprache einer Website wird vielfach durch HTML-Tags übermittelt. Diese werden als HTML Sprachcodes bezeichnet und bestehen aus zwei Kleinbuchstaben. Festgelegt werden die HTML Sprachcodes (englisch Language Codes) durch die ISO Standards 639-1. Sie definieren die Sprache, auf der eine Website basiert und in der sie ausgegeben wird. Für die deutsche Sprache ist dies das Kürzel “de“.
Vornehmlich dienen die HTML Sprachcodes Suchmaschinen wie Google. Sie helfen dabei, die Inhalte einer Website einzuordnen und beispielsweise Besonderheiten in Bezug auf Sonderzeichen oder auch Anführungszeichen zu berücksichtigen. Auch für die korrekte Trennung von Silben spielt der HTML Sprachcode eine bedeutsame Rolle. Im Folgenden ist zu lesen, welche Sprachcodes es in HTML gibt und worauf dabei zu achten ist.
Inhaltsverzeichnis
Sprachcodes bestehen in HTML grundsätzlich aus zwei Kleinbuchstaben, die exakt darstellen können, welche Sprache verwendet wird. Damit können Google und andere Suchmaschinen beispielsweise feststellen, ob es sich um eine Website in Deutschland (Sprachcode de) oder der Schweiz (Sprachcode ch) handelt. Damit etwaige gleiche Inhalte nicht als Duplicate Content behandelt werden, definieren die HTML Sprachcodes die Herkunft und geben klar an, dass es sich um unterschiedliche Sprachversionen einer Website handelt.
In einigen Fällen kann ein zweiteiliges Buchstabenkürzel als Kennzeichnung einer Sprache allerdings nicht ausreichen. Das trifft vor allem dann zu, wenn es sich um sprachliche Varianten wie Schweizerdeutsch oder auch Englisch in den USA oder in Großbritannien handelt. Hierfür gibt es neben dem Sprachcode an sich noch einen zusätzlichen Subcode, der auf die Besonderheiten hinweist. Gängige Beispiele für derartige mehrteilige HTML Sprachcodes sind unter anderem:
Als Sprachcodes werden in HTML vornehmlich Ländercodes verwendet. Einzelne Beispiele dafür sind:
Eine weitere Ausnahme gibt es für den Blindtext Lorem Ipsum. Dieser ist keiner realen Sprache eindeutig zuzuordnen, sodass es für diesen tatsächlich einen eigenen Sprachcode gibt. Konkreter noch: Es handelt sich um den Sprachcode für keine Sprache. Dieser lautet zxx.
Um einen HTML Sprachcode in einer Website einzubinden, gibt es zwei unterschiedliche Varianten. W3C macht den Vorschlag, die primäre Sprache einer Website mit dem Attribut „lang“ im <html>-Tag zu definieren. Das sieht dann beispielsweise wie folgt aus:
<html lang=“de“>
….
</html>
Mit dieser Kennzeichnung wird die deutsche Sprache als Primärsprache angegeben.
Ebenso kann der HTML Sprachcode auch mit XHTML eingebunden werden. Das sieht dann beispielsweise so aus:
<html xmlns=“//www.w3docs.com/2014/xhtml“ lang=“de“ xml:lang=“de“>
…
</html>
Auch dieses Beispiel bezieht sich auf die deutsche Sprache als Primärsprache einer Website.
Wenn eine Website nicht in der bevorzugten Sprache zur Verfügung steht oder man die Ursprungssprache nicht beherrscht, ist es inzwischen möglich, eine Website automatisch übersetzen zu lassen. Möglich ist dies über translate.google.com und man gibt hier den Link zur Website ein und erhält im Anschluss eine übersetzte Version.
Oder auch direkt über den Google Chrome Browser. Dieser kann Websites in Spanisch, Englisch oder auch Französisch direkt übersetzen. Dazu reicht im oberen rechten Bereich zumeist ein Klick. Falls diese Funktion nicht standardmäßig angeboten wird, kann sie in den Browser-Einstellungen unter Sprachen aktiviert werden. Dies kann für einzelne Sprachen separat erfolgen.
Übersetzungen dieser Art sind in aller Regel nicht perfekt und es kann Fehler in der Grammatik und Rechtschreibung geben, allerdings ist ein grundsätzliches Verständnis damit in den allermeisten Fällen gegeben.
Ratsam ist es, die Sprachattribute im html-Tag einer Website stets zu hinterlegen und dabei das Sprachkürzel zu wählen, in dessen Sprache die Website verfasst wurde. Gibt es auf einer Website zudem noch Inhalte in anderen Sprachen, können entsprechende Absätze zusätzlich mit den jeweiligen HTML Sprachcodes versehen werden. Für Google und andere Suchmaschinen wird die Einordnung auf diese Weise deutlich einfacher.
Grundsätzlich sollten dafür stets die Sprachkürzel aus dem IANA-Register für Sprachkürzel verwendet werden. Innerhalb dieses Registers ist es auch möglich, die passenden HTML Sprachcodes zu recherchieren, sofern diese nicht bekannt sind.
HTML Sprachcodes sind durchaus praktisch und erweisen sich bei korrekter Anwendung als sehr hilfreich. Insbesondere für Suchmaschinen wird damit die Einordnung erleichtert, aber auch für User:innen können HTML Sprachcodes sinnvoll sein. Das gilt vor allem dann, wenn der Browser bereits eine Herkunft übermittelt und somit eine Zuordnung zur Sprache erfolgen kann.
Die Integration der HTML Sprachcodes ist für Betreiber:innen von Websites zudem sehr einfach mit einem HTML-Tag möglich und kann somit individuell auch für unterschiedliche Sprachvarianten umgesetzt werden.
Dadurch, dass es für jede Sprache einen eindeutigen Sprachcode gibt, sind Verwechslungen relativ einfach zu vermeiden. Für Sprachen wie Schweizerdeutsch gibt es neben dem Primärsprachcode zudem noch einen Subcode, der die Einordnung zusätzlich erleichtert. Ebenso gibt es für Inhalte mit keiner Sprache (wie zum Beispiel Blindtext) einen eigenen Sprachcode, der auch diese Inhalte klar definiert.
Somit sollten HTML Sprachcodes im besten Fall stets genutzt und korrekt angewandt werden.
Sprache | ISO Code |
---|---|
Abkhazian | ab |
Afar | aa |
Afrikaans | af |
Albanian | sq |
Amharic | am |
Arabic | ar |
Aragonese | an |
Armenian | hy |
Assamese | as |
Aymara | ay |
Azerbaijani | az |
Bashkir | ba |
Basque | eu |
Bengali (Bangla) | bn |
Bhutani | dz |
Bihari | bh |
Bislama | bi |
Breton | br |
Bulgarian | bg |
Burmese | my |
Belarussian (Byelorussian) | be |
Cambodian | km |
Catalan | ca |
Cherokee | – |
Chewa | – |
Chinese | zh |
Chinese (Simplified) | zh-Hans |
Chinese (Traditional) | zh-Hant |
Corsican | co |
Croatian | hr |
Czech | cs |
Danish | da |
Divehi | – |
Dutch | nl |
Edo | – |
English | en |
Esperanto | eo |
Estonian | et |
Faeroese | fo |
Farsi | fa |
Fiji | fj |
Finnish | fi |
Flemish | – |
French | fr |
Frisian | fy |
Fulfulde | – |
Galician | gl |
Gaelic (Scottish) | gd |
Gaelic (Manx) | gv |
Georgian | ka |
German | de |
Greek | el |
Greenlandic | kl |
Guarani | gn |
Gujarati | gu |
Haitian Creole | ht |
Hausa | ha |
Hawaiian | – |
Hebrew | he, iw |
Hindi | hi |
Hungarian | hu |
Ibibio | – |
Icelandic | is |
Ido | io |
Igbo | – |
Indonesian | id, in |
Interlingua | ia |
Interlingue | ie |
Inuktitut | iu |
Inupiak | ik |
Irish | ga |
Italian | it |
Japanese | ja |
Javanese | jv |
Kannada | kn |
Kanuri | – |
Kashmiri | ks |
Kazakh | kk |
Kinyarwanda (Rwanda) | rw |
Kirghiz | ky |
Kirundi (Rundi) | rn |
Konkani | – |
Korean | ko |
Kurdish | ku |
Laothian | lo |
Latin | la |
Latvian (Lettish) | lv |
Limburgish (Limburger) | li |
Lingala | ln |
Lithuanian | lt |
Macedonian | mk |
Malagasy | mg |
Malay | ms |
Malayalam | ml |
Maltese | mt |
Maori | mi |
Marathi | mr |
Mongolian | mn |
Nauru | na |
Nepali | ne |
Norwegian | no |
Occitan | oc |
Oriya | or |
Oromo (Afaan Oromo) | om |
Papiamentu | – |
Pashto (Pushto) | ps |
Polish | pl |
Portuguese | pt |
Punjabi | pa |
Quechua | qu |
Rhaeto-Romance | rm |
Romanian | ro |
Russian | ru |
Sami (Lappish) | – |
Samoan | sm |
Sangro | sg |
Sanskrit | sa |
Serbian | sr |
Serbo-Croatian | sh |
Sesotho | st |
Setswana | tn |
Shona | sn |
Sichuan Yi | ii |
Sindhi | sd |
Sinhalese | si |
Siswati | ss |
Slovak | sk |
Slovenian | sl |
Somali | so |
Spanish | es |
Sundanese | su |
Swahili (Kiswahili) | sw |
Swedish | sv |
Syriac | – |
Tagalog | tl |
Tajik | tg |
Tamazight | – |
Tamil | ta |
Tatar | tt |
Telugu | te |
Thai | th |
Tibetan | bo |
Tigrinya | ti |
Tonga | to |
Tsonga | ts |
Turkish | tr |
Turkmen | tk |
Twi | tw |
Uighur | ug |
Ukrainian | uk |
Urdu | ur |
Uzbek | uz |
Venda | – |
Vietnamese | vi |
Volapük | vo |
Wallon | wa |
Welsh | cy |
Wolof | wo |
Xhosa | xh |
Yi | – |
Yiddish | yi , ji |
Yoruba | yo |
Zulu | zu |
Spannende Artikel und Infos zum Thema
Sie benötigen eine WordPress Agentur? Wir stehen als Ihre Experten zur Verfügung. Treten Sie mit uns in Kontakt und vereinbaren Sie ein unverbindliches Beratungsgespräch.
Das Content-Management-System WordPress basiert auf PHP, einer der gängigsten Programmiersprachen im Web. Ohne PHP funktioniert WordPress nicht. Umso wichtiger ist es somit, dass nicht...
mehr lesen
Das WordPress Command Line Interface (kurz WP-CLI) bietet für alle, die mit dem Content Management System (CMS) WordPress arbeiten, einige Funktionen und kann dazu...
mehr lesen
Pagebuilder Plugin für WordPress funktionieren nach einem einfachen und zudem komfortablen Prinzip. Kinderleicht kann man damit eine Webseite aufbauen – oft sogar per Drag...
mehr lesen
Das Unix / Linux Dienstprogramm Cron ist auch für WordPress von Relevanz. Mithilfe von Cron können beispielsweise Befehle geplant werden oder auch Scripte gesteuert....
mehr lesen
Was ist ein Cronjob? Innerhalb eines Betriebssystems können Aufgaben automatisiert ablaufen, diese werden vielfach als Cronjob bezeichnet. Das System gibt…
Was ist ein CamelCase? Kommen in einem Begriff Binnenmajuskeln vor, wird ein solches Wort als CamelCase bezeichnet. Es handelt sich…
Was bedeutet IDE? Hinter der Bezeichnung IDE versteckt sich die Abkürzung für Integrated Development Environment, zu deutsch Integrierte Entwicklungsumgebung. Dabei…