Arabisches Alphabet | |
---|---|
![]() | |
Skripttyp | |
Zeitraum | 3. oder 4. Jahrhundert n. Chr. Bis heute |
Richtung | Skript von rechts nach links ![]() |
Sprachen | Arabisch |
Verwandte Skripte | |
Übergeordnete Systeme | |
ISO 15924 | |
ISO 15924 | Araber , 160 , Arabisch![]() |
Unicode | |
Unicode-Alias | Arabisch |
Unicode-Bereich |
|
Arabisches Alphabet |
---|
Arabische Schrift |
Das arabische Alphabet ( Arabisch : الأبجدية العربية , al-abjadīyah l-'arabīyah oder الحروف العربية , al-huruf l-'arabīyah , IPA: [ʔalʔabd͡ʒadiːjaʰ lʕarabiːjaʰ] ) oder Arabisch abjad , ist die arabische Schrift , wie es für das Schreiben kodifiziert Arabisch . Es ist kursiv von rechts nach links geschrieben und enthält 28 Buchstaben. Die meisten Buchstaben haben kontextbezogene Buchstabenformen. Die arabische Schrift ist auch ein religiöser TextEs wird hauptsächlich in islamischen Ländern verwendet, nämlich in Arabien, Nordafrika, Persien / Iran, Zentralasien und dem nordwestindischen Subkontinent.
Das arabische Alphabet wird als Abjad betrachtet , was bedeutet, dass nur Konsonanten verwendet werden , aber es wird jetzt als " unreiner Abjad " betrachtet. [1] Wie bei anderen unreinen Abjads wie dem hebräischen Alphabet entwickelten die Schreiber später Mittel, um Vokale durch separate Vokaldiakritika anzuzeigen .
Konsonanten [ bearbeiten ]
Das grundlegende arabische Alphabet enthält 28 Buchstaben . Anpassungen der arabischen Schrift für andere Sprachen fügten einige Buchstaben hinzu und entfernten sie, wie für Persisch , Osmanisch-Türkisch , Mittelkurdisch , Urdu , Sindhi , Malaiisch , Paschtu , Arwi und Arabi Malayalam , die alle zusätzliche Buchstaben haben, wie unten gezeigt. Es gibt keine unterschiedlichen Groß- und Kleinbuchstaben .
Viele Buchstaben sehen ähnlich aus, unterscheiden sich jedoch durch Punkte ( ʾiʿjām ) über oder unter ihrem zentralen Teil ( Rasm ). Diese Punkte sind ein wesentlicher Bestandteil eines Buchstabens, da sie zwischen Buchstaben unterscheiden, die unterschiedliche Laute darstellen. Zum Beispiel haben die arabischen Buchstaben ب (b), ت (t) und ث (th) die gleiche Grundform, aber einen Punkt darunter, zwei Punkte oben und drei Punkte oben. Der Buchstabe ن (n) hat auch die gleiche Form in Anfangs- und Mittelform, mit einem Punkt darüber, obwohl er sich in isolierter und endgültiger Form etwas unterscheidet.
Sowohl gedrucktes als auch geschriebenes Arabisch sind kursiv , wobei die meisten Buchstaben innerhalb eines Wortes direkt mit den benachbarten Buchstaben verbunden sind.
Alphabetische Reihenfolge [ Bearbeiten ]
Es gibt zwei Hauptsortierfolgen für das arabische Alphabet: abjad und hija.
Die ursprüngliche ʾabjadīy- Reihenfolge ( أَبْجَدِيّ ), die für die Beschriftung verwendet wird , leitet sich aus der Reihenfolge des phönizischen Alphabets ab und ähnelt daher der Reihenfolge anderer phönizisch abgeleiteter Alphabete wie des hebräischen Alphabets . In dieser Reihenfolge werden Buchstaben auch als Zahlen und Abjad-Ziffern verwendet und besitzen denselben alphanumerischen Code / dieselbe Chiffre wie die hebräische Gematria und die griechische Isopsephy .
Die Reihenfolge hijā'ī ( هِجَائِي ) oder alifbāʾī ( أَلِفْبَائِي ), in der Listen mit Namen und Wörtern sortiert werden, wie in Telefonbüchern, Klassenlisten und Wörterbüchern, gruppiert Buchstaben nach Ähnlichkeit der Form.
Abjadī [ bearbeiten ]
Die ʾabjadī- Ordnung ist keine einfache historische Fortsetzung der früheren nordsemitischen alphabetischen Ordnung, da sie eine Position hat, die dem aramäischen Buchstaben samekh / semkat ס entspricht , aber historisch gesehen leitet sich kein Buchstabe des arabischen Alphabets von diesem Buchstaben ab. Der Verlust desselben ḵ wurde durch die Aufteilung von shin ש in zwei unabhängige arabische Buchstaben ش ( shīn ) und ﺱ ( sīn ) kompensiert , die an die Stelle desselben tratenḵ . Die sechs anderen Buchstaben, die keinem nordsemitischen Buchstaben entsprechen, werden am Ende platziert.
غ | ظ | ض | ذ | خ | ث | ت | ش | ر | ق | ص | ف | ع | س | ن | م | ل | ك | ي | ط | ح | ز | و | ه | د | ج | ب | أ |
gh | ẓ | ḍ | dh | kh | th | t | Sch | r | q | ṣ | f | ʿ | s | n | m | l | k | y | ṭ | ḥ | z | w | h | d | j | b | ʾ |
1000 | 900 | 800 | 700 | 600 | 500 | 400 | 300 | 200 | 100 | 90 | 80 | 70 | 60 | 50 | 40 | 30 | 20 | 10 | 09 | 08 | 07 | 06 | 05 | 04 | 03 | 02 | 01 |
Dies wird üblicherweise wie folgt ausgesprochen:
- ʾAbjad hawwaz ḥuṭṭī kalaman saʿfaṣ qarashat thakhadh ḍaẓagh .
Eine andere Vokalisierung ist:
- ʾAbujadin hawazin ḥuṭiya kalman saʿfaṣ qurishat thakhudh ḍaẓugh [ Zitieren erforderlich ]
ش | غ | ظ | ذ | خ | ث | ت | س | ر | ق | ض | ف | ع | ص | ن | م | ل | ك | ي | ط | ح | ز | و | ه | د | ج | ب | أ |
Sch | gh | ẓ | dh | kh | th | t | s | r | q | ḍ | f | ʿ | ṣ | n | m | l | k | y | ṭ | ḥ | z | w | h | d | j | b | ʾ |
28 | 27 | 26 | 25 | 24 | 23 | 22 | 21 | 20 | 19 | 18 | 17 | 16 | fünfzehn | 14 | 13 | 12 | 11 | 10 | 09 | 08 | 07 | 06 | 05 | 04 | 03 | 02 | 01 |
Die Farben geben an, welche Buchstaben andere Positionen als die vorherige Tabelle haben |
Dies kann wie folgt ausgesprochen werden:
- ʾAbujadin hawazin ḥuṭiya kalman ṣaʿfaḍ qurisat thakhudh ẓaghush
hijāʾī [ bearbeiten ]
Moderne Wörterbücher und andere Nachschlagewerke verwenden die abjadī- Reihenfolge nicht, um alphabetisch zu sortieren. Stattdessen wird die neuere Hijāʾī- Reihenfolge verwendet, bei der Buchstaben teilweise durch Ähnlichkeit der Form gruppiert werden. Die hijāʾī- Reihenfolge wird niemals als Ziffer verwendet.
ي | و | ه | ن | م | ل | ك | ق | ف | غ | ع | ظ | ط | ض | ص | ش | س | ز | ر | ذ | د | خ | ح | ج | ث | ت | ب | ا |
y | w | h | n | m | l | k | q | f | gh | ʿ | ẓ | ṭ | ḍ | ṣ | Sch | s | z | r | dh | d | kh | ḥ | j | th | t | b | ein |
Eine andere Art von Hijāʾī- Ordnung wurde im Maghreb bis vor kurzem weit verbreitet [ wann? ] als es durch den Mashriqi- Orden ersetzt wurde. [2]
ي | و | ه | ش | س | ق | ف | غ | ع | ض | ص | ن | م | ل | ك | ظ | ط | ز | ر | ذ | د | خ | ح | ج | ث | ت | ب | ا |
y | w | h | Sch | s | q | f | gh | ʿ | ḍ | ṣ | n | m | l | k | ẓ | ṭ | z | r | dh | d | kh | ḥ | j | th | t | b | ein |
Die Farben geben an, welche Buchstaben andere Positionen als die vorherige Tabelle haben |
Briefformen [ bearbeiten ]
Kalligraphie |
---|
|
Das arabische Alphabet ist immer kursiv und die Buchstaben variieren in ihrer Form abhängig von ihrer Position innerhalb eines Wortes. Buchstaben können bis zu vier verschiedene Formen aufweisen, die einer anfänglichen, medialen (mittleren), endgültigen oder isolierten Position ( IWFI ) entsprechen. Während einige Buchstaben erhebliche Unterschiede aufweisen, bleiben andere über alle vier Positionen hinweg nahezu identisch. Im Allgemeinen sind Buchstaben desselben Wortes auf beiden Seiten durch kurze horizontale Linien miteinander verbunden, aber sechs Buchstaben ( و, ز, ر, ذ, د, ا ) können nur mit dem vorhergehenden Buchstaben verknüpft werden. Zum Beispiel hat أرارات ( Ararat ) nur isolierte Formen, da nicht jeder Buchstabe mit dem folgenden verbunden werden kann. Zusätzlich werden einige Buchstabenkombinationen als Ligaturen geschrieben(spezielle Formen), insbesondere lām-alif لا , [3] die einzige obligatorische Ligatur (die nicht ligierte Kombination لا wird als schwer lesbar angesehen).
Tabelle der Grundbuchstaben [ Bearbeiten ]
Verbreitet | Maghrebian | Name des Buchstabens (Klassische Aussprache) | Buchstabenname in arabischer Schrift | Trans literation | Wert im literarischen Arabisch ( IPA ) | Nächstes englisches Äquivalent in der Aussprache | Kontextformen | Isolierte Form | ||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
BAbjadī | Hijāʾī | BAbjadī | Hijāʾī | Finale | Medial | Initiale | ||||||
1. | 1. | 1. | 1. | ʾAlif | أَلِف | ā / ʾ (auch â ) | verschiedene, einschließlich / aː / , ∅ [a] | c a r , c a t | ـا | ا | ||
2. | 2. | 2. | 2. | bāʾ | بَاء | b | / b / [b] | b arn | ـب | ـبـ | بـ | ب |
22. | 3. | 22. | 3. | tāʾ | تَاء | t | / t / | T aiwan aber ins Arabische übersetzt | ـت | ـتـ | تـ | ت |
23. | 4. | 23. | 4. | thāʾ | ثَاء | th (auch ṯ ) | / θ / | th Tinte | ـث | ـثـ | ثـ | ث |
3. | 5. | 3. | 5. | jīm | جِيم | j (auch ǧ ) | / d͡ʒ / [b] [c] | g em | ـج | ـجـ | جـ | ج |
8. | 6. | 8. | 6. | Ha | حَاء | ḥ (auch ḩ ) | / ħ / | kein Äquivalent (pharyngealen h , kann als gewisperten approximiert werden h OMe ) | ـح | ـحـ | حـ | ح |
24. | 7. | 24. | 7. | khāʾ | خَاء | kh (auch ḫ , ḵ , ẖ ) | / x / | Scottish lo ch | ـخ | ـخـ | خـ | خ |
4. | 8. | 4. | 8. | dāl | دَال | d | / d / | d Ohr | ـد | د | ||
25. | 9. | 25. | 9. | dhāl | ذَال | dh (auch ḏ ) | / ð / | th at | ـذ | ذ | ||
20. | 10. | 20. | 10. | rāʾ | رَاء | r | / r / | Schottisch Englisch cu r d , Spanisch rollte r wie in pe rr o | ـر | ر | ||
7. | 11. | 7. | 11. | Zay / zayn | زَاي | z | / z / | z ebra | ـز | ز | ||
fünfzehn. | 12. | 21. | 24. | Sünde | سِين | s | / s / | s in | ـس | ـسـ | سـ | س |
21. | 13. | 28. | 25. | Schienbein | شِين | Sch (auch š ) | / ʃ / | sh in | ـش | ـشـ | شـ | ش |
18. | 14. | fünfzehn. | 18. | traurig | صَاد | ṣ (auch ş ) | / sˤ / | kein Äquivalent (kann mit s auce angenähert werden , aber mit verengtem Hals) | ـص | ـصـ | صـ | ص |
26. | fünfzehn. | 18. | 19. | Papa | ضَاد | ḍ (auch ḑ ) | / dˤ / | kein Äquivalent (kann mit d awn angenähert werden , aber mit verengtem Hals) | ـض | ـضـ | ضـ | ض |
9. | 16. | 9. | 12. | ṭāʾ | طَاء | ṭ (auch ţ ) | / tˤ / | kein Äquivalent (kann mit T aiwan auf Arabisch angenähert werden, aber ausgesprochen Tw aiwan) | ـط | ـطـ | طـ | ط |
27. | 17. | 26. | 13. | ẓāʾ | ظَاء | ẓ (auch z̧ ) | / ðˤ / | kein Äquivalent (kann mit x ylophon angenähert werden , aber mit verengtem Hals) | ـظ | ـظـ | ظـ | ظ |
16. | 18. | 16. | 20. | ʿAyn | عَيْن | ʿ | / ʕ / | kein Äquivalent (ähnlich ḥā' oben, aber stimmhaft) | ـع | ـعـ | عـ | ع |
28. | 19. | 27. | 21. | Ghayn | غَيْن | gh (auch ġ , ḡ ) | / ɣ / [b] | kein Äquivalent | ـغ | ـغـ | غـ | غ |
17. | 20. | 17. | 22. | Fa | فَاء | f | / f / [b] | f ar | ـف | ـفـ | فـ | ف [d] |
19. | 21. | 19. | 23. | qāf | قَاف | q | / q / [b] | kein Äquivalent (Ähnlich wie c aught , aber weiter hinten im Mund ausgesprochen.) | ـق | ـقـ | قـ | ق [d] |
11. | 22. | 11. | 14. | kāf | كَاف | k | / k / [b] | c ap | ـك | ـكـ | كـ | ك |
12. | 23. | 12. | fünfzehn. | lm | لاَم | l | / l / | l amp | ـل | ـلـ | لـ | ل |
13. | 24. | 13. | 16. | mīm | مِيم | m | / m / | m e | ـم | ـمـ | مـ | م |
14. | 25. | 14. | 17. | Nonne | نُون | n | / n / | n un | ـن | ـنـ | نـ | ن |
5. | 26. | 5. | 26. | Ha | هَاء | h | / h / | h bei | ـه | ـهـ | هـ | ه |
6. | 27. | 6. | 27. | wāw | وَاو | w / ū / ∅ | / w / , / uː / , ∅ [b] | w et , p oo l | ـو | و | ||
10. | 28. | 10. | 28. | yāʾ | يَاء | y / ī | / j / , / iː / [b] | Y oshi , m ee t | ـي | ـيـ | يـ | ي [d] |
[e] | hamzah | هَمْزة | ʾ | / ʔ / | uh - oh (auch bekannt als " Glottal Stop ") | ء (Wird hauptsächlich in der Mittel- und Endposition verwendet, bei der es sich um einen nicht verknüpften Buchstaben handelt.) | ||||||
ʾAlif hamzah | أَلِف هَمْزة | ـأ | أ | |||||||||
ـإ | إ | |||||||||||
wāw hamzah | وَاو هَمْزة | ـؤ | ؤ | |||||||||
yāʾ hamzah | يَاء هَمْزة | ـئ | ـئـ | ئـ | ئ | |||||||
ʾAlif maddah | أَلِف مَدَّة | ein | / ʔ a ː / | ـآ | آ | |||||||
[f] | tāʾ marbūṭah | تاء مربوطة | ـة | ( nur Ende ) [ Zitieren erforderlich ] | ة | |||||||
[G] | ʾAlif maqṣūrah | الف مقصورة | ـى | (nur Ende) [ Zitieren erforderlich ] | ى |
Anmerkungen
- ^ Alif kann viele Phoneme darstellen. Siehe den Abschnitt über ʾalif .
- ^ a b c d e f g h Siehe Abschnitt über nicht native Buchstaben und Laute ; Die Buchstaben ⟨ ß ⟩, ⟨ Þ ⟩, ⟨ Û ⟩, ⟨ Ì ⟩ werden manchmal verwendet , um das Phonem zu transkribieren / g / in loanwords, ⟨ È ⟩ zu transkribieren / P / und ⟨ ف ⟩ zu transkribieren / V / . Ebenso sind die Buchstaben ⟨ æ ⟩ und ⟨ í ⟩ verwendet werden , um die Vokale zu transkribieren / o / und/ eː / jeweils in Lehnwörtern und Dialekten.
- ^ ج wird je nach Region unterschiedlich ausgesprochen. Siehe Arabische Phonologie # Konsonanten .
- ^ a b c Siehe Abschnitt über regionale Unterschiede in Briefform.
- ^ (wird im Alphabet nicht als Buchstabe gezählt, spielt aber eine wichtige Rolle in der arabischen Rechtschreibung) [bezeichnet die meisten unregelmäßigen weiblichen Substantive] [ Zitieren erforderlich ]
- ^ (Nicht als Buchstaben im Alphabet gezähltsondern spielt eine wichtige Rolle inarabischen Grammatik und Lexikon, einschließlich Angabe [bezeichnetmeist weiblichen Substantive] und Rechtschreibung) eine alternative Form von ت ( „bound tā'“ / تاء مربوطة ) an dem verwendeten Wortende zur Kennzeichnung des weiblichen Geschlechts für Substantive und Adjektive. Es bezeichnet den endgültigen Ton / -h / oder / -t /. Standard tāʼ, um es von tāʼ marbūṭah zu unterscheiden, wird als tāʼ maftūḥah (تاء مفتوحة, "open tāʼ") bezeichnet.
- ^ (wird im Alphabet nicht als Buchstabe gezählt, spielt jedoch eine wichtige Rolle in der arabischen Grammatik und im Lexikon, einschließlich der Angabe [bezeichnet Verben] und der Rechtschreibung). Es wird am Ende von Wörtern mit dem Klang von / aː / im modernen Standardarabisch verwendet, die nicht in der Verwendung von tāʼ marbūṭah (ة) kategorisiert sind [hauptsächlich einige Zeitformen und arabische männliche Namen].
- Weitere Informationen zu verschiedenen Transliterationsschemata finden Sie im Artikel Romanisierung des Arabischen . Arabischsprachige folgen jedoch normalerweise nicht einem standardisierten Schema, wenn sie Namen transkribieren. Auch Namen werden regelmäßig als lokal ausgesprochen transkribiert, nicht als im literarischen Arabisch ausgesprochen (wenn sie arabischen Ursprungs waren).
- In Bezug auf die Aussprache sind die angegebenen phonemischen Werte diejenigen des modernen Standardarabisch, das an Schulen und Universitäten unterrichtet wird. In der Praxis kann die Aussprache von Region zu Region erheblich variieren. Weitere Einzelheiten zur Aussprache des Arabischen finden Sie in den Artikeln Arabische Phonologie und Varietäten des Arabischen .
- Die Namen der arabischen Buchstaben können als Abstraktionen einer älteren Version betrachtet werden, bei der es sich um bedeutungsvolle Wörter in der protosemitischen Sprache handelte. Namen arabischer Buchstaben können im Volksmund ganz andere Namen haben.
- Sechs Buchstaben ( و ز ر ذ د ا ) haben keine eindeutige mediale Form und müssen mit ihrer endgültigen Form geschrieben werden, ohne mit dem nächsten Buchstaben verbunden zu sein. Ihre ursprüngliche Form entspricht der isolierten Form. Der folgende Buchstabe wird in seiner ursprünglichen Form oder in isolierter Form geschrieben, wenn es sich um den letzten Buchstaben des Wortes handelt.
- Der Buchstabe alif stammt aus dem phönizischen Alphabet als Konsonantenzeichen, das einen Stimmritzenstopp anzeigt. Heute hat es seine Funktion als Konsonant verloren und ist zusammen mit ya ' und wāw ein mater lectionis , ein Konsonantenzeichen, das für einen langen Vokal steht (siehe unten) oder als Unterstützung für bestimmte Diakritika ( maddah und hamzah ).
- Arabisch verwendet derzeit ein diakritisches Zeichen, ء , genannt hamzah , die zur Bezeichnung Knacklaut [ʔ] , geschrieben allein oder mit einem Träger:
- allein: ء
- mit einem Träger: إ أ (über oder unter einer alif ), ؤ (oberhalb einem WAW ), ئ (oberhalb einem dotless YA oder YA hamzah ).
- In der akademischen Arbeit wird die Hamza ( ء ) mit dem Modifikatorbuchstaben rechter halber Ring (ʾ) transliteriert , während der Modifikatorbuchstabe linker Halbring (ʿ) den Buchstaben 'ayn ( ع ) transkribiert , der einen anderen Ton darstellt, der nicht in gefunden wird Englisch.
- Die Hamza hat eine einzige Form, da sie niemals mit einem vorhergehenden oder folgenden Buchstaben verbunden ist. Es wird jedoch manchmal mit einem wāw , yā ' oder alif kombiniert , und in diesem Fall verhält sich der Träger wie ein gewöhnliches wāw , yā' oder alif .
Variationen [ bearbeiten ]
Í æ å ä ã á ß Þ ف Û Ú Ù Ø ض Õ Ô Ó Ò Ñ Ð Ï - Î Í Ì Ë Ê È Ç ò | hijā'ī Sequenz | |
• • | Noto Nastaliq Urdu | |
• • | Scheherazade Neu | |
• • | Lateef | |
• • | Noto Naskh Arabisch | |
• • | Markazi Text | |
• • | Noto Sans Arabic | |
• • | El Messiri | |
• • | Limonade | |
• • | Changa | |
• • | Mada | |
• • | Noto Kufi Arabisch | |
• • | Reem Kufi | |
• • | Lalezar | |
• • | Jomhuria | |
• • | Rakkas | |
Û Ù ض Ð Î Ë Ê Ô Ñ Þ Õ ف Ú Ó ä ã á ß í Ø Í Ò æ å Ï - Ì È Ã | abjadī Sequenz | |
• • | Noto Nastaliq Urdu | |
• • | Scheherazade Neu | |
• • | Lateef | |
• • | Noto Naskh Arabisch | |
• • | Markazi Text | |
• • | Noto Sans Arabic | |
• • | El Messiri | |
• • | Limonade | |
• • | Changa | |
• • | Mada | |
• • | Noto Kufi Arabisch | |
• • | Reem Kufi | |
• • | Lalezar | |
• • | Jomhuria | |
• • | Rakkas |
Alif [ Bearbeiten ]
Kontext | Bilden | Wert | Nächstes englisches Äquivalent |
---|---|---|---|
Ohne diakritische Zeichen | ا |
|
|
Mit Hamzah vorbei ( hamzah alif ) | أ |
|
|
Mit Hamza unter ( hamzah alif ) | إ |
|
|
Mit Madda | آ |
|
|
Mit waslah | ٱ |
|
|
Geänderte Buchstaben [ Bearbeiten ]
Das Folgende sind keine einzelnen Buchstaben, sondern verschiedene kontextbezogene Varianten einiger arabischer Buchstaben.
Bedingte Formen | Name | Übersetzen. | Phonemischer Wert (IPA) | |||
---|---|---|---|---|---|---|
Isoliert | Finale | Medial | Initiale | |||
آ | ـآ | آ | ʾAlif maddah ( أَلِفْ مَدَّة ) | ein | / ʔaː / (auch bekannt als " Alif verlängern / betonen ") | |
ة | ـة | tāʾ marbūṭah ( تَاءْ مَرْبُوطَة ) | h oder t / ẗ | (auch bekannt als " korreliertes tā ' ") wird nur in der Endposition verwendet und um das weibliche Substantiv / Wort zu bezeichnen oder um das Substantiv / Wort weiblich zu machen ; In seltenen Fällen von unregelmäßigen Substantiven / Wörtern scheint es jedoch das "Männliche" zu bezeichnen. Singular Nomen: / a / , Plural Nomen: āt (ein vorhergehender Buchstabe gefolgt von einem fatḥah alif + tāʾ = ـَات ) | ||
ى | ـى | ʾAlif maqṣūrah ( أَلِفْ مَقْصُورَة ) | ā / á / ỳ | Zwei Anwendungen: 1. Der Buchstabe أَلِفْ مَقْصُورَة alif maqṣūrah oder ْأَلِف لَيِّنَة alif layyinah , ausgesprochen / aː / im modernen Standardarabisch. In einigen Sonderfällen wird es nur am Ende von Wörtern verwendet, um den neutralen / nicht weiblichen Aspekt des Wortes (hauptsächlich Verben) zu bezeichnen, bei dem tā 'marbūṭah nicht verwendet werden kann. |
Ligaturen [ Bearbeiten ]
1. alif
2. hamzat waṣl ( ْهَمْزَة وَصْل )
3. lām
4. lām
5. shadda ( شَدَّة )
6. Dolch alif ( أَلِفْ خَنْجَریَّة )
7. hāʾ
Die Verwendung der Ligatur auf Arabisch ist üblich. Es gibt eine obligatorische Ligatur, die für lām ل + alif ا, die in zwei Formen existiert. Alle anderen Ligaturen, von denen es viele gibt [4], sind optional.
Kontextformen | Name | Trans. | Wert | |||
---|---|---|---|---|---|---|
Finale | Medial | Initiale | Isoliert | |||
ﻼ | ﻻ | lām + alif | laa | / laː / | ||
ﲓ | ﳰ | ﳝ [5] | ﱘ | yāʾ + mīm | Ich bin | /Ich bin/ |
ﲅ | ﳭ | ﳌ | ﱂ | lam + mīm | lm | / lm / |
Eine komplexere Ligatur, die bis zu sieben verschiedene Komponenten kombiniert, wird üblicherweise verwendet, um das Wort Allah darzustellen .
Die einzige Ligatur im primären Bereich der arabischen Schrift in Unicode (U + 06xx) ist lām + alif . Dies ist die einzige, die für Schriftarten und Textverarbeitung obligatorisch ist. Andere Bereiche dienen der Kompatibilität mit älteren Standards und enthalten andere Ligaturen, die optional sind.
- lām + alif
- لا
Hinweis: Unicode hat in seinem FExx-Bereich für Präsentationsformulare B auch einen Code für diese Ligatur. Wenn Ihr Browser und Ihre Schriftart korrekt für Arabisch konfiguriert sind, sollte die oben angezeigte Ligatur mit dieser identisch sein. U+FEFB
ARABISCHES LIGATURLAM MIT ALEFISOLIERTER FORM:
- ﻻ
U+0640
ARABISCHES TATWEEL + lām + alif- ـلا
Hinweis: Unicode hat in seinem Präsentationsformular B U + FExx auch einen Code für diese Ligatur. Wenn Ihr Browser und Ihre Schriftart für Arabisch korrekt konfiguriert sind, sollte die oben angezeigte Ligatur mit dieser identisch sein:
U+FEFC
ARABISCHES LIGATURLAM MIT ALEF-ENDFORMULAR- ﻼ
Eine weitere Ligatur im Unicode Presentation Form A Bereich U + FB50 bis U + FDxx ist der spezielle Code für Glyph für die Ligatur Allāh ( "Gott"), U+FDF2
ARABISCHER LIGATURE ALLAH isolierter Form:
- ﷲ
Dies ist eine Problemumgehung für die Mängel der meisten Textverarbeitungsprogramme, die nicht in der Lage sind, die richtigen Vokalzeichen für das Wort Allah im Koran anzuzeigen . Da die arabische Schrift verwendet wird, um andere Texte als nur den Koran zu schreiben, wird das Rendern von lām + lām + hā ' als vorherige Ligatur als fehlerhaft angesehen: [6] Wenn eine von mehreren Schriftarten (Noto Naskh Arabic, mry_KacstQurn, KacstOne, DejaVu Sans) , Harmattan, Scheherazade, Lateef, Iranian Sans) ist auf einem Computer installiert (Iranian Sans wird von Wikimedia-Webfonts unterstützt), das Wort wird ohne diakritische Zeichen angezeigt.
- lām + lām + hā ' = LILLĀH (bedeutet "für Allah [nur für Gott]")
- لله oder لله
- alif + lām + lām + hā ' = ALLĀH (das arabische Wort für "Gott")
- الله oder الله
- alif + lām + lām +
U+0651
ARABISCHER SHADDA +U+0670
ARABISCHER BRIEF SUPERSCRIPT ALEF + hā '- اللّٰه ( DejaVu Sans und KacstOne zeigen das hochgestellte Alef nicht an)
Ein Versuch, sie auf den fehlerhaften Schriftarten anzuzeigen, ohne automatisch das Gemination-Zeichen und das hochgestellte Alif hinzuzufügen, obwohl dies möglicherweise nicht in allen Browsern wie gewünscht angezeigt wird, besteht darin, U+200d
nach dem ersten oder zweiten lām den (Joiner mit der Breite Null) hinzuzufügen
- ( alif +) lām + lām +
U+200d
ZERO WIDTH JOINER + hā '- Çááå لله
Gemination [ Bearbeiten ]
Gemination ist die Verdoppelung eines Konsonanten. Anstatt den Brief zweimal zu schreiben, platziert Arabisch ein W- förmiges Zeichen namens Shaddah darüber. Beachten Sie, dass der Buchstabe einfach zweimal geschrieben wird, wenn ein Vokal zwischen den beiden Konsonanten auftritt. Das diakritische Zeichen erscheint nur, wenn der Konsonant am Ende einer Silbe mit dem Anfangskonsonanten der folgenden Silbe identisch ist. (Der Oberbegriff für solche diakritischen Zeichen ist ḥarakāt ).
Allgemeiner Unicode | Name | Name in arabischer Schrift | Transliteration | |
---|---|---|---|---|
0651 | ــّـ | Shaddah | شدة | (Konsonant verdoppelt) |
Nunation [ Bearbeiten ]
Nunation ( Arabisch : تنوين tanwīn ) ist die Zugabe eines endgültigen -n auf ein Substantiv oder Adjektiv . Der Vokal davor zeigt den grammatikalischen Fall an . In schriftlicher arabischer Sprache wird die Nonnation durch Verdoppelung des diakritischen Vokals am Ende des Wortes angezeigt .
Vokale [ bearbeiten ]
Benutzer von Arabisch schreiben normalerweise lange Vokale, lassen jedoch kurze weg, sodass die Leser ihre Sprachkenntnisse nutzen müssen, um die fehlenden Vokale zu liefern. Im Bildungssystem und insbesondere im Unterricht in arabischer Grammatik werden diese Vokale jedoch verwendet, da sie für die Grammatik von entscheidender Bedeutung sind. Ein arabischer Satz kann durch eine subtile Änderung der Vokale eine völlig andere Bedeutung haben. Aus diesem Grund werden in einem wichtigen Text wie dem Qur'ān die drei grundlegenden Vokalzeichen (siehe unten) vorgeschrieben, wie das ḥarakāt und alle anderen diakritischen Zeichen oder andere Arten von Zeichen, beispielsweise die Cantillationszeichen .
Kurze Vokale [ bearbeiten ]
In der arabischen Handschrift des täglichen Gebrauchs, in allgemeinen Veröffentlichungen und auf Straßenschildern werden kurze Vokale normalerweise nicht geschrieben. Andererseits können Kopien des Korans nicht von den religiösen Instituten gebilligt werden, die sie überprüfen, es sei denn, die Diakritika sind enthalten. Kinderbücher, Grundschultexte und arabischsprachige Grammatiken im Allgemeinen enthalten bis zu einem gewissen Grad Diakritika. Diese werden als " vokalisierte " Texte bezeichnet.
Kurze Vokale können mit diakritischen Zeichen geschrieben werden, die über oder unter dem Konsonanten stehen, der ihnen in der Silbe vorangestellt ist , die ḥarakāt genannt wird . Alle arabischen Vokale, lang und kurz, folgen einem Konsonanten; Auf Arabisch beginnen Wörter wie "Ali" oder "alif" beispielsweise mit einem Konsonanten: 'Aliyy , alif .
Kurze Vokale (vollständig vokalisierter Text) | Code | Name | Name in arabischer Schrift | Trans. | Wert | Bemerkungen |
---|---|---|---|---|---|---|
ــَـ | 064E | Fett · ḥah | فتحة | ein | /ein/ | Die Fathah (halb kurz "a") klingt im Vergleich zu dem Buchstaben alif ( ا ), der ein ganzes Ganzes ist, eher wie das englische "E" (wie in "h e n", "m a n"). A "(= wie der englische Buchstabe" A "wie in" a rk "," u p ") zB wird حَرَكَة ḥarakah eher wie "ḥerekeh" ausgesprochen ; شَمْس shams wird eher wie " shems " ausgesprochen |
ــُـ | 064F | ḍammah | ضمة | u | / u / | Englisch "OO" (als "b oo t", aber kürzer) |
ــِـ | 0650 | Kasrah | كسرة | ich | /ich/ | Englisch "I" (wie in "p i ck") |
Lange Vokale [ bearbeiten ]
In der voll vokalisiert arabischen Text gefunden in Texten wie Koran , eine lange ā nach einem Konsonanten anders als ein hamzah mit einem kurzen geschrieben wird ein Zeichen ( fatḥah ) auf dem Konsonanten zuzüglich eine 'alif danach; long ī wird als Zeichen für short i ( kasrah ) plus a yāʾ geschrieben ; und langes ū als Zeichen für kurzes u ( ḍammah ) plus ein wāw . Kurz gesagt, ᵃa = ā ; ⁱy = ī ; undᵘw = ū . Lange ā eine folgende hamzah durch eine dargestellt werden 'alif Maddah oder durch eine freie hamzah gefolgt von einem 'alif (zwei aufeinander folgenden 'alif s in Arabisch sind nie erlaubt).
Die folgende Tabelle zeigt Vokale, die über oder unter einem gepunkteten Kreis platziert sind und einen primären Konsonantenbuchstaben oder ein Shaddah- Zeichen ersetzen . Zur Verdeutlichung in der Tabelle werden die primären Buchstaben auf der linken Seite, die zum Markieren dieser langen Vokale verwendet werden, nur in ihrer isolierten Form angezeigt. Bitte beachten Sie, dass die meisten Konsonanten sich mit ʾalif , wāw und yāʾ, die dann mit ihrer medialen oder endgültigen Form geschrieben wurden , nach links verbinden . Zusätzlich kann der Buchstabe yāʾ in der letzten Zeile mit dem Buchstaben auf der linken Seite verbunden werden und verwendet dann eine mediale oder ursprüngliche Form. Verwenden Sie die Tabelle der Primärbuchstaben, um die tatsächlichen Glyphen und Verbindungstypen anzuzeigen.
Unicode | Brief mit diakritisch | Name | Trans. | Varianten | Wert |
---|---|---|---|---|---|
064E 0627 | ا | fatḥah ʾalif | ein | aa | /ein/ |
064E 0649 | ى | fatḥah ʾalif maqṣūrah | ein | aa | |
0650 0649 | ى | kasrah ʾalif maqṣūrah | y | iy | /ich/ |
064F 0648 | و | ḍammah wāw | ū | uw / ou | / uː / |
0650 064A | ي | kasrah yāʾ | ich | iy | /ich/ |
In nicht gesprochenem Text (einer, in dem die kurzen Vokale nicht markiert sind) werden die langen Vokale durch den fraglichen Vokal dargestellt: ʾalif ṭawīlah / maqṣūrah , wāw oder yāʾ . Lange Vokale, die in der Mitte eines Wortes unausgesprochenen Textes geschrieben sind, werden wie Konsonanten mit einem Sukūn (siehe unten) in einem Text behandelt, der vollständige diakritische Zeichen enthält. Auch hier zeigt die Tabelle der Klarheit halber lange Vokalbuchstaben nur in isolierter Form.
Combinations وا and يا are always pronounced wā and yāʾ respectively. The exception is the suffix ـوا۟ in verb endings where ʾalif is silent, resulting in ū or aw.
Long vowels (unvocalized text) | Name | Trans. | Value |
---|---|---|---|
0627 ا | (implied fatḥah) ʾalif | ā | /aː/ |
0649 ى | (implied fatḥah) ʾalif maqṣūrah | ā / y | |
0648 و | (implied ḍammah) wāw | ū | /uː/ |
064A ي | (implied kasrah) yāʾ | ī | /iː/ |
In addition, when transliterating names and loanwords, Arabic language speakers write out most or all the vowels as long (ā with ا ʾalif, ē and ī with ي yaʾ, and ō and ū with و wāw), meaning it approaches a true alphabet.
Diphthongs[edit]
The diphthongs /aj/ and /aw/ are represented in vocalized text as follows:
Diphthongs (fully vocalized text) | Name | Trans. | Value |
---|---|---|---|
064A 064E ـَـي | fatḥah yāʾ | ay | /aj/ |
0648 064E ـَـو | fatḥah wāw | aw | /aw/ |
Vowel omission[edit]
An Arabic syllable can be open (ending with a vowel) or closed (ending with a consonant):
- open: CV [consonant-vowel] (long or short vowel)
- closed: CVC (short vowel only)
A normal text is composed only of a series of consonants plus vowel-lengthening letters; thus, the word qalb, "heart", is written qlb, and the word qalaba "he turned around", is also written qlb.
To write qalaba without this ambiguity, we could indicate that the l is followed by a short a by writing a fatḥah above it.
To write qalb, we would instead indicate that the l is followed by no vowel by marking it with a diacritic called sukūn ( ْ), like this: قلْب.
This is one step down from full vocalization, where the vowel after the q would also be indicated by a fatḥah: قَلْب.
The Qurʾān is traditionally written in full vocalization.
The long i sound in some editions of the Qur’ān is written with a kasrah followed by a diacritic-less y, and long u by a ḍammah followed by a bare w. In others, these y and w carry a sukūn. Outside of the Qur’ān, the latter convention is extremely rare, to the point that y with sukūn will be unambiguously read as the diphthong /aj/, and w with sukūn will be read /aw/.
For example, the letters m-y-l can be read like English meel or mail, or (theoretically) also like mayyal or mayil. But if a sukūn is added on the y then the m cannot have a sukūn (because two letters in a row cannot be sukūnated), cannot have a ḍammah (because there is never an uy sound in Arabic unless there is another vowel after the y), and cannot have a kasrah (because kasrah before sukūnated y is never found outside the Qur’ān), so it must have a fatḥah and the only possible pronunciation is /majl/ (meaning mile, or even e-mail). By the same token, m-y-t with a sukūn over the y can be mayt but not mayyit or meet, and m-w-t with a sukūn on the w can only be mawt, not moot (iw is impossible when the w closes the syllable).
Vowel marks are always written as if the i‘rāb vowels were in fact pronounced, even when they must be skipped in actual pronunciation. So, when writing the name Aḥmad, it is optional to place a sukūn on the ḥ, but a sukūn is forbidden on the d, because it would carry a ḍammah if any other word followed, as in Aḥmadu zawjī "Ahmad is my husband".
Another example: the sentence that in correct literary Arabic must be pronounced Aḥmadu zawjun shirrīr "Ahmad is a wicked husband", is usually mispronounced (due to influence from vernacular Arabic varieties) as Aḥmad zawj shirrīr. Yet, for the purposes of Arabic grammar and orthography, is treated as if it were not mispronounced and as if yet another word followed it, i.e., if adding any vowel marks, they must be added as if the pronunciation were Aḥmadu zawjun sharrīrun with a tanwīn 'un' at the end. So, it is correct to add an un tanwīn sign on the final r, but actually pronouncing it would be a hypercorrection. Also, it is never correct to write a sukūn on that r, even though in actual pronunciation it is (and in correct Arabic MUST be) sukūned.
Of course, if the correct i‘rāb is a sukūn, it may be optionally written.
General Unicode | Name | Name in Arabic script | Translit. | Phonemic Value (IPA) | |
---|---|---|---|---|---|
0652 | ــْـ | sukūn | سُكُون | (no vowel with this consonant letter or diphthong with this long vowel letter) | ∅ |
0670 | ــٰـ | alif khanjariyyah [dagger ’alif - smaller ’alif written above consonant] | أَلِف خَنْجَرِيَّة | ā | /aː/ |
ٰٰ The sukūn is also used for transliterating words into the Arabic script. The Persian word ماسک (mâsk, from the English word "mask"), for example, might be written with a sukūn above the ﺱ to signify that there is no vowel sound between that letter and the ک.
Additional letters[edit]
Regional variations[edit]
Some letters take a traditionally different form in specific regions:
Letter | Explanation | |||
---|---|---|---|---|
Isolated | Final | Medial | Initial | |
ڛ | ـڛ | ـڛـ | ڛـ | A traditional form to denotate the sīn س letter, rarely used in areas influenced by Persian script and former Ottoman script.[7] |
ڢ | ـڢ | ـڢـ | ڢـ | A traditional Maghrebi variant (except for Libya and Algeria) of fā’ ف. |
ڧ/ٯ | ـڧ/ـٯ | ـڧـ | ڧـ | A traditional Maghrebi variant (except for Libya and Algeria) of qāf ق. Generally dotless in isolated and final positions and dotted in the initial and medial forms. |
ک | ـک | ـکـ | کـ | An alternative version of kāf ك used especially in Maghrebi under the influence of the Ottoman script or in Gulf script under the influence of the Persian script. |
ی | ـی | ـیـ | یـ | The traditional style to write or print the letter, and remains so in the Nile Valley region (Egypt, Sudan, South Sudan... etc.) and sometimes Maghreb; yā’ ي is dotless in the isolated and final position. Visually identical to alif maqṣūrah ى; resembling the Perso-Arabic letter یـ ـیـ ـی ی which was also used in Ottoman Turkish. |
Non-native letters to Standard Arabic[edit]
Some modified letters are used to represent non-native sounds of Modern Standard Arabic. These letters are used in transliterated names, loanwords and dialectal words.
Letter | Value | Note |
---|---|---|
Foreign letters | ||
پ | /p/ | It is a Persian letter. Sometimes used in Arabic as well when transliterating foreign names and loanwords. Can be substituted with bā’ ب and pronounced as such. |
ڤ | /v/ | Used in loanwords and dialectal words instead of fā’ ف.[8] Not to be confused with ڨ. |
ڥ | Used in Tunisia, Algeria and Morocco. | |
چ | /t͡ʃ/1 | It is a Persian letter. Sometimes used in Arabic as well when transliterating foreign names and loanwords and in the Gulf and Arabic dialects. The sequence تش tāʼ-shīn is usually preferred (e.g. تشاد for "Chad"). |
/ʒ/2 | Used in Egypt and can be a reduction of /d͡ʒ/, where ج is pronounced /ɡ/. | |
/ɡ/3 | Used in Israel, for example on road signs. | |
گ | It is a Persian letter. Sometimes used in Arabic as well. | |
ڨ | Used in Tunisia and in Algeria for loanwords and for the dialectal pronunciation of qāf ق in some words. Not to be confused with ڤ. | |
ڭ | Used in Morocco. |
- /t͡ʃ/ is considered a native phoneme/allophone in some dialects, e.g. Kuwaiti and Iraqi dialects.
- /ʒ/ is considered a native phoneme in Levantine and North African dialects and as an allophone in others.
- /ɡ/ is considered a native phoneme/allophone in most modern Arabic dialects.
Used in languages other than Arabic[edit]
Numerals[edit]
Western (Maghreb, Europe) | Central (Mideast) | Eastern | |
---|---|---|---|
Persian | Urdu | ||
0 | ٠ | ۰ | ۰ |
1 | ١ | ۱ | ۱ |
2 | ٢ | ۲ | ۲ |
3 | ٣ | ۳ | ۳ |
4 | ٤ | ۴ | ۴ |
5 | ٥ | ۵ | ۵ |
6 | ٦ | ۶ | ۶ |
7 | ٧ | ۷ | ۷ |
8 | ٨ | ۸ | ۸ |
9 | ٩ | ۹ | ۹ |
10 | ١٠ | ۱۰ | ۱۰ |
There are two main kinds of numerals used along with Arabic text; Western Arabic numerals and Eastern Arabic numerals. In most of present-day North Africa, the usual Western Arabic numerals are used. Like Western Arabic numerals, in Eastern Arabic numerals, the units are always right-most, and the highest value left-most.
Letters as numerals[edit]
In addition, the Arabic alphabet can be used to represent numbers (Abjad numerals). This usage is based on the ʾabjadī order of the alphabet. أ ʾalif is 1, ب bāʾ is 2, ج jīm is 3, and so on until ي yāʾ = 10, ك kāf = 20, ل lām = 30, ..., ر rāʾ = 200, ..., غ ghayn = 1000. This is sometimes used to produce chronograms.
History[edit]
The Arabic alphabet can be traced back to the Nabataean alphabet used to write Nabataean. The first known text in the Arabic alphabet is a late 4th-century inscription from Jabal Ramm (50 km east of ‘Aqabah) in Jordan, but the first dated one is a trilingual inscription at Zebed in Syria from 512.[citation needed] However, the epigraphic record is extremely sparse, with only five certainly pre-Islamic Arabic inscriptions surviving, though some others may be pre-Islamic. Later, dots were added above and below the letters to differentiate them. (The Aramaic language had fewer phonemes than the Arabic, and some originally distinct Aramaic letters had become indistinguishable in shape, so that in the early writings 15 distinct letter-shapes had to do duty for 28 sounds; cf. the similarly ambiguous Pahlavi alphabet.) The first surviving document that definitely uses these dots is also the first surviving Arabic papyrus (PERF 558), dated April 643, although they did not become obligatory until much later. Important texts were and still are frequently memorized, especially in Qurʾan memorization.
Later still, vowel marks and the hamzah were introduced, beginning some time in the latter half of the 7th century, preceding the first invention of Syriac and Hebrew vocalization. Initially, this was done by a system of red dots, said to have been commissioned in the Umayyad era by Abu al-Aswad al-Du'ali a dot above = a, a dot below = i, a dot on the line = u, and doubled dots indicated nunation. However, this was cumbersome and easily confusable with the letter-distinguishing dots, so about 100 years later, the modern system was adopted. The system was finalized around 786 by al-Farāhīdī.
Arabic printing presses[edit]
Although Napoleon Bonaparte generally receives credit for introducing the printing press to Egypt during his invasion of that country in 1798, and though he did indeed bring printing presses and Arabic script presses to print the French occupation's official newspaper Al-Tanbiyyah ("The Courier"), printing in the Arabic language started several centuries earlier.
In 1514, following Gutenberg's invention of the printing press in 1450, Gregorio de Gregorii, a Venetian, published an entire prayer-book in Arabic script; it was entitled Kitab Salat al-Sawa'i and was intended for eastern Christian communities.[12]
Between 1580 and 1586, type designer Robert Granjon designed Arabic typefaces for Cardinal Ferdinando de' Medici, and the Medici press published many Christian prayer and scholarly Arabic texts in the late 16th century.[13]
Maronite monks at the Maar Quzhayy Monastery in Mount Lebanon published the first Arabic books to use movable type in the Middle East. The monks transliterated the Arabic language using Syriac script.
A goldsmith (like Gutenberg) designed and implemented an Arabic-script movable-type printing-press in the Middle East. The Greek Orthodox monk Abd Allah Zakhir set up an Arabic printing press using movable type at the monastery of Saint John at the town of Dhour El Shuwayr in Mount Lebanon, the first homemade press in Lebanon using Arabic script. He personally cut the type molds and did the founding of the typeface. The first book came off his press in 1734; this press continued in use until 1899.[14]
Computers[edit]
The Arabic alphabet can be encoded using several character sets, including ISO-8859-6, Windows-1256 and Unicode (see links in Infobox above), latter thanks to the "Arabic segment", entries U+0600 to U+06FF. However, none of the sets indicates the form that each character should take in context. It is left to the rendering engine to select the proper glyph to display for each character.
Each letter has a position-independent encoding in Unicode, and the rendering software can infer the correct glyph form (initial, medial, final or isolated) from its joining context. That is the current recommendation. However, for compatibility with previous standards, the initial, medial, final and isolated forms can also be encoded separately.
Unicode[edit]
As of Unicode 13.0, the Arabic script is contained in the following blocks:[15]
- Arabic (0600–06FF, 255 characters)
- Arabic Supplement (0750–077F, 48 characters)
- Arabic Extended-A (08A0–08FF, 84 characters)
- Arabic Presentation Forms-A (FB50–FDFF, 611 characters)
- Arabic Presentation Forms-B (FE70–FEFF, 141 characters)
- Rumi Numeral Symbols (10E60–10E7F, 31 characters)
- Indic Siyaq Numbers (1EC70–1ECBF, 68 characters)
- Ottoman Siyaq Numbers (1ED00–1ED4F, 61 characters)
- Arabic Mathematical Alphabetic Symbols (1EE00—1EEFF, 143 characters)
The basic Arabic range encodes the standard letters and diacritics but does not encode contextual forms (U+0621-U+0652 being directly based on ISO 8859-6). It also includes the most common diacritics and Arabic-Indic digits. U+06D6 to U+06ED encode Qur'anic annotation signs such as "end of ayah" ۖ and "start of rub el hizb" ۞. The Arabic supplement range encodes letter variants mostly used for writing African (non-Arabic) languages. The Arabic Extended-A range encodes additional Qur'anic annotations and letter variants used for various non-Arabic languages.
The Arabic Presentation Forms-A range encodes contextual forms and ligatures of letter variants needed for Persian, Urdu, Sindhi and Central Asian languages. The Arabic Presentation Forms-B range encodes spacing forms of Arabic diacritics, and more contextual letter forms. The Arabic Mathematical Alphabetical Symbols block encodes characters used in Arabic mathematical expressions.
See also the notes of the section on modified letters.
Keyboards[edit]
Keyboards designed for different nations have different layouts so proficiency in one style of keyboard, such as Iraq's, does not transfer to proficiency in another, such as Saudi Arabia's. Differences can include the location of non-alphabetic characters.
All Arabic keyboards allow typing Roman characters, e.g., for the URL in a web browser. Thus, each Arabic keyboard has both Arabic and Roman characters marked on the keys. Usually the Roman characters of an Arabic keyboard conform to the QWERTY layout, but in North Africa, where French is the most common language typed using the Roman characters, the Arabic keyboards are AZERTY.
To encode a particular written form of a character, there are extra code points provided in Unicode which can be used to express the exact written form desired. The range Arabic presentation forms A (U+FB50 to U+FDFF) contain ligatures while the range Arabic presentation forms B (U+FE70 to U+FEFF) contains the positional variants. These effects are better achieved in Unicode by using the zero-width joiner and non-joiner, as these presentation forms are deprecated in Unicode, and should generally only be used within the internals of text-rendering software, when using Unicode as an intermediate form for conversion between character encodings, or for backwards compatibility with implementations that rely on the hard-coding of glyph forms.
Finally, the Unicode encoding of Arabic is in logical order, that is, the characters are entered, and stored in computer memory, in the order that they are written and pronounced without worrying about the direction in which they will be displayed on paper or on the screen. Again, it is left to the rendering engine to present the characters in the correct direction, using Unicode's bi-directional text features. In this regard, if the Arabic words on this page are written left to right, it is an indication that the Unicode rendering engine used to display them is out of date.[16][17]
There are competing online tools, e.g. Yamli editor, which allow entry of Arabic letters without having Arabic support installed on a PC, and without knowledge of the layout of the Arabic keyboard.[18]
Handwriting recognition[edit]
The first software program of its kind in the world that identifies Arabic handwriting in real time was developed by researchers at Ben-Gurion University (BGU).
The prototype enables the user to write Arabic words by hand on an electronic screen, which then analyzes the text and translates it into printed Arabic letters in a thousandth of a second. The error rate is less than three percent, according to Dr. Jihad El-Sana, from BGU's department of computer sciences, who developed the system along with master's degree student Fadi Biadsy.[19]
See also[edit]
![]() | Wikimedia Commons has media related to Arabic alphabet. |
- Abjad numerals
- Ancient South Arabian script
- Algerian braille
- Arabic braille
- Arabic calligraphy
- Arabic Chat Alphabet
- Arabic diacritics
- Arabic letter frequency
- Arabic Mathematical Alphabetic Symbols
- Arabic numerals
- Arabic phonology
- Arabic script – about other languages written in Arabic script
- Arabic Unicode
- ArabTeX – provides Arabic support for TeX and LaTeX
- Kufic
- Modern Arabic mathematical notation
- Perso-Arabic script
- Rasm
- Romanization of Arabic
References[edit]
- ^ Zitouni, Imed (2014). Natural Language Processing of Semitic Languages. Springer Science & Business. p. 15. ISBN 978-3642453588.
- ^ a b (in Arabic) Alyaseer.net ترتيب المداخل والبطاقات في القوائم والفهارس الموضوعية Ordering entries and cards in subject indexes Archived 23 December 2007 at the Wayback Machine Discussion thread (Accessed 2009-October–06)
- ^ Rogers, Henry (2005). Writing Systems: A Linguistic Approach. Blackwell Publishing. p. 135.
- ^ A list of Arabic ligature forms in Unicode.
- ^ Depending on fonts used for rendering, the form shown on-screen may or may not be the ligature form.
- ^ SIL International: This simplified style is often preferred for clarity, especially in non-Arabic languages
- ^ Notice sur les divers genres d'écriture ancienne et moderne des arabes, des persans et des turcs / par A.-P. Pihan. 1856.
- ^ "Arabic Dialect Tutorial" (PDF). Archived from the original (PDF) on 17 December 2008. Retrieved 2 December 2008.
- ^ File:Basmala kufi.svg - Wikimedia Commons
- ^ File:Kufi.jpg - Wikimedia Commons
- ^ File:Qur'an folio 11th century kufic.jpg - Wikimedia Commons
- ^ "294° anniversario della Biblioteca Federiciana: ricerche e curiosità sul Kitab Salat al-Sawai". Retrieved 31 January 2017.
- ^ Naghashian, Naghi (21 January 2013). Design and Structure of Arabic Script. epubli. ISBN 9783844245059.
- ^ Arabic and the Art of Printing – A Special Section Archived 29 December 2006 at the Wayback Machine, by Paul Lunde
- ^ "UAX #24: Script data file". Unicode Character Database. The Unicode Consortium.
- ^ For more information about encoding Arabic, consult the Unicode manual available at The Unicode website
- ^ See also Multilingual Computing with Arabic and Arabic Transliteration: Arabicizing Windows Applications to Read and Write Arabic & Solutions for the Transliteration Quagmire Faced by Arabic-Script Languages and A PowerPoint Tutorial (with screen shots and an English voice-over) on how to add Arabic to the Windows Operating System. Archived 11 September 2011 at the Wayback Machine
- ^ Yamli in the News
- ^ Israel 21c
External links[edit]
- Shaalan, Khaled; Raza, Hafsa (August 2009). "NERA: Named entity recognition for Arabic". Journal of the American Society for Information Science and Technology. 60 (8): 1652–1663. doi:10.1002/asi.21090.
- Arabic at Curlie
This article contains major sections of text from the very detailed article Arabic alphabet from the French Wikipedia, which has been partially translated into English. Further translation of that page, and its incorporation into the text here, are welcomed.