Talk:Arabic alphabet/from the French Wikipedia

From Wikipedia, the free encyclopedia

This is an old revision of this page, as edited by Wfeidt (talk | contribs) at 14:34, 10 August 2003 (More table headings). The present address (URL) is a permanent link to this revision, which may differ significantly from the current revision.

Jump to navigation Jump to search

This is a copy of the French Wikipedia's "arabic alphabet" article, for translation into English, on which I have made a start.

See http://translate.google.com/translate?u=http%3A%2F%2Ffr.wikipedia.org%2Fwiki%2FAlphabet_arabe&langpair=fr%7Cen&hl=en&ie=UTF-8&oe=UTF-8&prev=%2Flanguage_tools for a machine translation of the French article.


de:Arabisches Alphabet fr:Alphabet arabeeo:Araba alfabeto nl:Arabisch alfabet pl:Alfabet arabski zh:阿拉伯语字母表

The Arabic alphabet is the principal script used for writing the Arabic language.

As the alphabet of the language of the Quran, the holy book of Islam, its influence spread with that of Islam and it has been, and still is, used to write other languages without any linquistic roots in Arabic, such as Persian, and Turkish before 1928 (after which Mustafa Kemal Atatürk imposed the use of the Latin alphabet), Kashmiri, Sindhi, Urdu and Kurdish. (All of these languages, except for Turkish, have Indo-European roots).

It is often necessary to add or modify certain letters in order to adapt this alphabet to the phonology of the target languages. Certain African languages, for example Hausa, have also used it before doing a Latin transcription.

The Arabic alphabet is composed of 29 basic letters and is written from right to left. There is no difference between written and printed letters; the concepts of upper and lower case letters does not exist (thus the writing is unicase). On the other hand, most of the letters are attached to one another, even when printed, and their appearance changes as a function of whether they are preceded or followed by other letters or stand alone (that is, there is contextual variation). The Arabic alphabet is an abjad, a term describing writing in which the vowels are not explicitly written; so the reader must know the language in order to restore them. However, in editions of the Quran or in didactic works a vocalization notation in the form of diacritic marks is used. Moreover, in vocalized texts, there is a series of other diacritics of which the most modern are an indication of vowel omission (sukūn) and the doubling of consonants (šadda).

This alphabet can be traced back to the Nabataean dialect of Aramaic, itself descended from Phonecian (which, among others, gave rise to the Greek alphabet and, thence, to Latin letters, etc.). The first example of a text in the Arabic alphabet appeared in 512 A.D. It wasn't until the 7th century that marks were added above and below the letters to differentiate them, the Aramaic model having fewer phonemes than the Arabic and in the early writings a single letter might represent several phonemes.

The Arabic alphabet can be transliterated and transcribed in various ways. The prefered method in this document will be DIN-31635. It can be encoded using several character sets, including: ISO-8859-6 and Unicode, thanks to the "Arabic segment", entries U+0600 to U+06FF. However, these two sets do not indicate for each of the characters the in-context form they should take. It is left to the rendering engine to select the proper glyph to display for each character.

When one wants to encode a particular written form of a character, there are extra code points provided in Unicode which can be used to express the exact written form desired. The Arabic presentation forms A (U+FB50 to U+FDFF) and Arabic presentation forms B (U+FE70 to U+FEFF) contain most of the characters with contextual variation as well as the extended characters appropriate for other languages. It is also possible to use ??<<liants>>??, with or without ??<<chasse>>?? (see talk page). Note that the use of these presentation forms is deprecated in Unicode, and should generally only be used within the internals of text-rendering software, or for backwards compatibility with implementations that rely on the hard-coding of glyph forms.

Finally, the encoding of Arabic is in logical order, that is, the characters are entered in the order that they are written and pronounced without worrying about the direction in which they will be displayed (reversed for a westerner). Again, it is left to the rendering engine to present the characters in the correct direction. In this regard, if the Arabic words on this page are written left to right, it is an indication that the Unicode rendering engine used to display them is out-of-date. For more information about encoding Arabic, consult the Unicode manual available at http://www.unicode.org/

Presentation of the alphabet

The transcription and the transliteration mainly follow the DIN 31635 standard; the alternatives belonging to other standards are indicated after the oblique bar.

Notice that the superscript diacritic above the vowels can be easily replaced by a circumflex.

A transliteration from Arabic must clearly show the characters which are not pronounced or which are pronounced as others in order to avoid being ambiguous; a transcription indicates only the pronunciation. See below for more details. The phonetic transcription (somewhat simplified here) follows the conventions of the International Phonetic Alphabet: for more details concerning the pronunciation of Arabic, consult the article Phonology of the Arabic language.

Primary letters

Stand-alone Initial Medial Final Name Trans. Value
أ ؤ إ ئ ٵ ٶ ٸ ځ, etc. hamza ʾ / ’ et ‚ [ʔ]
ʾalif ā / â [aː]
bāʾ b [b]
tāʾ t [t]
ṯāʾ ṯ / th [θ]
ǧīm ǧ / j / dj [ʤ]
ḥāʾ [ħ]
ḫāʾ ḫ / ẖ / kh [x]
dāl d [d]
ḏāl ḏ / dh [ð]
rāʾ r [r]
zāy z [z]
sīn s [s]
šīn š / sh [ʃ]
ṣād [sˁ]
ﺿ ḍād [dˁ], [ðˤ]
ṭāʾ [tˁ]
zāʾ [zˁ], [ðˁ]
ʿayn ʿ / ‘ [ʔˤ]
ġayn ġ / gh [ɣ]
fāʾ f [f]
qāf q / ḳ [q]
kāf k [k]
lām l [l]
mīm m [m]
nūn n [n]
hāʾ h [h]
wāw w [w]
yāʾ y [j]

Les lettres sans graphie initiale ni médiane ne sont jamais liées à la lettre suivante, même dans un mot. Quant au hamza, il n'a qu'une seule graphie, car il n'est jamais liée ni à la lettre qui précède, ni à celle qui suit. Le hamza peut aussi se comporter comme un diacritique (on dit alors qu'il a un support). Aucun mot ne commence dans le dictionnaire par un ʾalif : de fait, hamza est la première lettre, bien que, traditionnellement et historiquement, ce rôle échée à ʾalif.

Other letters

Stand-alone Initial Medial Final Name Trans. Value
ʾalif madda ʾā [ʔaː]
tāʾ marbūṭa h et t / Ø / h / ẗ [a], [at]
ʾalif maqṣūra ā / ỳ [aː]
lām ʾalif [laː]

Notes

Écriture de la hamza

Initialement, la lettre ʾalif notait une occlusive glottale, ou « coup de glotte », transcrite par [ʔ], ce que confirment les alphabets issus de la même origine phénicienne. Or, il a servi, de la même manière que dans d'autres abjads, avec yāʾ et wāw, de mater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue (voir plus bas). De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis, ʾalif sert principalement à remplacer des phonèmes ou servir de support graphique à certains signes.

The Arabic alphabet now mainly uses the hamza to indicate a glottal stop, which can appear anywhere in a word. This letter, however, does not function like the others: elle peut se être écrite seule ou avoir besoin d'un support, in which case it becomes a diacritic:

  • sans support : ء ;
  • avec support : إ ,أ (sur et sous un ʾalif), ؤ (sur un wāw), ئ (sur un yāʾ 'sans points ou yāʾ hamza).


The details of the writing of the hamza are treated below, following that of the vowels and syllable-division marks, because they are interdependent. (Literally: "Le détail de l'écriture de la hamza est traité plus bas, à la suite des voyelles et des signes de syllabation, car leur fonctionnement sont liés." Can someone check this?)

Ligatures

lām+ʾalif, etc.

Diacritiques

Voyelles

Les voyelles (qui peuvent être brèves ou longues) ne sont généralement pas écrites, sauf parfois dans les textes sacrés et didactiques, auquel cas l'on dit de ces textes qu'ils sont « vocalisés ». Les brèves sont des diacritiques placés sur ou sous la consonne qui les précède dans la syllabe, tandis que les longues sont notées par le diacritique de la brève équivalente suivie d'une consonne (ʾalif pour l'allongement de /a/, yāʾ pour celui de /i/ et wāw pour celui de /u/, soit = ā, iy = ī et uw = ū) ; dans un texte non vocalisé (dans lequel les voyelles ne sont pas notées), les longues sont donc simplement représentées par les consonnes en question , y, w). Comme aucune syllabe arabe ne commence par une voyelle (contrairement aux apparences : il y a une consonne à l'initiale d'un prénom comme Ali, en arabe ʿAlī, ou d'un mot comme ʾalif), il n'y a pas de forme indépendante.

Les voyelles longues étant écrites au moyen de digramme, l'alphabet les traite comme des suites voyelle + consonne normales, ce qui recquiert, dans un texte entièrement diacrité, l'emploi du sukūn (voir plus bas).

Pour plus de clarté, les voyelles seront placées sur ou sous la lettre ﺕ tāʾ ; il faudrait donc lire les résultats [ta], [ti], [tu], etc. Les lettres se seront cependant pas liées : ainsi, pour représenter ā, l'on aura la séquence écrite تَ‌ا au lieu de تَا.

Voyelles simples Nom Trans. Valeur
تَ fatḥa a [a]
تِ kasra i [i]
تُ ḍamma u [u]
تَ‌ا fatḥa ʾalif ā [aː]
تَ‌ى fatḥa ʾalif maqṣūra ā / aỳ [aː]
تِ‌ي kasra yāʾ ī / iy [iː]
تُ‌و ḍamma wāw ū / uw [uː]

Diphtongues [ay] et [au]

Elles sont simplement notées par la voyelle brève suivie d'une consonne spirante [j] ou [w]. L'écriture les traite comme ī et ū, c'est-à-dire qu'elle ne les note pas différemment des autres suites voyelle + consonne. De même, on pourrait classer parmi les diphtongues celles débutant par īy et ūw ; ce ne sont cependant que des voyelles suivies d'une consonne. Comme précédemment, les diphtongues sont précédées de t et les lettres ne sont pas liées.

Diphtongues Nom Trans. Valeur
تَ‌يْ fatḥa yāʾ ay [ai]

تَ‌وْ

fatḥa wāw aw [au]

Voyelles casuelles

Lors de la flexion nominale, les noms peuvent recevoir trois désinences différentes, -a, -i, et -u. Celles-ci ne sont pas écrites dans un texte non vocalisé, sinon, les signes habituels sont employés. Cependant, si le mot est indéfini (sans article ni complément du nom), il prend (sauf exceptions) les désinences -an, -in, -un, nommées tanwīn. Celles-ci sont notées par des diacritiques spéciaux qui remplacent la voyelle ainsi que la lettre -n attendue en fin de mot ; selon que le texte est vocalisé ou non, la notation change :

  • tanwīn -an (tanwīn al-fatḥa) : ــًـ ; un ʾalif est placé à la suite du tanwīn, sauf si le mot se termine par ة tāʾ marbūṭa [a(t)] (suffixe de féminin), ou par un hamza, أ [aʔ] ou اء, [āʔ], auquel cas le tanwīn reste seul ; dans un texte non vocalisé, seul le ʾalif est écrit, si c'est possible :
    • رَجُلًا raǧulan, « homme (cas direct) » ; non vocalisé : رجلاً,
    • عَادَةً ʿādatan, « d'habitude » (noter l'utilisation du tāʾ marbūṭa prononcé ici [at] devant voyelle) ; non vocalisé : عادة (pas d'ʾalif après ة),
  • tanwīn -in (tanwīn aḍ-ḍamma) : ــٍـ ; il n'est pas écrit dans les textes non vocalisés :
    • رَجُلٍ raǧulin, « homme (cas indirect) » ; non vocalisé : رجل ;
  • tanwīn -in (tanwīn al-kasra) : ــٌـ (il existe une deuxième graphie, ressemblant à « ” » suscrit) ; il n'est pas écrit dans les textes non vocalisés :
    • رَجُلٌ, « homme (cas sujet) » : non vocalisé : دجل (le cas sujet et le cas indirect ne se distinguent donc pas).

Dans la pratique, le [n] des tanwīn n'est pas prononcés (sauf des expressions adverbiales figées). Il appartient à la langue littéraire de l'arabe classique.

Signes de syllabation et autres

De même que pour les signes de vocalisation, les signes de syllabation ne sont pas obligatoirement écrits. Ils permettent cependant une grande précision et s'utilisent parfois quand le texte n'est pas vocalisé.

Sukūn

Une syllabe arabe peut être ouverte (elle est terminée par une voyelle) ou fermée (par une consonne) :

  • ouverte : C[onsonne]V[oyelle] ;
  • fermée : CVC(C).

Quand la syllabe est fermée, on peut indiquer que la consonne qui la ferme ne porte aucune voyelle en plaçant au dessus un signe nommé sukūn, de la forme « ° », pour lever tout ambiguïté, surtout quand le texte n'est pas vocalisé : il faut se souvenir qu'un texte standard n'est composé que de suites de consonnes ; ainsi, le mot qalb, « cœur », est écrit qlb. Les sukūn permettent de savoir où ne pas placer une voyelle : qlb (قلب) pourrait en effet être lu /qVlVbV/, mais écrit avec un sukūn sur le l et sur le b, il ne peut être interprété que sous la forme /qVlb/ (quant à savoir quelle est la voyelle /V/, il faut pour cela connaître le mot) ; on écrit donc قلْبْ (sans ligatures : ق‌لْ‌بْ). De fait, dans un texte vocalisé le sukūn se semble pas nécessaire, puisque le placement des voyelles est sûr : قِلْبْ est quelque peu redondant.

L'on peut faire de même pour l'écriture des voyelles longues et des diphtongues, puisque celles-ci sont notées par une voyelle suivie d'une consonne : ainsi mūsīqā, « musique », s'écrit de manière non vocalisée mwsyqā (موسيقى avec un ʾalif maqṣūra en fin de mot) ; pour éviter une lecture /mVwVsVyVqā/, il est possible d'indiquer que w et y ferment leur syllabe respective : موْسيْقىْ (noter que ʾalif maqṣūra est considéré comme une consonne et qu'il porte donc aussi le sukūn). Le mot, entièrement vocalisé, est écrit مُوْسِيْقَىْ. De même pour les diphtongues : le mot zauǧ, « mari », peut être écrit simplement zwǧ : زوج, avec sukūn : زوْجْ, avec sukūn et voyelle : زَوْجْ. Dans la pratique, le sukūn n'est pas placé au-dessus des lettres servant à indiquer l'allongement de la voyelle qui précède : mūsīqā sera plus simplement écrit مُوسِيقَى. De même, il n'est que rarement placé en fin de mot quand la dernière syllabe est fermée.


Šadda

Ce signe, de forme « ّ  » sert à faire l'économie d'une lettre quand deux consonnes identiques se suivent : c'est le cas lorsqu'une syllabe fermée terminée par une consonne X précède une autre syllabe débutant par cette consonne X. On place la šadda au-dessus d'une des consonnes, tandis que l'autre n'est pas écrite : ainsi, le mot šadda lui-même est orthographié شدّ au lieu de شدد ; le mot, vocalisé, donne شَدَّ. Il n'y a donc plus besoin d'utiliser un sukūn ; sinon, l'on écrirait *شَدْدَ.

La šadda se rencontre très fréquemment dans les cas d'assimilation de la consonne [l] de l'article devant consonne solaire : ainsi, « la lune » s'écrit أَلْقَمَر ʾal-qamar, mais « le soleil » est noté أَلشَّمْس ʾaš-šams (il est écrit en réalité ʾalššams).


Noter le placement des signes de vocalisation :

  • fatḥa [a] et ḍamma [u] sont écrits au-dessus de la šadda tandis que kasra est écrite soit régulièrement sous la consonne qui la porte, soit sous la šadda : il ne faut donc pas confondre ﳲ et ﳴ ;
  • les tanwīn [an] et [un] suivent les mêmes principes (au-dessus de la šadda), mais le tanwīn [in] ne se place qu'au-dessous de sa lettre (et non sous la šadda).

Writing of the hamza

On l'a dit, la hamza peut se présenter sans ou avec support. Les règles d'écritures dépendent en fait du vocalisme et de la syllabation. It is necessary to consider the place of the word where the hamza appears::

1. hamza à l'initiale :

  • elle a toujours le support ʾalif et elle est toujours suivie d'une voyelle ;
  • elle se place au-dessous du ʾalif si la voyelle qui suit est /i/, long ou bref, que le texte soit vocalisé ou non : إِ et إ notent tous deux ʾi, comme dans le prénom ʾIbrāhīm, écrit إِبْرَاهِيم ou إبراهيم ;
  • elle se place au-dessus du ʾalif dans les autres cas : ʾa est noté أَ ou أ, tandis que ʾu est écrit أُ ou أ, par exemple ; ainsi أَنْتَ ou أنت ʾanta, « toi (masculin) » ; أُسْبُوع ou أسبوع ʾusbūʿ, « semaine » ; أَيْنَ ou أين ʾayna, « où ? », etc.

2. Hamza à la finale :

  • son support varie selon le timbre de la voyelle qui précède ;
  • si c'est /a/, /i/ ou /o/ suivis de hamza, les supports sont respectivement ʾalif, yāʾ hamza (sans points), wāw : مُبْتَدَأ "mubtadaʾ, « commencement » ;
  • dans les autres cas (avant sukūn, lettre d'allongement, etc.), hamza n'a pas de support : شَيْء šayʾ, « chose » ; بَاْء bāʾ, « lettre B », ضَوْء ḍawʾ, « lumière ».

Letters used for other languages

to be written

Regarding transliteration

to be written

See also

Arabic prononciation ~ writing system ~ alphabet ~ Arabic language