Thai
[This document is for discussion, and should not yet be used as a reference. It closely follows pages 200-215 of the LA-LC Romanization Tables, with annotations and typographic corrections by Doug Cooper, January 2006.]
Vowels and Dipthongs
Vernacular |
Romanization |
Conventional (Haas-style) Transcription [ED: added] |
อะ, อั |
a |
a |
อา |
ā |
aa |
อำ |
am |
am |
อิ |
i |
i |
อี |
ī |
ii |
อึ |
ư |
ʉ |
อี |
ư̄ |
ʉʉ |
อุ |
u |
u |
อู |
ū |
uu |
เอะ, เอ็ |
e |
eʔ, e |
เอ |
ē |
ee |
แอะ, แอ็ |
æ |
ɛʔ, ɛ |
แอ |
ǣ |
ɛɛ |
โอะ, อ |
o |
oʔ, o |
โอ |
ō |
oo |
เอาะ |
o̜ |
ɔʔ |
ออ |
ō̜ |
ɔɔ |
เออะ |
œ |
əʔ |
เออ, เอิ |
œ̄ |
əə |
เอียะ |
ia |
iaʔ |
เอีย |
īa |
ia |
เอือะ |
ưa |
ʉaʔ |
เอือ |
ư̄a |
ʉa |
อัวะ |
ua |
uaʔ |
อัว, ว |
ūa |
ua |
ใอ, ไอ, อัย, ไยอ |
ai |
ay |
อาย |
āi |
aay |
เอา |
ao |
aw |
อาว |
āo |
aaw |
อุย |
ui |
uy |
โอย |
ōi |
ooy |
ออย |
ō̜i |
ɔɔy |
เอย |
œ̄i |
əəy |
เอือย |
ư̄ai |
ʉay |
อวย |
ūai |
uay |
อิว |
iu |
iw |
เอ็ว |
eo |
ew |
เอว |
ēo |
eew |
แอว |
ǣo |
ɛɛw |
เอียว |
īeo |
iaw |
ฤ |
rư |
rʉ |
ฤ |
ri |
ri |
ฤ |
rœ̄ |
r |
ฤๅ |
rư̄ |
rʉʉ |
ฦ |
lư |
lʉ |
ฦๅ |
lư̄ |
lʉʉ |
Consonants
Vernacular |
Initial /medial |
Final |
Conventional transcription [ED: added] |
|
ก |
k |
k |
k/k |
|
ข, ฃ, ค, ฅ, ฆ |
kh |
k |
kʰ/k |
|
ง |
ng |
ng |
ŋ/ŋ |
|
จ |
čh |
t |
c/t |
|
ฉ, ช, ฌ |
ch |
t |
cʰ/t |
(LC/ALA includes ซ) |
ญ |
y |
n |
y/n |
|
ด, ฎ, ฑ |
d |
t |
d/t |
(See note 1) |
ต, ฏ |
t |
t |
t/t |
|
ถ, ฐ, ท, ฑ, ธ, ฒ |
th |
t |
tʰ/t |
(See note 1) |
น, ณ |
n |
n |
n/n |
|
บ |
b |
p |
b/p |
|
ป |
p |
p |
p/p |
|
ผ, พ, ภ |
ph |
p |
pʰ/p |
|
ฝ, ฟ |
f |
p |
f/p |
|
ม |
m |
m |
m/m |
|
ย |
y |
- |
y/y |
|
ร |
r |
n |
r/n |
(See note 2) |
ล, ฬ |
l |
n |
l/n |
|
ว |
w |
- |
w/w |
|
ซ, ทร, ศ, ษ, ส |
s |
t |
s/t |
|
อ |
ʻ (ayn) |
- |
-/ʔ/ɔ |
(See note 3) |
ห, ฮ |
h |
- |
h/- |
(See note 4) |
Notes
1. ฑ is usually romanized th, occasionally d, depending on the pronunciation as determined from an authoritative dictionary.
2.
When ร follows
another consonant and ends a syllable, it is romanized n, and the inherent vowel of
the preceding consonant is represented by ō̜
(e.g. นคร nakhō̜n).
When รร follows another
consonant, and no other pronounced consonant follows in the same syllable, it
is romanized an (
e.g. สวรรค์ sawan), but if a pronounced
consonant follows, it is represented by a
(e.g. กรรม kam).
3. In four common words อ occurs preceding another consonant to mark a certain tone and is then not romanized. [ED: อย่าง, อย่า, อยู่, อยาก]
4. When ห occurs preceding another consonant to mark a certain tone, it is not romanized.
Rules of Application
1. Tonal marks are not romanized.
2. The symbol ฯ indicates omission and is shown in romanization by “…” the conventional sign for ellipsis.
3. When the repeat symbol ๆ is used, the syllable is repeated in romanization.
4. The symbol ฯลฯ is romanized la.
5. Thai consonants are sometimes purely consonantal and sometimes followed by an inherent vowel romanized o, a, or ō̜ depending on the pronunciation as determined from an authoritative dictionary, such as the Royal Institute’s latest edition (1982). [ED: a new edition was published in 2004]
6. Silent consonants, with their accompanying vowels, if any, are not romanized.
7. When the pronunciation requires one consonant to serve a double function – at the end of one syllable and the beinning of the next – it is romanized twice according to the respective values.
8. The numerals are ๐ (0), ๑ (1), ๒ (2), ๓ (3), ๔ (4), ๕ (5), ๖ (6), ๗ (7), ๘ (8), and ๙ (9).
9. In Thai, words are not written separately. In romanization, however, text is divided into words according to the guidelines provided in Word Division, below.
Word Division
1. In general, Thai words
formulated by romanization are made up of a single syllable (คำ) kham; ไทย
Thai), and
thus each syllable is considered a separate word, with a space between each.
(Exceptions are covered by rules 2 through 43.) This is in contrast to may
multisyllabic words that are foreign to Thai but that are found written in the
Thai script. These multisyllabic foreign words are written with the space
closed up between the syllables as appropriate. Prominent examples are words
of Pali and Sanskrit origin, as well as some words that are Thai in origin but
have been formed according to the grammar of Pali or Sanskrit.
Examples of monosyllabic Thai words:
คำ |
kham |
ไทย |
Thai |
พูด |
phūt |
Examples of multisyllabic Thai words formed according to the rules of other languages;
กระทรวง |
krasūang |
ภาษา |
phāsā |
ปัญญา |
panyā |
Examples of multisyllabic Thai words of Pali or Sanskrit origin:
วัฒนธรรม |
watthanatham |
มหาวิทยาลัย |
mahāwitthayālai |
กษัตริย์ |
kasat [Ed: was กษัดริย์) |
พลเมือง |
phonlamư̄ng |
ภารโรง |
phānrōng |
2. In contrast to the preceding statement that Thai words are monosyllabic, note that there are multisyllabic Thai words in which the first syllable is used as a prefix; write the prefix and the succeeding element as a single word.
(a) Words with การ (kān) prefixed:
การเดินทาง |
kāndœ̄nthāng |
การแปส |
kānplǣ |
การต่างประเทศ |
kātāngprathēt |
(b) Words with ความ (khwām) prefixed:
ความจริง |
khwāmčhing |
ความหมาย |
khwāmmāi |
ความเห็น |
khwāmhen |
(c) Miscellaneous cases with various words used as prefixes. The most common are:
พ่อ |
phō̜ |
|
เด็ก |
dek |
แม่ |
mǣ |
|
ข้า |
khā |
ลูก |
lūk |
|
ราย |
rāi |
พี่ |
phī |
|
ต้น |
ton |
น้อง |
nō̜ng |
|
ลาย |
lāi |
นาย |
nāi |
|
เครื่อง |
khrư̄ |
นาง |
nāng |
|
แผน |
phǣn |
ข้อ |
khō̜ |
|
ท้อง |
thō̜ng |
คำ |
kham |
|
ขี้ |
khī |
บท |
bot |
|
ใจ |
čhai |
ผู้ |
phū |
|
ช่าง |
chāng |
นัก |
nak |
|
วัย |
wai |
คน |
khon |
|
ดวง |
dūang |
ชาว |
chāo |
|
หมอ |
mō̜ |
Note that the listing of miscellaneous cases covers only the most common ones. Other, less common cases may be handled the same way.
บุญ bun
Note also that some words, reflecting a transposition in normal Thai word order and consisting of a principal word and one or more words used with it as a prefix, may be considered as belonging to this category.
ราชบัณฑิตยสถาน Rātchabandittaysathān
โบราณคดีวิทยา bōrānnakhadīwitthayā
ไทยคดีศึกษา Thaikhadīsưksā
3. Compounds. Write compounds as a single word.
(a) General: Identifying a compound is largely a matter of knowledge of the language together with the use of good judgement. Note that compounds generally result in concepts to one degree or another different from the meaning of either of the component words when used alone.
ใกล้ชิด klaichit
เข้มงวด khēmngūat
ภายนอก phāinō̜k
ชัดเจน chatčhēn
ชั่วคราว chūakhrāo
กล้าหาญ klāhān
ค้นหา khonhā
ทดลอง thotlō̜ng
มองดู mō̜ngdū
อดทน ʻotthon
กลกงแจ้ง klāngčhǣng
ครบถ้วน khropthūan
เกี่ยวข้อง kīeokhō̜ng
หมู่บ้าน mūbān
รถไฟ rotfai
เงินเดือน ngœ̄ndư̄an
จัดทำ čhattham
รับใช้ rapchai
บอกรับ bō̜krap
ต่อสู้ tō̜sū
รบกวน ropkūan
สุดท้าย sutthāi
ผลไม้ phonlamai
เสื้อผ้า sư̄aphā
ตนเอง tonʻēng
พดคุย phūtkhui
ไปเยี่ยม paiyīam
ตีพิมพ์ tīphim
จัดพิมพ์ čhatphim
N.B.: Do not consider as compounds repeated words sometimes referred to as “reduplicated compounds.”
ต่าง ๆ tāng tāng
ช้า ๆ chā chā
เร็ว ๆ reo reo
(b) Reduplicated Doublets: When words are strung together for sound, write them as a single word.
เปลี่ยนแปลง plīanplǣng
เรียบร้อย rīaprō̜i
อึกทึก ʻưkkathưk
รอบคอบ rō̜phkhō̜p
4. Geographical Names. Divide geographical names into separate words according to the decision of the U.S. Board on Geographic Names, as expressed in the Gazetteer of Thailand.
[Ed.: these may be found at:
http://earth-info.nga.mil/gns/html/cntry_files.html
http://earth-info.nga.mil/gns/html/cntyfile/th.zip ]
5. Royal Language (rāchāsap). Write as a separate word any word found in an entry in either of the following dictionaries unless otherwise directed by these rules.
Rāchāsap chabap sombūn / Rāchamānop. (Bangkok: Kāoanā, 1965)
Rāchāsap chabap sombūn / Sangūan ʻĀnkhong. (Bangkok: Kāoanā, 1964)
6. Generally separate all elements in terms of rank, privilege, address, etc., associated with names of persons unless another rule directs otherwise.
นายทหารตำรวจ Nāithahān Tamrūat
ผู้ช่วยศาสตราจารย์ Phūchūai Sāttrāčhān
หม่อมราชวงศ์ Mō̜m Rātchawong
รองอำมาตย์โท Rō̜ng ʻAmāt Thō
พลตำรวจเอก Phon Tamruāt ʻĒk
พระมหา Phra Mahā
รองประธานาธิบดี Rō̜ng Prathānāthibō̜di
พระปรมินทรมหา Phraparaminthra Mahā
พระเทพรัตนราชสุดาฯ Phrathēprattanarāthasudā
สยามบรมราชกุมารี Sayāmbō̜rommarātchakumārī
พระบาทสมเด็จพระเจ้าอยู่หัว Phrabāt Somdet Phračhaoyūhūa
พระนางเจ้าพระบรมราชินีนาถ Phranāng Čhao Phrabō̜rommarāchinī Nāt
One arbiter of whether official pronunciations of royal ranks with กรม (Krom) requires an extra syllable is Photčhanānukrom nakrīan chalœ̄m phrakīat, Phō̜. Sō̜. 2530, 2nd edition, 1988, p. 329. This officially approved work is based on proclamations of the Prime Minister’s Office as well as on the Royal Institute’s 1982 dictionary.
กรมพระยา Krom Phrayā
but กรมหลวง Krommalūang
7. Generally combine elements (covered by terms described in 6, above) which begin with เจ้า (Čhao) and combine elements in ท่าผู้ญิง (Thānphūying), เจ้าจอมมารดา (Čhaočhō̜mmāndā), and พระเจ้าอยู่หัว (Pračhaoyūhūa).
เจ้านาย Čhaonāi
เจ้าของ Čhaokhō̜ng
เจ้าฟ้า Čhaofā
เจ้าพระยา Čhaophrayā
ท่านผู้หญิง Thānphūying
เจ้าจอมมารดา Čhaočhō̜mmāndā
พระเจ้าอยู่หัว Phračhaoy_hūa
but เจ้าฟ้าหญิง Čhaofā Ying
เจ้าฟ้าชาย Čhaofā Chāi
พระองค์เจ้าชาย Phraʻong Čhao Chai
หม่อมเจ้าหญิง Mō̜m Čhao Ying
เจ้าเมืองแปร Čhao Mư̄ang Prǣ
8. Generally separate elements in personal royal titles and corporate names beginning with กรม (Krom) except as listed below. For these excepted cases only, although pronunciation with or without the extra syllable is correct in popular usage, proclamations of the Prime Minister’s Office in recent years have approved pronounications with the extra syllable (effectively combining the elements) as the only officially correct pronunciations.
กรมพระ Krommaphra
กรมหลวง Krommalūang
กรมหมื่น Krommamư̄n
กรมวัง Krommawang
กรมท่า Krommathā
but กรมพระยา Krom Phrayā
9. Keep separate the Buddhist samanasak ranks พระมหา (Phra Mahā) and พระครู (Phra Khrū) as well as the conventional religious terms of address พระ (Phra) and พระอาจารย์ (Phra ʻĀčhān).
พระมหาประยุทย์ Phra Mahā Prayut
พระครูเลิศ Phra Khrū Lœ̄t
พระสมหวัง Phra Somwang
พระอาจารย์สมหวัง Phra ʻĀčhān Somwang
10. พระ (Phra) should be separate as follows:
(a) When connoting the Buddha, his image, a member of the Buddhist Order of the Sangha, etc.;
(b) As the only element or one of the elements in a separately written conferred rank, or;
(c) As an independent (complimentary, conventional, etc.) element immediately preceding a personal name (except the name of Buddha) but not an integral part of it. Otherwise, it should be written as a combined prefix to words (usually associated with royalty, gods, object of worship, etc.).
พระแวมรกด Phra Kǣo Mō̜rakot
พระสยามเทวาธิราช Phra Sayāmmathēwāthirāt
พระอาจารย์สมหวัง Phra ʻĀčhān Somwang
พระอภัยมณี Phra ʻAphaimanī
พระมหาประยุทย์ Phra Mahā Prayut
พระครูเลิศ Phra Khrū Lœ̄t
กรมพระมหิดล Krom Phra Mahidon
พระพุทธยอดฟ้าจุฬาโลก Phra Putthayō̜tfā Čhulālōk
พระนั่งเกล้าเจ้าอยู่หัว Phra Nangklao Čhaoyūhūa
สมเด็จพระวรรณรัตน์ Somdet phra Wannarat
but พระพทธเจ้า Phraphutthačhao
พระปรมินทรมหามงกุฎ Phraparaminthra Mahā Mongkut
กรมพระมหิดล Krommaphra Mahidon
กรมพระราชวังบวร Krom Phrarātchawangbō̜wō̜n
พระสังฆราช Phrasangkharāt
11. มหา (Mahā) should be separate when as an independent (complimentary, conventional, etc.) element it immediately precedes and is not an integral part of a personal name. Otherwise, it should be treated as specified in paragraph 12, below.
พระปรมินทรมหามงกุฎ Phraparaminthra Mahā Mongkut
พระปรมินทรมหาภูมิพลอดุลยเดช Phraparaminthra Mahā Phūmiphon ʻAdunlayadēt
มหาธาตุ mahāthāt
12. พระมหา (Phra Mahā) is a samanasak rank conferred on a lower-level Buddhist religious [sic] who has finished at least the third grade of parīan (Buddhist theology). It should not be confused with มหา- (mahā) or พระมหา- (phramahā-), which are prefixes added to words associated with royalty, religious [sic], gods, objects of worship, etc., such as titles of the supreme patriarch. The rank should be written separately; the prefix, combined.
พระมหาประยุทย์ Phra Mahā Prayut
พระมหาสังฆราชเจ้า Phramahāsangkhrāt Čhao
พระมหาสมณเจ้า Phramahāsamančhao
มหาเถระ Mahāthēra
13. Titles of honor with เจ้า (čhao) as the last element should be written separately or combined in accordance with whether the immediately preceding element is commonly used as a prefix.
พระองค์เจ้า Phraʻong Čhao
พระสังฆราชเจ้า Phrasangkharāt Čhao
พระพุทธเจ้า Phraphutthačhao
พระมหาสมณเจ้า Phramahāsamanačhao
พระนางเจ้า Phranāng Čhao
พระเจ้าวรวงศ์เธอพระองค์เจ้า Phračhao Wō̜rawongthœ̄ Phraʻong Čhao
14. Combine หลวน (Lūang) when used as a simple (non-conferred) title in combination preceding words for relatives supposed to be Buddhist priests.
หลวงพ่อ Lūangphō̜
หลวงพี่ Lūangphī
หลวงพ่อปู่ Lūangphō̜pū
หลวงลุง Lūanglung
15. Generally separate คุณ (Khun) as first element, except in the courtesy titles คุณหญิง (Khunying) and คุณนาย (Khunnāi).
คุณแม่ Khun Mǣ
คุณพ่อ Khun Phō̜
คุณหนู Khun Nū
but คุณหญิง Khunying
คุณนาย Khunnāi
16. Combine elements in personal pronouns or their equivalents.
ข้าพระพุทธเจ้า khāphraphutthačhao
ข้าพเจ้า khāphačhao
หม่อมฉัน mō̜mchan
กระผม kraphom
ใต้ฝ่าละอองธุลีพระบาล taifālaʻō̜ngtulīphrabāt
17. Elements in royal or noble titles and names are generally combined but should be separate when two distinct terms can be isolated in a noun/modifier or noun/noun-in-apposition configuration if the terms would not otherwise be combined, or if there is doubt about whether to combine them.
ดำรงราชานุภาพ Damrongrāchānuphāp
ปราสาททอง Prāsāt Thō̜ng
พุทธยอดฟ้าจุฬาโลก Phutthayō̜tfā Čhulālōk
พุทธเลิดหล้านภาลัย Phutthalœ̄tlā Naphālai
ตากสิน Tāk Sin
18. Elements ordinarily combined should be separate when immediately followed by a proper name or its substitute.
แม่ทัพใหญ่ Mǣthap Yai
รองแม่กองงานพระธรรมทูต Rō̜ng Mǣ Kō̜ng Ngān Phrathammathūt
เจ้าอาวาส čhaoʻāwāt
เจ้าคณะภาค ๗ Čhao Khana Phāk 7
นายสุชาติ Nāi Suchāt
เจ้าเมืองแปร Čhao Mư̄ang Prǣ
เจ้าเมือง čhao mư̄ang
19. นาย (Nāi) before a proper name as a bandāsak or roughly equivalent to Mister should be separate. Otherwise, it is combined as a prefix in accordance with paragraph 2.(c) above.
นายสชาติ Nāi Suchāt
นายร้อย Nāirō̜i
นายทหารตำรวจ Nāithahān Tamrūat
นายแพทย์ปรัดเลย์ Nāiphǣt Pratlē
นายพิทักษ์ราชา (โจ) Nāi Phithakrāchā (Čhō)
20. In cases of doubt about whether miscellaneous words listed under 2.(c) above are functioning as prefixes, generally separate elements unless sufficient conventional usage has bestowed word status on the configuration. Always separate demonstrative adjectives, relative pronouns, and numerals from the first element.
คนพ้นคุก khon phon khuk
ผู้ก่อการร้าย phūkō̜kānrāi
คนนั้น khon nan
ผู้ลี้ภัย phūlīphai
เครื่องนี้ khrư̄ang nī
ข้อหนึ่ง khō̜ nưng
but คนสีเทา khonsīthao
21. Combine elements in colors, days of the week, but not months of the year.
สีเหลือง sīlư̄ang
วันจันทร์ Wančhan
เดือนพฤศจิกายน Dư̄an Phrưtsačhikāyon
22. Combine numerals in the same way as in English; i.e., combine teens, combine first elements, and separate from the digital element if any in twenty through ninety-nine, etc. Separate ที่ (thī) in ordinals.
สิบสาม sipsām
ยี่สิบสอง yīsip sō̜ng
ร้อยเอ็ด rō̜i ʻet
วันที่สิบเจ็ด wan thī sipčhet
23. Generally separate royal introductory verbs and verbs indicating royal courtesy, but combine elements in conventional phrases of courtesy.
ทรงประกอบพิธีเปิด song prakō̜p phithī pœ̄t
ทรงพระเจริญ song phračharœ̄n
ทรงพระกรุณาโปรดเกล้า song phrakarunā prōt klao
ขอบใจ khō̜pčhai
24. In most cases separate หลาย (lāi), ชั่ว (chūa), ทั่ว (thūa), ทุก (thuk), ทั้ง (thang), บาง (bāng), ต่าง (tāng), etc., preceding words.
ทั้งประเทศ thang prathēt
ทั่วราชอาณาจักร thūa rātchaʻānāčhak
ชั่วชีวิต chūa chīwit
บางคราว bāngkhrāo
ทุกสิ่ง thuk sing
ต่างมารดา tāng māndā
หลายคน lāi khon
But ชั่วคราว chūakhrāo
ทั่วไป thūapai
ทั้งหมด thangmot
ชั่วโมง chūamōng
ต่างประเทศ tāngprathēt
25. Generally separate งาน (ngān) preceding a word or phrase except in cases denoting literary or research activity when only two elements are present.
งานพระราชทานเพลิงศพ ngān phrarātchathān plœ̄ng sop
งานธุรกิจ ngān thurakit
งานเขียน ngānkhīan
งานวิจัย ngānwičhai
26. Combine or separate the following miscellaneous phrases as shown.
เนื่องใน nư̄ang nai
ว่าด้วย wādūai
ร่วมกับ rūam kap
ครบรอบ khrop rō̜p
พร้อมด้วย phrō̜m dūai
ตนเอง tonʻēng
เนื่องจาก nư̄angčhāk
แค่ไหน khǣ nai
ล่วงหน้า lūangnā
เบื้องต้น bư̄angton
ต่อไป tō̜pai
ตั้งแต่ tangtǣ
จนกระทั่ง čhonkrathang
จนถึง čhon thưng
27. Combine ตะวัน (tawan) not เฉียง (chīang) in compass points.
ตะวันออกเฉียงเหนือ tawanʻō̜k chīang nư̄a
ตะวันตกเฉียงใต้ tawantok chīang tai
ตะวันตกเฉียงเหนือ tawantok chīang nư̄a
ตะวันออกเฉียงใต้ tawanʻō̜k chīang tai
28. Generally separate geographical designations with เมือง (mư̄ang).
เมืองเหนือ mư̄ang nư̄a
เมืองใต้ mư̄ang tai
but เมืองนอก mư̄angnō̜k
29. When ความ (khwām) is used in the legal context meaning “case” or “matter,” it should be separate.
ความแพ่ง khwām phǣng
ความอาญา khwām ʻāyā
30. These elements equivalent to English hyphenated adjectival phrases (not clauses) should be combined although kept separate from any noun (not included under paragraph 2.(c)) that they might modify, the latter clause applying only to phrases that are clearly adjectival in nature and not including the phrase words whose role Thai syntax makes doubtful.
หนังสือปกสีขาว nangsư̄ poksīkhāo
เรือชายฝั่งทะเล rư̄a chāifangthalē
ข้าวประดับดิน khāopradpdin
สินค้าส่งออก sinkhāsongʻō̜k
พ่อค้าส่งออก phō̜khāsongʻō̜k
การเจรจาการค้าหลายฝ่าย kānčhēnračhā kānkhā lāifāi
31. Many phrases consisting of predicate and object have attained single word status. But if there is doubt tht the elements have attained single word status, do not combine them unless 30, above applies.
ประเมินผล pramœ̄phon
ทำงาน thamngān
วางแผน wāngphǣn
อวยพร ʻūaiphō̜n
but การย้ายถิ่น kānyāi thin
การย้ายถิ่นฐาน kānyāi thinthān
ถิ่นใต้ thin tai
32. Generally separate phrases with ส่วน (sūan).
ส่วนพระองด์ sūan praʻong
ส่วนพลเมือง sūan phonlamư̄ang
but ส่วนตัว sūantūa
ส่วนรวม sūanrūam
33. Phrases with words indicating buildings as first element are generally combined.
หอศิลปะ hō̜sinlapa
ห้องประชุม hō̜ngprachum
โรงพิมพ์ rōngphim
หอสมุด hō̜samut
โรงเรียน rōngrīan
34. For terms not of rank, privilege, address, etc., generally do not combine elements that might otherwise be candidates for combining when the second element is a proper name unless the first element appears in the list under 2.(c) above. Nevertheless, capitalize the first element in any case.
หอภูมิพล Hō̜ Phūmiphon
รถเบ็นซ์ Rot Ben
คัมภีร์พระเวท Khamphī Phrawēt
But คนไทย Khonthai
35. For phrases consisting of a verb and งาน (ngān), generally do not combine.
ประสานงาน prasān ngān
รวมงาน rūam ngān
ปฏิบัติงาน patibat ngān
but ทำงาน thamngān
36. (rūam) as initial or final element should generally be separate.
รวมเล่ม rūam lēm
รวมอยู่ด้วย rūam yū dūai
but ส่วนรวม sūanrūam
37. Keep separate elements that purport to be translated phrases from other languages.
นครวัด Nakhō̜n Wat
สยามสแควร์ Sayām Sakhwǣ
38. Generally, when applying word division rules, retain word division appearing in the Thai script only if there is doubt about the exact mean[ing] of the configuration. Otherwise, ignore the division in Thai script.
โครงการ พุทธ-ไทย ปริทรรศน์ Khrōngkān Phut-Thai Parithat
39. Phrases beginning with น่า (nā) should only be combined if convention has conferred word status on the configuration.
|
น่าเสียดาย |
nāsīadāi |
|
น่าสนใจ |
nāsončhai |
but |
น่าจับตา |
nā čhap tā |
|
น่ารับรอง |
nā raprō̜ng |
40. Separate words beginning with ทหาร (thahān) for military, etc.
ทหารบก thahān bok
ทหารเรือ thahān rư̄a
ทหารอากาศ thahān ʻākāt
ทหารตำรวจ thahān tamrūat
41. Combine the generic element with all elements of a name for plants, animals, vegetables, etc.
นกขุนทอง nokkhunthō̜ng
แตงกวา tǣngkwā
สุนัขจิ้งจอก sunakčhingčhhō̜k
ผักกาดหัว pakkāthūa
ต้นหมาก tonmāk
42. For diseases, combine the generic term โรค (rōk) only if it appears as the final element of the configuration.
กาฬโรค kānlarōk
กามโรค kāmmarōk
โรคมะเร็ง rōk marēng
โรคโลหิตน้อย rōk lōhit nō̜i
โรคทรพิษ rōk thō̜raphit
อหิวาตกโรค ʻahiwātakarōk
โรคฝีดาษ rōk fīdāt
43. Combine adjectival phrases with ใจ (čhai) as final element.
ร้อนใจ rō̜nčhai
เกรงใจ krēngčhai
สุขภาพใจ sukkhaphāpčhai
ดีใจ dīčhai
Special Characters and Character
Modifiers used in Romanization
(See the MARC 21 Specifications for Record Structure, Character Sets, and
Exchange Media / CHARACTER SETS: Part 3 / Code Tables / January 2000, updated
September 2004)
http://www.loc.gov/marc/specifications/specchartables.html
http://lcweb2.loc.gov/cocoon/codetables/45.html
(Extended Latin)
http://www.atla.com/tsig/LatinCharacters/Latin%20Characters%20in%20Unicode%20and%20MARC-8.pdf (full set of examples)
Character Æ
LC-ALA Name digraph æ (upper case)
USMARC hex code A5
Unicode Name LATIN CAPITAL LETTER æ
Unicode hex code / decimal 00C6 / 198
Character Œ
LC-ALA Name digraph œ (upper case)
USMARC hex code A6
Unicode Name LATIN CAPITAL LIGATURE œ
Unicode hex code / decimal 0152 / 338
Character
LC-ALA Name digraph ae (lower case)
USMARC hex code B5
Unicode Name LATIN SMALL LETTER æ
Unicode hex code / decimal 00E6 / 230
Character œ
LC-ALA Name digraph oe (lower case)
USMARC hex code B6
Unicode Name LATIN SMALL LIGATURE œ
Unicode hex code / decimal 0153 / 339
Character Ư
LC-ALA Name U-hook (upper case)
USMARC hex code AC
Unicode Name LATIN CAPITAL LETTER U WITH HORN
Unicode hex code / decimal 01AF / 431
Character ư
LC-ALA Name u-hook (lower case)
USMARC hex code BD
Unicode Name LATIN SMALL LETTER U WITH HORN
Unicode hex code / decimal 01B0 / 432
Character ʻ
LC-ALA Name ayn
USMARC hex code B0
Unicode Name MODIFIER LETTER TURNED COMMA
Unicode hex code / decimal 02BB / 699
Character ̄
LC-ALA Name macron
USMARC hex code E5
Unicode Name COMBINING MACRON
Unicode hex code / decimal 0304 / 772
Ā LATIN CAPITAL LETTER A WITH MACRON 0100 / 256
ā LATIN SMALL LETTER A WITH MACRON 0101 / 257
Ō LATIN CAPITAL LETTER O WITH MACRON 014C1 / 332
ō LATIN SMALL LETTER O WITH MACRON 014D / 333
Ī LATIN CAPITAL LETTER I WITH MACRON 012A / 298
ī LATIN SMALL LETTER I WITH MACRON 012B / 299
Ē LATIN CAPITAL LETTER E WITH MACRON 0112 / 274
ē LATIN SMALL LETTER E WITH MACRON 0113 / 275
Ū LATIN CAPITAL LETTER U WITH MACRON 016A / 362
ū LATIN SMALL LETTER U WITH MACRON 016B / 363
Ǣ LATIN CAPITAL LETTER æ WITH MACRON 01E2 / 482
ǣ LATIN SMALL LETTER æ WITH MACRON 01E3 / 483
Character ̌
LC-ALA Name hachek (hacek)
USMARC hex code E9
Unicode Name COMBINING CARON
Unicode hex code / decimal 030C / 780
Used in these precomposed characters:
č LATIN SMALL LETTER C WITH CARON 010D / 269
Č LATIN CAPITAL LETTER C WITH CARON 010C / 268
Character ̜
LC-ALA Name right cedilla
USMARC hex code F8
Unicode Name COMBINING LEFT HALF RING BELOW
Unicode hex code / decimal 031C / 796
Character ̛
LC-ALA Name none
USMARC hex code none
Unicode Name COMBINING HORN
Unicode hex code / decimal 031B / 795