­­Thai

[This document is for discussion, and should not yet be used as a reference.  It closely follows pages 200-215 of the LA-LC Romanization Tables, with annotations and typographic corrections by Doug Cooper, January 2006.]

 

Vowels and Dipthongs

Vernacular

Romanization

Conventional (Haas-style) Transcription [ED: added]

อะ, อั

a

a

อา

ā

aa

อำ

am

am

อิ

i

i

อี

ī

ii

อึ

ư

ʉ

อี

ư̄

ʉʉ

อุ

u

u

อู

ū

uu

เอะ, เอ็

e

eʔ, e

เอ

ē

ee

แอะ, แอ็

æ

ɛʔ, ɛ

แอ

ǣ

ɛɛ

โอะ,

o

oʔ, o

โอ

ō

oo

เอาะ

ɔʔ

ออ

ō̜

ɔɔ

เออะ

œ

əʔ

เออ, เอิ

œ̄

əə

เอียะ

ia

iaʔ

เอีย

īa

ia

เอือะ

ưa

ʉaʔ

เอือ

ư̄a

ʉa

อัวะ

ua

uaʔ

อัว,

ūa

ua

ใอ, ไอ, อัย, ไยอ

ai

ay

อาย

āi

aay

เอา

ao

aw

อาว

āo

aaw

อุย

ui

uy

โอย

ōi

ooy

ออย

ō̜i

ɔɔy

เอย

œ̄i

əəy

เอือย

ư̄ai

ʉay

อวย

ūai

uay

อิว

iu

iw

เอ็ว

eo

ew

เอว

ēo

eew

แอว

ǣo

ɛɛw

เอียว

īeo

iaw

rʉ

ri

ri

rœ̄

r

ฤๅ

rư̄

rʉʉ

lʉ

ฦๅ

lư̄

lʉʉ

 

Consonants

Vernacular

Initial /medial

Final

Conventional transcription  [ED: added]

 

k

k

k/k

 

, , , ,

kh

k

kʰ/k

 

ng

ng

ŋ/ŋ

 

čh

t

c/t

 

, ,

ch

t

cʰ/t

(LC/ALA includes ซ)

y

n

y/n

 

, ,

d

t

d/t

(See note 1)

,

t

t

t/t

 

, , , , ,

th

t

tʰ/t

(See note 1)

,

n

n

n/n

 

b

p

b/p

 

p

p

p/p

 

, ,

ph

p

pʰ/p

 

,

f

p

f/p

 

m

m

m/m

 

y

-

y/y

 

r

n

r/n

(See note 2)

,

l

n

l/n

 

w

-

w/w

 

, ทร, , ,

s

t

s/t

 

ʻ (ayn)

-

-/ʔ/ɔ

(See note 3)

,

h

-

h/-

(See note 4)

 

 

Notes

1.     is usually romanized th, occasionally d, depending on the pronunciation as determined from an authoritative dictionary.

2.     When follows another consonant and ends a syllable, it is romanized n, and the inherent vowel of the preceding consonant is represented by ō̜ (e.g. นคร nakhō̜n).

When รร follows another consonant, and no other pronounced consonant follows in the same syllable, it is romanized an ( e.g. สวรรค์ sawan), but if a pronounced consonant follows, it is represented by a (e.g. กรรม kam).

3.     In four common words occurs preceding another consonant to mark a certain tone and is then not romanized. [ED: อย่าง, อย่า, อยู่, อยาก]

4.     When occurs preceding another consonant to mark a certain tone, it is not romanized.

Rules of Application

1.     Tonal marks are not romanized.

2.     The symbol indicates omission and is shown in romanization by “…” the conventional sign for ellipsis.

3.     When the repeat symbol is used, the syllable is repeated in romanization.

4.     The symbol ฯลฯ is romanized la.

5.     Thai consonants are sometimes purely consonantal and sometimes followed by an inherent vowel romanized o, a, or ō̜ depending on the pronunciation as determined from an authoritative dictionary, such as the Royal Institute’s latest edition (1982). [ED: a new edition was published in 2004]

6.     Silent consonants, with their accompanying vowels, if any, are not romanized.

7.     When the pronunciation requires one consonant to serve a double function – at the end of one syllable and the beinning of the next – it is romanized twice according to the respective values.

8.     The numerals are ๐ (0), ๑ (1), ๒ (2), ๓ (3), ๔ (4), ๕ (5), ๖ (6), ๗ (7), ๘ (8), and ๙ (9).

9.     In Thai, words are not written separately.  In romanization, however, text is divided into words according to the guidelines provided in Word Division, below.

 

Word Division

1.  In general, Thai words formulated by romanization are made up of a single syllable (คำ) kham; ไทย Thai), and thus each syllable is considered a separate word, with a space between each.  (Exceptions are covered by rules 2 through 43.)  This is in contrast to may multisyllabic words that are foreign to Thai but that are found written in the Thai script.  These multisyllabic foreign words are written with the space closed up between the syllables as appropriate.  Prominent examples are words of Pali and Sanskrit origin, as well as some words that are Thai in origin but have been formed according to the grammar of Pali or Sanskrit.

Examples of monosyllabic Thai words:

คำ

kham

ไทย

Thai

พูด

phūt

 

Examples of multisyllabic Thai words formed according to the rules of other languages;

กระทรวง

krasūang

ภาษา

phāsā

ปัญญา

panyā

 

Examples of multisyllabic Thai words of Pali or Sanskrit origin:

วัฒนธรรม

watthanatham

มหาวิทยาลัย

mahāwitthayālai

กษัตริย์

kasat    [Ed: was กษัดริย์)

พลเมือง

phonlamư̄ng

ภารโรง

phānrōng

 

2.  In contrast to the preceding statement that Thai words are monosyllabic, note that there are multisyllabic Thai words in which the first syllable is used as a prefix; write the prefix and the succeeding element as a single word.

(a)  Words with การ (kān) prefixed:

การเดินทาง

kāndœ̄nthāng

การแปส

kānplǣ

การต่างประเทศ

kātāngprathēt

 

(b)  Words with ความ (khwām) prefixed:

ความจริง

khwāmčhing

ความหมาย

khwāmmāi

ความเห็น

khwāmhen

 

(c)  Miscellaneous cases with various words used as prefixes.  The most common are:

พ่อ

phō̜

 

เด็ก

dek

แม่

mǣ

 

ข้า

khā

ลูก

lūk

 

ราย

rāi

พี่

phī

 

ต้น

ton

น้อง

nō̜ng

 

ลาย

lāi

นาย

nāi

 

เครื่อง

khrư̄

นาง

nāng

 

แผน

phǣn

ข้อ

khō̜

 

ท้อง

thō̜ng

คำ

kham

 

ขี้

khī

บท

bot

 

ใจ

čhai

ผู้

phū

 

ช่าง

chāng

นัก

nak

 

วัย

wai

คน

khon

 

ดวง

dūang

ชาว

chāo

 

หมอ

mō̜

 

Note that the listing of miscellaneous cases covers only the most common ones.  Other, less common cases may be handled the same way.

บุญ                                             bun

 

Note also that some words, reflecting a transposition in normal Thai word order and consisting of a principal word and one or more words used with it as a prefix, may be considered as belonging to this category.

ราชบัณฑิตยสถาน                         Rātchabandittaysathān

โบราณคดีวิทยา                             bōrānnakhadīwitthayā

ไทยคดีศึกษา                                Thaikhadīsưksā

 

3.  Compounds.  Write compounds as a single word.

(a)  General:  Identifying a compound is largely a matter of knowledge of the language together with the use of good judgement.  Note that compounds generally result in concepts to one degree or another different from the meaning of either of the component words when used alone.

ใกล้ชิด                                               klaichit

เข้มงวด                                              khēmngūat

ภายนอก                                             phāinō̜k

ชัดเจน                                               chatčhēn

ชั่วคราว                                              chūakhrāo

กล้าหาญ                                            klāhān

ค้นหา                                                khonhā

ทดลอง                                              thotlō̜ng

มองดู                                                 mō̜ngdū

อดทน                                                ʻotthon

กลกงแจ้ง                                           klāngčhǣng

ครบถ้วน                                             khropthūan

เกี่ยวข้อง                                            kīeokhō̜ng

หมู่บ้าน                                              mūbān

รถไฟ                                                 rotfai

เงินเดือน                                            ngœ̄ndư̄an

จัดทำ                                                čhattham

รับใช้                                                 rapchai

บอกรับ                                              bō̜krap

ต่อสู้                                                  tō̜sū

รบกวน                                               ropkūan

สุดท้าย                                              sutthāi

ผลไม้                                                phonlamai

เสื้อผ้า                                               sư̄aphā

ตนเอง                                               tonʻēng

พดคุย                                                phūtkhui

ไปเยี่ยม                                             paiyīam

ตีพิมพ์                                                tīphim

จัดพิมพ์                                              čhatphim

 

N.B.:  Do not consider as compounds repeated words sometimes referred to as “reduplicated compounds.”                                                  

ต่าง ๆ                                          tāng tāng

ช้า ๆ                                            chā chā

เร็ว ๆ                                           reo reo

                                                 

(b) Reduplicated Doublets:  When words are strung together for sound, write them as a single word.

เปลี่ยนแปลง                                 plīanplǣng

เรียบร้อย                                      rīaprō̜i

อึกทึก                                          ʻưkkathưk

รอบคอบ                                      rō̜phkhō̜p

 

4.  Geographical Names.  Divide geographical names into separate words according to the decision of the U.S. Board on Geographic Names, as expressed in the Gazetteer of Thailand. 

[Ed.:  these may be found at:

http://earth-info.nga.mil/gns/html/cntry_files.html

http://earth-info.nga.mil/gns/html/cntyfile/th.zip  ]

 

5.  Royal Language (rāchāsap).  Write as a separate word any word found in an entry in either of the following dictionaries unless otherwise directed by these rules.

Rāchāsap chabap sombūn / Rāchamānop.  (Bangkok: Kāoanā, 1965)

Rāchāsap chabap sombūn / Sangūan ʻĀnkhong.  (Bangkok: Kāoanā, 1964)

 

6.  Generally separate all elements in terms of rank, privilege, address, etc., associated with names of persons unless another rule directs otherwise.

นายทหารตำรวจ                            Nāithahān Tamrūat

ผู้ช่วยศาสตราจารย์                     Phūchūai Sāttrāčhān

หม่อมราชวงศ์                           Mō̜m Rātchawong

รองอำมาตย์โท                         Rō̜ng ʻAmāt Thō

พลตำรวจเอก                           Phon Tamruāt ʻĒk

พระมหา                                 Phra Mahā

รองประธานาธิบดี                       Rō̜ng Prathānāthibō̜di

พระปรมินทรมหา                       Phraparaminthra Mahā

พระเทพรัตนราชสุดาฯ                  Phrathēprattanarāthasudā

    สยามบรมราชกุมารี                    Sayāmbō̜rommarātchakumārī

พระบาทสมเด็จพระเจ้าอยู่หัว          Phrabāt Somdet Phračhaoyūhūa

พระนางเจ้าพระบรมราชินีนาถ         Phranāng Čhao Phrabō̜rommarāchinī Nāt

                                                           

One arbiter of whether official pronunciations of royal ranks with กรม (Krom) requires an extra syllable is Photčhanānukrom nakrīan chalœ̄m phrakīat, Phō̜. Sō̜. 2530, 2nd edition, 1988, p. 329.  This officially approved work is based on proclamations of the Prime Minister’s Office as well as on the Royal Institute’s 1982 dictionary.

กรมพระยา                                    Krom Phrayā

but   กรมหลวง                               Krommalūang

 

7.  Generally combine elements (covered by terms described in 6, above) which begin with เจ้า (Čhao) and combine elements in ท่าผู้ญิง (Thānphūying), เจ้าจอมมารดา (Čhaočhō̜mmāndā), and  พระเจ้าอยู่หัว (Pračhaoyūhūa).

เจ้านาย                                        Čhaonāi

เจ้าของ                                  Čhaokhō̜ng

เจ้าฟ้า                                   Čhaofā

เจ้าพระยา                               Čhaophrayā

ท่านผู้หญิง                              Thānphūying

เจ้าจอมมารดา                          Čhaočhō̜mmāndā

พระเจ้าอยู่หัว                            Phračhaoy_hūa

but   เจ้าฟ้าหญิง                        Čhaofā Ying

เจ้าฟ้าชาย                              Čhaofā Chāi

พระองค์เจ้าชาย                        Phraʻong Čhao Chai

หม่อมเจ้าหญิง                          Mō̜m Čhao Ying

เจ้าเมืองแปร                            Čhao Mư̄ang Prǣ

 

8.  Generally separate elements in personal royal titles and corporate names beginning with กรม (Krom) except as listed below.  For these excepted cases only, although pronunciation with or without the extra syllable is correct in popular usage, proclamations of the Prime Minister’s Office in recent years have approved pronounications with the extra syllable (effectively combining the elements) as the only officially correct pronunciations.

กรมพระ                                       Krommaphra

กรมหลวง                                Krommalūang

กรมหมื่น                                 Krommamư̄n

กรมวัง                                   Krommawang

กรมท่า                                   Krommathā

but   กรมพระยา                         Krom Phrayā

 

9.  Keep separate the Buddhist samanasak ranks พระมหา (Phra Mahā) and พระครู (Phra Khrū) as well as the conventional religious terms of address พระ (Phra) and พระอาจารย์ (Phra ʻĀčhān).

พระมหาประยุทย์                           Phra Mahā Prayut

พระครูเลิศ                               Phra Khrū Lœ̄t

พระสมหวัง                              Phra Somwang

พระอาจารย์สมหวัง                     Phra ʻĀčhān Somwang

 

10.  พระ (Phra) should be separate as follows:

(a) When connoting the Buddha, his image, a member of the Buddhist Order of the Sangha, etc.;

(b) As the only element or one of the elements in a separately written conferred rank, or;

(c) As an independent (complimentary, conventional, etc.) element immediately preceding a personal name (except the name of Buddha) but not an integral part of it.  Otherwise, it should be written as a combined prefix to words (usually associated with royalty, gods, object of worship, etc.).

พระแวมรกด                                  Phra Kǣo Mō̜rakot

พระสยามเทวาธิราช                    Phra Sayāmmathēwāthirāt

พระอาจารย์สมหวัง                     Phra ʻĀčhān Somwang

พระอภัยมณี                             Phra ʻAphaimanī

พระมหาประยุทย์                       Phra Mahā Prayut

พระครูเลิศ                               Phra Khrū Lœ̄t

กรมพระมหิดล                           Krom Phra Mahidon

พระพุทธยอดฟ้าจุฬาโลก              Phra Putthayō̜tfā Čhulālōk

พระนั่งเกล้าเจ้าอยู่หัว                   Phra Nangklao Čhaoyūhūa

สมเด็จพระวรรณรัตน์                   Somdet phra Wannarat

but   พระพทธเจ้า                       Phraphutthačhao

พระปรมินทรมหามงกุฎ                 Phraparaminthra Mahā Mongkut

กรมพระมหิดล                           Krommaphra Mahidon

กรมพระราชวังบวร                      Krom Phrarātchawangbō̜wō̜n

พระสังฆราช                             Phrasangkharāt

 

11.  มหา (Mahā) should be separate when as an independent (complimentary, conventional, etc.) element it immediately precedes and is not an integral part of a personal name.  Otherwise, it should be treated as specified in paragraph 12, below.

พระปรมินทรมหามงกุฎ                    Phraparaminthra Mahā Mongkut

พระปรมินทรมหาภูมิพลอดุลยเดช      Phraparaminthra Mahā Phūmiphon ʻAdunlayadēt

มหาธาตุ                                       mahāthāt      

 

12.  พระมหา (Phra Mahā) is a samanasak rank conferred on a lower-level Buddhist religious [sic] who has finished at least the third grade of parīan (Buddhist theology).  It should not be confused with มหา- (mahā) or พระมหา- (phramahā-), which are prefixes added to words associated with royalty, religious [sic], gods, objects of worship, etc., such as titles of the supreme patriarch.  The rank should be written separately; the prefix, combined.

พระมหาประยุทย์                           Phra Mahā Prayut

พระมหาสังฆราชเจ้า                       Phramahāsangkhrāt Čhao

พระมหาสมณเจ้า                           Phramahāsamančhao

มหาเถระ                                      Mahāthēra

 

13.  Titles of honor with เจ้า (čhao) as the last element should be written separately or combined in accordance with whether the immediately preceding element is commonly used as a prefix.

พระองค์เจ้า                                  Phraʻong Čhao

พระสังฆราชเจ้า                         Phrasangkharāt Čhao

พระพุทธเจ้า                             Phraphutthačhao

พระมหาสมณเจ้า                       Phramahāsamanačhao

พระนางเจ้า                              Phranāng Čhao

พระเจ้าวรวงศ์เธอพระองค์เจ้า         Phračhao Wō̜rawongthœ̄ Phraʻong Čhao

 

14.  Combine หลวน (Lūang) when used as a simple (non-conferred) title in combination preceding words for relatives supposed to be Buddhist priests.

หลวงพ่อ                                      Lūangphō̜

หลวงพี่                                  Lūangphī

หลวงพ่อปู่                               Lūangphō̜pū

หลวงลุง                                 Lūanglung

 

15.  Generally separate คุณ (Khun) as first element, except in the courtesy titles คุณหญิง (Khunying) and คุณนาย (Khunnāi).

คุณแม่                                         Khun Mǣ

คุณพ่อ                                   Khun Phō̜

คุณหนู                                   Khun Nū

but   คุณหญิง                           Khunying

คุณนาย                                  Khunnāi

 

16.  Combine elements in personal pronouns or their equivalents.

ข้าพระพุทธเจ้า                              khāphraphutthačhao

ข้าพเจ้า                                  khāphačhao

หม่อมฉัน                                mō̜mchan

กระผม                                   kraphom

ใต้ฝ่าละอองธุลีพระบาล                taifālaʻō̜ngtulīphrabāt

 

17.  Elements in royal or noble titles and names are generally combined but should be separate when two distinct terms can be isolated in a noun/modifier or noun/noun-in-apposition configuration if the terms would not otherwise be combined, or if there is doubt about whether to combine them.

ดำรงราชานุภาพ                            Damrongrāchānuphāp

ปราสาททอง                            Prāsāt Thō̜ng

พุทธยอดฟ้าจุฬาโลก                   Phutthayō̜tfā Čhulālōk

พุทธเลิดหล้านภาลัย                    Phutthalœ̄tlā Naphālai

ตากสิน                                   Tāk Sin

 

18.  Elements ordinarily combined should be separate when immediately followed by a proper name or its substitute.

แม่ทัพใหญ่                                   Mǣthap Yai

รองแม่กองงานพระธรรมทูต           Rō̜ng Mǣ Kō̜ng Ngān Phrathammathūt

เจ้าอาวาส                               čhaoʻāwāt

เจ้าคณะภาค ๗                          Čhao Khana Phāk 7

นายสุชาติ                               Nāi Suchāt

เจ้าเมืองแปร                            Čhao Mư̄ang Prǣ

เจ้าเมือง                                 čhao mư̄ang

 

19.  นาย (Nāi) before a proper name as a bandāsak or roughly equivalent to Mister should be separate.  Otherwise, it is combined as a prefix in accordance with paragraph 2.(c) above.

นายสชาติ                                     Nāi Suchāt

นายร้อย                                 Nāirō̜i

นายทหารตำรวจ                        Nāithahān Tamrūat

นายแพทย์ปรัดเลย์                     Nāiphǣt Pratlē

นายพิทักษ์ราชา (โจ)                  Nāi Phithakrāchā (Čhō)

 

20.  In cases of doubt about whether miscellaneous words listed under 2.(c) above are functioning as prefixes, generally separate elements unless sufficient conventional usage has bestowed word status on the configuration.  Always separate demonstrative adjectives, relative pronouns, and numerals from the first element.

คนพ้นคุก                                      khon phon khuk

ผู้ก่อการร้าย                             phūkō̜kānrāi

คนนั้น                                    khon nan

ผู้ลี้ภัย                                    phūlīphai

เครื่องนี้                                  khrư̄ang nī

ข้อหนึ่ง                                  khō̜ nưng

but   คนสีเทา                           khonsīthao

 

21.  Combine elements in colors, days of the week, but not months of the year.

สีเหลือง                                       sīlư̄ang

วันจันทร์                                 Wančhan

เดือนพฤศจิกายน                       Dư̄an Phrưtsačhikāyon

 

22.  Combine numerals in the same way as in English; i.e., combine teens, combine first elements, and separate from the digital element if any in twenty through ninety-nine, etc.  Separate ที่ (thī) in ordinals.

สิบสาม                                        sipsām

ยี่สิบสอง                                 yīsip sō̜ng

ร้อยเอ็ด                                  rō̜i ʻet

วันที่สิบเจ็ด                              wan thī sipčhet

 

23.  Generally separate royal introductory verbs and verbs indicating royal courtesy, but combine elements in conventional phrases of courtesy.

ทรงประกอบพิธีเปิด                        song prakō̜p phithī pœ̄t

ทรงพระเจริญ                                song phračharœ̄n

ทรงพระกรุณาโปรดเกล้า               song phrakarunā prōt klao

ขอบใจ                                   khō̜pčhai

 

24.  In most cases separate หลาย (lāi), ชั่ว (chūa), ทั่ว (thūa), ทุก (thuk), ทั้ง (thang), บาง (bāng), ต่าง (tāng), etc., preceding words.

ทั้งประเทศ                                   thang prathēt

ทั่วราชอาณาจักร                       thūa rātchaʻānāčhak

ชั่วชีวิต                                   chūa chīwit

บางคราว                                bāngkhrāo

ทุกสิ่ง                                    thuk sing

ต่างมารดา                               tāng māndā

หลายคน                                 lāi khon

But   ชั่วคราว                            chūakhrāo

ทั่วไป                                    thūapai

ทั้งหมด                                  thangmot

ชั่วโมง                                   chūamōng

ต่างประเทศ                             tāngprathēt

 

25.  Generally separate งาน (ngān) preceding a word or phrase except in cases denoting literary or research activity when only two elements are present.

งานพระราชทานเพลิงศพ                 ngān phrarātchathān plœ̄ng sop

งานธุรกิจ                                ngān thurakit

งานเขียน                                ngānkhīan

งานวิจัย                                  ngānwičhai

 

26.  Combine or separate the following miscellaneous phrases as shown.

เนื่องใน                                        nư̄ang nai

ว่าด้วย                                   wādūai

ร่วมกับ                                   rūam kap

ครบรอบ                                 khrop rō̜p

พร้อมด้วย                               phrō̜m dūai

ตนเอง                                   tonʻēng

เนื่องจาก                                nư̄angčhāk

แค่ไหน                                  khǣ nai

ล่วงหน้า                                 lūangnā

เบื้องต้น                                 bư̄angton

ต่อไป                                    tō̜pai

ตั้งแต่                                    tangtǣ

จนกระทั่ง                                čhonkrathang

จนถึง                                    čhon thưng

 

27.  Combine ตะวัน (tawan) not เฉียง (chīang) in compass points.

ตะวันออกเฉียงเหนือ                       tawanʻō̜k chīang nư̄a

ตะวันตกเฉียงใต้                        tawantok chīang tai

ตะวันตกเฉียงเหนือ                     tawantok chīang nư̄a

ตะวันออกเฉียงใต้                       tawanʻō̜k chīang tai

 

28.  Generally separate geographical designations with เมือง (mư̄ang).

เมืองเหนือ                                    mư̄ang nư̄a

เมืองใต้                                  mư̄ang tai

but   เมืองนอก                          mư̄angnō̜k

 

29.  When ความ (khwām) is used in the legal context meaning “case” or “matter,” it should be separate.

ความแพ่ง                                     khwām phǣng

ความอาญา                                   khwām ʻāyā

 

30.  These elements equivalent to English hyphenated adjectival phrases (not clauses) should be combined although kept separate from any noun (not included under paragraph 2.(c)) that they might modify, the latter clause applying only to phrases that are clearly adjectival in nature and not including the phrase words whose role Thai syntax makes doubtful.

หนังสือปกสีขาว                             nangsư̄ poksīkhāo

เรือชายฝั่งทะเล                         rư̄a chāifangthalē

ข้าวประดับดิน                           khāopradpdin

สินค้าส่งออก                            sinkhāsongʻō̜k

พ่อค้าส่งออก                            phō̜khāsongʻō̜k

การเจรจาการค้าหลายฝ่าย            kānčhēnračhā kānkhā lāifāi

 

31.  Many phrases consisting of predicate and object have attained single word status.  But if there is doubt tht the elements have attained single word status, do not combine them unless 30, above applies.

ประเมินผล                                    pramœ̄phon

ทำงาน                                   thamngān

วางแผน                                 wāngphǣn

อวยพร                                   ʻūaiphō̜n

but   การย้ายถิ่น                        kānyāi thin

การย้ายถิ่นฐาน                         kānyāi thinthān

ถิ่นใต้                                    thin tai

 

32.  Generally separate phrases with ส่วน (sūan).

ส่วนพระองด์                                 sūan praʻong

ส่วนพลเมือง                            sūan phonlamư̄ang

but   ส่วนตัว                             sūantūa

ส่วนรวม                                  sūanrūam

 

33.  Phrases with words indicating buildings as first element are generally combined.

หอศิลปะ                                      hō̜sinlapa

ห้องประชุม                              hō̜ngprachum

โรงพิมพ์                                 rōngphim

หอสมุด                                  hō̜samut

โรงเรียน                                 rōngrīan

 

34.  For terms not of rank, privilege, address, etc., generally do not combine elements that might otherwise be candidates for combining when the second element is a proper name unless the first element appears in the list under 2.(c) above.  Nevertheless, capitalize the first element in any case.

หอภูมิพล                                      Hō̜ Phūmiphon

รถเบ็นซ์                                       Rot Ben

คัมภีร์พระเวท                           Khamphī Phrawēt

         But   คนไทย                                   Khonthai

 

 

35.  For phrases consisting of a verb and งาน (ngān), generally do not combine.

ประสานงาน                                  prasān ngān

รวมงาน                                  rūam ngān

ปฏิบัติงาน                               patibat ngān

but   ทำงาน                             thamngān

 

36.  (rūam) as initial or final element should generally be separate.

รวมเล่ม                                        rūam lēm

รวมอยู่ด้วย                              rūam yū dūai

but   ส่วนรวม                            sūanrūam

 

37.  Keep separate elements that purport to be translated phrases from other languages.

นครวัด                                         Nakhō̜n Wat

สยามสแควร์                                 Sayām Sakhwǣ

 

38.  Generally, when applying word division rules, retain word division appearing in the Thai script only if there is doubt about the exact mean[ing] of the configuration.  Otherwise, ignore the division in Thai script.

โครงการ พุทธ-ไทย ปริทรรศน์         Khrōngkān Phut-Thai Parithat

 

39.  Phrases beginning with น่า () should only be combined if convention has conferred word status on the configuration.

 

น่าเสียดาย

nāsīadāi

 

น่าสนใจ

nāsončhai

but

น่าจับตา

nā čhap tā

 

น่ารับรอง

nā raprō̜ng

 

40.  Separate words beginning with ทหาร (thahān) for military, etc.

ทหารบก                                      thahān bok

ทหารเรือ                                thahān rư̄a

ทหารอากาศ                            thahān ʻākāt

ทหารตำรวจ                             thahān tamrūat

 

41.  Combine the generic element with all elements of a name for plants, animals, vegetables, etc.

นกขุนทอง                                    nokkhunthō̜ng

แตงกวา                                 tǣngkwā

สุนัขจิ้งจอก                              sunakčhingčhhō̜k

ผักกาดหัว                               pakkāthūa

ต้นหมาก                                 tonmāk

 

42.  For diseases, combine the generic term โรค (rōk) only if it appears as the final element of the configuration.

กาฬโรค                                       kānlarōk

กามโรค                                  kāmmarōk

โรคมะเร็ง                                rōk marēng

โรคโลหิตน้อย                           rōk lōhit nō̜i

โรคทรพิษ                               rōk thō̜raphit

อหิวาตกโรค                             ʻahiwātakarōk

โรคฝีดาษ                               rōk fīdāt

 

43.  Combine adjectival phrases with ใจ (čhai) as final element.

ร้อนใจ                                         rō̜nčhai

เกรงใจ                                   krēngčhai

สุขภาพใจ                               sukkhaphāpčhai

ดีใจ                                      dīčhai

 

 

Special Characters and Character Modifiers used in Romanization
(See the MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media / CHARACTER SETS: Part 3 / Code Tables / January 2000, updated September 2004)

http://www.loc.gov/marc/specifications/specchartables.html
http://lcweb2.loc.gov/cocoon/codetables/45.html  (Extended Latin)

http://www.atla.com/tsig/LatinCharacters/Latin%20Characters%20in%20Unicode%20and%20MARC-8.pdf  (full set of examples)

 

Character                                             Æ

LC-ALA Name                                    digraph æ (upper case)

USMARC hex code                             A5

Unicode Name                                     LATIN CAPITAL LETTER æ

Unicode hex code / decimal                00C6 / 198

 

Character                                             Œ

LC-ALA Name                                    digraph œ (upper case)

USMARC hex code                             A6

Unicode Name                                     LATIN CAPITAL LIGATURE œ

Unicode hex code / decimal                0152 / 338

 

Character                                            

LC-ALA Name                                    digraph ae (lower case)

USMARC hex code                             B5

Unicode Name                                     LATIN SMALL LETTER æ

Unicode hex code / decimal                00E6 / 230

 

Character                                             œ

LC-ALA Name                                    digraph oe (lower case)

USMARC hex code                             B6

Unicode Name                                     LATIN SMALL LIGATURE œ

Unicode hex code / decimal                0153 / 339

 

Character                                             Ư

LC-ALA Name                                    U-hook (upper case)

USMARC hex code                             AC

Unicode Name                                     LATIN CAPITAL LETTER U WITH HORN

Unicode hex code / decimal                01AF / 431

 

Character                                             ư

LC-ALA Name                                    u-hook (lower case)

USMARC hex code                             BD

Unicode Name                                     LATIN SMALL LETTER U WITH HORN

Unicode hex code / decimal                01B0 / 432

 

Character                                             ʻ

LC-ALA Name                                    ayn

USMARC hex code                             B0

Unicode Name                                     MODIFIER LETTER TURNED COMMA

Unicode hex code / decimal                02BB / 699

 

Character                                                        ̄

LC-ALA Name                                    macron

USMARC hex code                             E5

Unicode Name                                     COMBINING MACRON

Unicode hex code / decimal                0304 / 772

Ā LATIN CAPITAL LETTER A WITH MACRON 0100 / 256

ā LATIN SMALL LETTER A WITH MACRON 0101 / 257

Ō LATIN CAPITAL LETTER O WITH MACRON 014C1 / 332

ō LATIN SMALL LETTER O WITH MACRON 014D / 333

Ī LATIN CAPITAL LETTER I WITH MACRON 012A / 298

ī  LATIN SMALL LETTER I WITH MACRON 012B / 299

Ē LATIN CAPITAL LETTER E WITH MACRON 0112 / 274

ē LATIN SMALL LETTER E WITH MACRON 0113 / 275

Ū LATIN CAPITAL LETTER U WITH MACRON 016A / 362

ū LATIN SMALL LETTER U WITH MACRON 016B / 363

Ǣ LATIN CAPITAL LETTER æ WITH MACRON 01E2 / 482

ǣ LATIN SMALL LETTER æ WITH MACRON 01E3 / 483

 

Character                                             ̌

LC-ALA Name                                    hachek (hacek)

USMARC hex code                             E9

Unicode Name                                     COMBINING CARON

Unicode hex code / decimal                030C / 780

Used in these precomposed characters: 

č LATIN SMALL LETTER C WITH CARON 010D / 269

Č LATIN CAPITAL LETTER C WITH CARON 010C / 268

 

Character                                             ̜

LC-ALA Name                                    right cedilla

USMARC hex code                             F8

Unicode Name                                     COMBINING LEFT HALF RING BELOW

Unicode hex code / decimal                031C / 796

 

Character                                             ̛

LC-ALA Name                                    none

USMARC hex code                             none

Unicode Name                                     COMBINING HORN

Unicode hex code / decimal                031B / 795