khmer-ocr

Khmer OCR

November 17, 2014
Convert scanned Khmer documents into Khmer Unicode using KhmerOCR.org There have been many attempts at creating a viable solution for converting scanned Khmer text into Khmer Unicode, but all have fallen short of actually being useful. But KhmerOCR.org utilizes machine learning, and with additional training data provided by volunteers it can “learn” to convert new fonts with very high accuracy. This makes the solution flexible and viable because non-programmers can “teach” the software to correctly convert a scanned document into Khmer Unicode. VISIT: KhmerOCR.org    
Read More
Screen Shot 2014-10-16 at 9.38.29 AM

Have you ever wonder how to use hyphenation in Khmer?

October 16, 2014
Here is some help how to use ​រជ្ជុសញ្ញា យតិភង្គ ឬ​ក៏​នយសញ្ញា (—)   In the book «វិធីប្រើ វណ្ណយុត្តិ នឹង​ខណ្ឌសញ្ញា» authored by ​លោកគ្រូ នួន ប៊ុត he made the following observations: Download “Nuan-Bout on Khmer Hyphenation” Khmer-Hyphenation-Nuan-Bout.pdf – Downloaded 56 times – 1 MB ការប្រើប្រាស់​រជ្ជុសញ្ញា   ក) សម្រាប់​ប្រើ​ច្រៀត​សេចក្ដី​ក្នុង​ប្រយោគ ខ) សម្រាប់​ប្រើ​គូស​ពី​មុខ​លេខរៀង រាប់​ខ​សេចក្ដី​ក្នុង​សៀវភៅ លក្ខន្ដិកៈ ប្រការ មាត្រា ឬ​អត្ថបទ​ណា​មួយ គ) សម្រាប់​ប្រើ​ក្នុង​ពាក្យ​និយាយ​ឆ្លើយ​ឆ្លង​គ្នា​ទៅ​វិញ​ទៅ​មក ឃ) សម្រាប់​ប្រើ​ដាក់​ខាង​ដើម ឬ​ខាង​ចុង​ព្យាង្គ​ណា​មួយ​ដែល​ត្រូវ​អាន​បំពេញ​តាម​លំនាំ​ស័ព្ទ​បន្ទាប់​ខាង​ដើម ឬ​ខាង​ចុង ង) សម្រាប់​ប្រើ​ដាក់​ចុង​បន្ទាត់ សំគាល់​ស័ព្ទ​ដែល​សរសេរ ឬ​បោះពុម្ព​ដល់​ចុង​បន្ទាត់​ហើយ ប៉ុន្តែ​មិន​ទាន់​អស់​ព្យាង្គ​នៅ​ឡើយ ត្រូវ​អាន​ភ្ជាប់​ទៅ​នឹង​ព្យាង្គ​ខាង​ដើម​បន្ទាត់​ជា​លំដាប់ (ឧ. ចំ—ណោម) ប៉ុន្តែ​មិន​ត្រូវ​ប្រើ​រជ្ជុសញ្ញា​បែប​ឲ្យ​ខូច​ព្យាង្គ​នៃ​ស័ព្ទ​ដូចជា ហើ—យ សរសេ—រ។ល។​ទេ ច) សម្រាប់​ប្រើ​គូស​ក្នុង​ការកត់ត្រា​គោត្តនាម និង​បកតិនាម   ការប្រើប្រាស់​យតិភង្គ ក) សម្រាប់​ប្រើ​ដាក់​ត្រង់​ចន្លោះ​សង្កាត់​ពាក្យ​មួយ​ម៉ាត់​ដែល​ផ្ដាច់​ចេញ​ដោយ​ខ្លួន​ពី​គ្នា ត្រង់​ចន្លោះ​ឃ្លា​គា​ថា កាព្យ ឃ្លោង   ការប្រើប្រាស់​នយសញ្ញា ក) សម្រាប់​ប្រើ​គូស​ក្រោម​ពាក្យ​ដែល​មាន​សេចក្ដី​ដូច​គ្នា​ពី​លើ​មក ខ) សម្រាប់​ប្រើ​គូស​ពី​ក្រោម​ពាក្យ​ដែល​ត្រូវ​ទន្ទេញ​ឲ្យ​ចាំ​មាត់ គ) ប្រើ​គូស​ក្រោម​ពាក្យ​សំខាន់​ណា​មួយ
Read More
download-all-khmer-fonts

Update: All Khmer Unicode Fonts Download

October 7, 2014
We just updated the “All-Khmer-Fonts” download package – it now includes 257 Khmer Unicode fonts! Download “All Khmer Unicode Fonts” All-Khmer-Fonts-9-26-14.zip – Downloaded 40750 times – 29 MB   Preview of all Khmer fonts: View this document on Scribd
Read More
Kampuchea_Veyakar_pdf

Usage of Diacritical Mark (ៈ)

August 12, 2014
Have you ever wonder when to use or not to use the diacritical mark (ៈ)? According to the book «កម្ពុជវេយ្យាករណ៍» authored by ខៀវ ជុំ in page 42-43 he said, ចំពោះ​ពាក្យ​បាលី​នឹង​សំស្ក្រឹត ដែល​មិន​មាន​ពាក្យ​ដទៃ​ភ្ជាប់​ខាង​ចុង គឺ​ពាក្យ​ដាច់​ពី​គ្នា​មួយ​បទៗ ត្រូវ​ប្រើ​យុគលពិន្ទុ ដូច «ថេរៈ គណៈ មរណៈ ព្យព្ជានៈ អវយវៈ» ពាក្យ​បាលីសំស្ក្រឹត​ដែល​នៅ​ខាង​ដើម​ព្យាង្គ​ក្នុង​បទ​មួយៗ ដូច «គណៈ មរណៈ» តួ «គ» នឹង «ម, រ» មិន​ត្រូវ​ប្រើ​យុគលពិន្ទុ​ទេ។ល។ តែ​បើ​មាន​ពាក្យ​ជាប់​គ្នា​ច្រើន​បទ​ដែល​ហៅ​ថា​បទសមាស* ធ្វើ​ឲ្យ​ព្យាង្គ​ដែល​ប្រើ​យុគលពិន្ទុ​នោះ មិន​មែន​ជា​ព្យាង្គ​ចុង មិន​ត្រូវ​ប្រើ​យុគលពិន្ទុ​ទេ​ដូច «ថេរសមាគម គណបតិ មរណភា» ជា​ដើម។ ត្រង់​នេះ​ត្រូវ​សង្កេត​ឲ្យ​ដឹង​ថា ពាក្យ​ណា​ជា​បទសមាស ពាក្យ​ណា​មិន​មែន​ជា​បទសមាស ដោយ​ល្អិតល្អន់​ដូច «គណបតិ» ពាក្យ​នេះ​ជា​មាស តែ​គណៈ​សង្ឃ​មិន​មែន​ជា​ពាក្យ​សមាស គឺ «គណ» ពាក្យ​មួយ «សង្ឃ» ពាក្យ​មួយ។  In page 64, he further wrote:តែ​បើ​មាន​ពាក្យ​មិនមែន​ជា​បទសមាស ជា​ពាក្យ​ដែល​មាន​ព្យាង្គ​ដោយ​ឡែក​ពី​គ្នា ត្រូវ​ចុច​កណ្ដាល ដូចជា គណៈមហានិកាយ គណៈធម្មយុត្តិ គណៈរដ្ឋមន្ត្រី ។ល។ *សមាស ( ន. ) [សៈម៉ាស ] ( សំ., បា. ) ការ​បង្រួម​ចូល; ការ​បំប្រួញ​ឲ្យ​ខ្លី, ឲ្យ​តិច​ចុះ, ឲ្យ​សង្ខេប ។ ព. វ. សព្ទ​តន្តិ​ភាសា​យ៉ាង​ដូច​បាលី​និង​សំស្ក្រឹត​ដែល​បំប្រួញ​បទ​តាំង​ពី​ពីរ​ឡើង​ទៅ​ឲ្យ​ជាប់​គ្នា​តែ​មួយ, ដូច​ជា : សមាន +...
Read More
Khmer spelling checker for Microsoft Word

Khmer Spelling Checker for Microsoft Word

For many years people have asked if SBBIC had developed a Khmer spelling checker for Microsoft Word, and today we are pleased to announce that we have! Download our free Khmer Spelling Checker for Microsoft Word 2010-2013 today! There are two versions of the add-in based on your version of Microsoft Word. If you have Word 32-bit, download the 32-bit installer, and if you have Word 64-bit, download the 64-bit installer (you can find out which version of Word you have by following these instructions: http://office.microsoft.com/en-001/support/am-i-running-32-bit-or-64-bit-office-HA010361023.aspx ). Download “SBBIC Khmer Spelling Checker for Microsoft Word 32-bit” SBBIC-Khmer-Spelling-Checker-32-bit-Office-Setup-1.0.zip – Downloaded 3965...
Read More