"യു.ടി.എഫ്-8" എന്ന താളിന്റെ പതിപ്പുകൾ തമ്മിലുള്ള വ്യത്യാസം

(ചെ.) യന്ത്രം ചേര്‍ക്കുന്നു: ms:UTF-8
(ചെ.) പുതിയ ചിൽ, നൾ എഡിറ്റ് ...
വരി 1:
{{Prettyurl|UTF-8}}
[[യൂണികോഡ്|യൂണികോഡില്‍യൂണികോഡിൽ]] ഉപയോഗിക്കുന്ന ഒരു എന്‍കോഡിങ്ങ്എൻകോഡിങ്ങ് രീതിയാണ്‌ '''യു.ടി.എഫ്-8''' ('''UTF-8''')(8-bit UCS/Unicode Transformation Format). ഈ എന്‍കോഡിങ്ങ്എൻകോഡിങ്ങ് രീതിയനുസരിച്ച് യൂണികോഡിലുള്ള ഏതു ചിഹ്നങ്ങളെയും സൂചിപ്പിക്കുവാന്‍സൂചിപ്പിക്കുവാൻ കഴിയും മാത്രവുമല്ല ഇത് ആസ്കി (ASCII) എന്‍കോഡിങ്ങിനെഎൻകോഡിങ്ങിനെ ഉള്‍ക്കൊള്ളുന്നുമുണ്ട്ഉൾക്കൊള്ളുന്നുമുണ്ട്. അതിനാല്‍അതിനാൽ തന്നെ കമ്പ്യൂട്ടര്‍കമ്പ്യൂട്ടർ [[വിവരസാങ്കേതിക വിദ്യ|വിവരസാങ്കേതിക]] രംഗത്ത് നിലവില്‍നിലവിൽ ഏറ്റവും സ്വീകാര്യമായ എ‌ന്‍കോഡിങ്ങ്എ‌ൻകോഡിങ്ങ് രീതിയായി ഇത് മാറി. [[ഇ-മെയില്‍മെയിൽ]], വെബ് താളുകള്‍താളുകൾ,<ref name="GoogleUnicode">{{cite web | url=http://googleblog.blogspot.com/2008/05/moving-to-unicode-51.html | title=Moving to Unicode 5.1 | date=[[May 5]] [[2008]] | publisher=Official Google Blog| accessdate=2008-05-08}}</ref> തുടങ്ങി ക്യാരക്ടറുകള്‍ക്യാരക്ടറുകൾ ശേഖരിക്കുകയും കൈമാറ്റം ചെയ്യുകയും ചെയ്യുന്ന മേഖലകളില്‍മേഖലകളിൽ ഇത് ഉപയോഗിക്കപ്പെടുന്നു.
 
യു.ടി.എഫ്-8 ല്‍ ഓരോ ചിഹ്നത്തെയും ഒന്നും മുതല്‍മുതൽ നാല്‌ ഒക്ടെറ്റുകളിലായി (Octet, എട്ട് ബിറ്റുകളുടെ നിര അതായത് ഒരു [[ബൈറ്റ്]]) രേഖപ്പെടുത്തപ്പെടുന്നു. 128 യു.എസ്-ആസ്കി (US-ASCII) ക്യാരക്ടറുകള്‍ക്യാരക്ടറുകൾ മാത്രമാണ്‌ ഒരു ബൈറ്റിലായി രേഖപ്പെടുത്തപ്പെടുന്നത്. മറ്റുള്ളവ രണ്ട് മുതല്‍മുതൽ നാല്‌ ബൈറ്റുകളിലായി വിന്യസിക്കപ്പെടുന്ന. ഈ രീതിയില്‍രീതിയിൽ മലയാളം ക്യാരക്ടറുകള്‍ക്യാരക്ടറുകൾ രേഖപ്പെടുത്തുവാന്‍രേഖപ്പെടുത്തുവാൻ മൂന്ന് ബൈറ്റുകള്‍ബൈറ്റുകൾ വീതം ആവശ്യമാണ്‌.
{{Table Unicode}}
 
== വിവരണം ==
യൂണികോഡ് മാനദണ്ഡത്തില്‍മാനദണ്ഡത്തിൽ ഒരോ ക്യാരക്ടറിനും 32 ബിറ്റ് നീളമുള്ള കോഡ് നല്‍കിയിരിക്കുന്നുനൽകിയിരിക്കുന്നു. ഇതില്‍ഇതിൽ 0D00 മുതല്‍മുതൽ 0D7F വരെയുള്ള കോഡുകളാണ്‌ മലയാളത്തിന്‌ അനുവദിച്ചിരിക്കുന്നത്.
 
ആദ്യത്തെ 128 സ്ഥാനങ്ങള്‍സ്ഥാനങ്ങൾ ആസ്കി ക്യാരക്ടറുകള്‍ക്കുംക്യാരക്ടറുകൾക്കും നല്‍കിയിരിക്കുന്നുനൽകിയിരിക്കുന്നു, ഇതിന്‌ താഴ്ന്ന സ്ഥാനത്തുള്ള 7 ബിറ്റുകള്‍ബിറ്റുകൾ മാത്രം മതിയാകും. ഈ അവസരത്തില്‍അവസരത്തിൽ ഒരു കോഡ് ഒരു ബൈറ്റായി എന്‍കോഡ്എൻകോഡ് ചെയ്യുന്നു ഈ അവസരത്തില്‍അവസരത്തിൽ ഏറ്റവും ഉയര്‍ന്നഉയർന്ന സ്ഥാനത്തുള്ള ഒരു ബിറ്റ് 0 ആയിരിക്കും. പട്ടികയില്‍പട്ടികയിൽ ആദ്യത്തെ വരിയില്‍വരിയിൽ ഇത് കാണിച്ചിരിക്കുന്നു. U+0000 മുതല്‍മുതൽ U+007F വരെയുള്ള ക്യാരക്ടറുകളാണ് ഇവ. അതിനാല്‍അതിനാൽ ആസ്കി ക്യാരക്ടറുകളെല്ലാം ഒരു ബൈറ്റില്‍ബൈറ്റിൽ ഉള്‍കൊള്ളിക്കുന്നുഉൾകൊള്ളിക്കുന്നു.
 
താഴ്ന്ന ഏഴ് ബിറ്റുകള്‍ക്ക്ബിറ്റുകൾക്ക് പുറമേ ശേഷം 11 സ്ഥാനം വരെയുള്ള ബിറ്റുകള്‍ബിറ്റുകൾ ഉപയോഗിക്കുന്ന U+0080 മുതല്‍മുതൽ U+07FF വരെയുള്ള കോഡുകള്‍കോഡുകൾ രണ്ട ബൈറ്റുകളിലായി വിന്യസിക്കപ്പെടുന്നു. ആദ്യത്തെ ബൈറ്റില്‍ബൈറ്റിൽ ആറ് താഴ്ന്ന സ്ഥാനങ്ങളിലും രണ്ടാമത്തെ ബൈറ്റില്‍ബൈറ്റിൽ താഴന്ന അഞ്ച് സ്ഥാനങ്ങളിലും ഇവ ചേര്‍ക്കുന്നുചേർക്കുന്നു. പട്ടികയില്‍പട്ടികയിൽ രണ്ടാമത്തെ വരിയില്‍വരിയിൽ ഇത് കാണിച്ചിരിക്കുന്നു. ഇതേ പ്രകാരം U+0800 മുതല്‍മുതൽ U+FFFF വരെയുള്ളവ മൂന്ന് ബൈറ്റുകളിലായും അതിന്‌ ശേഷമുള്ളവ നാല് ബൈറ്റുകളിലായും വിന്യസിക്കപ്പെടുന്നു. പട്ടിക ശ്രദ്ധിക്കുക.
 
:
വരി 50:
|}
 
ആദ്യത്തെ 128 ആസ്കി ക്യാരക്ടറുകള്‍ക്യാരക്ടറുകൾ അതേപടി ചേര്‍ക്കുന്നതിനാല്‍ചേർക്കുന്നതിനാൽ എല്ലാ ആസ്കി ലേഖനങ്ങളും യു.ടി.എഫ്-8 എ‌ന്‍കോഡിങ്ങുമായിഎ‌ൻകോഡിങ്ങുമായി പൊരുത്തമുള്ളവയായിരിക്കും. യു.ടി.എഫ്-8 എന്‍കോഡ്എൻകോഡ് ചെയ്യപ്പെട്ട ലേഖനം തിരിച്ചു ഡീകോഡ് ചേയ്യുന്ന വളരെ ലളിതമാണ്‌. ഒരു ബൈറ്റിന്റെ ഉയര്‍ന്നഉയർന്ന ബിറ്റ് 0 ആണെങ്കില്‍ആണെങ്കിൽ അത് ഒരു ബൈറ്റ് മാത്രമുള്ള ക്യാരക്ടര്‍ക്യാരക്ടർ (ഒരു ആസ്കി ക്യാരക്ടര്‍ക്യാരക്ടർ) ആയിരിക്കും. ആദ്യത്തെ ഉയര്‍ന്നഉയർന്ന രണ്ട് ബിറ്റുകളുടേയും മൂല്യം 1 ആണെങ്കില്‍ആണെങ്കിൽ രണ്ട് ബൈറ്റുകളിലായി എന്‍കോഡ്എൻകോഡ് ചെയ്യപ്പെട്ടതാണ്‌ അതിനാല്‍അതിനാൽ അടുത്ത ബൈറ്റ്കൂടി വായിക്കേണ്ടതുണ്ട്. ഇതേ പ്രകാരം ഉയര്‍ന്നഉയർന്ന മൂന്നോ നാലോ ബിറ്റുകളുടെ മൂല്യം 1 ആണെങ്കില്‍ആണെങ്കിൽ യഥാക്രമം അവ മൂന്ന്, നാല് ബൈറ്റുകളിലായി എന്‍‌കോഡ്എൻ‌കോഡ് ചെയ്യപ്പെട്ടതാണ്‌.
 
== അവലംബം ==
<references/>
 
[[വർഗ്ഗം:എൻകോഡിങ്ങ് രീതികൾ]]
[[വര്‍ഗ്ഗം:എന്‍കോഡിങ്ങ് രീതികള്‍]]
 
[[ar:صيغة التحويل الموحد-8]]
"https://ml.wikipedia.org/wiki/യു.ടി.എഫ്-8" എന്ന താളിൽനിന്ന് ശേഖരിച്ചത്