ഒപ്റ്റിക്കൽ കാരക്റ്റർ റെക്കഗ്നിഷൻ

(ഒപ്റ്റിക്കൽ ക്യാരക്റ്റർ റെക്കഗ്നിഷൻ എന്ന താളിൽ നിന്നും തിരിച്ചുവിട്ടതു പ്രകാരം)

സ്‌കാൻ ചെയ്ത ഡോക്യുമെന്റുകളിൽ നിന്ന് അച്ചടിച്ചതും കൈയ്യെഴുത്തുള്ളതുമായ അക്ഷരങ്ങൾ യാന്ത്രികമായി വേർതിരിച്ചെടുത്ത് മെഷീൻ എൻകോഡഡ് ടെക്സ്റ്റിലേക്ക് മാറ്റിയെടുക്കുന്നതിനുള്ള കമ്പ്യൂട്ടർ സങ്കേതമാണ് ഒപ്റ്റിക്കൽ ക്യാരക്റ്റർ റെക്കഗ്നിഷൻ അഥവാ ഒ.സി.ആർ. കടലാസ് വിവരസ്ത്രോതസ്സുകളായ ലിഖിത പ്രമാണങ്ങൾ, കച്ചവട രശീതികൾ, കത്തുകൾ അല്ലെങ്കിൽ മറ്റു അച്ചടിച്ച രേഖകളെ കമ്പ്യൂട്ടറിന് സ്വീകരിക്കാനുതകുന്ന വിധത്തിലുള്ള രൂപത്തിലാക്കാൻ ഈ സങ്കേതം വ്യാപകമായി ഉപയോഗിക്കുന്നു. അച്ചടിച്ച ഉള്ളടക്കങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനായുള്ള സാധാരണ ഉപയോഗിക്കുന്ന സമ്പ്രദായമാണിത്. ഇങ്ങനെ ചെയ്യുന്നതുകൊണ്ട് അവയിലെ വിവരങ്ങൾ ഇലക്ടോണിക്സ് സങ്കേതത്തിലൂടെ തിരയാനും, ഒതുങ്ങിയ രീതിയിൽ സംഭരിച്ച് സൂക്ഷിക്കാനും, ഓൺലൈനായി വായിക്കാനും, മെഷീൻ ട്രാൻസിലേഷൻ, ടെക്സ്റ്റ് ടു സ്പീച്ച്, ടെക്സ്റ്റ് മൈനിങ്ങ് തുടങ്ങിയ യാന്ത്രിക പ്രവർത്തികൾക്ക് ഉപയോഗിക്കുകയും ചെയ്യുന്നു. പാറ്റേൺ റെക്കഗ്നിഷൻ, കൃത്രിമബുദ്ധി (artificial intelligence), കമ്പ്യൂട്ടർ വിഷൻ എന്നിവ ഒ.സി.ആറിന്റെ ഗവേഷണ മേഖലയിലുൾപ്പെടുന്നു.[1]

ഒരു പോർട്ടബിൾ സ്കാനർ ഉപയോഗിച്ച് സ്കാനിംഗിന്റെയും തത്സമയ ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷന്റെയും (OCR) പ്രത്യേകതകൾ ചിത്രീകരിക്കുന്ന വീഡിയോ.

ആദ്യകാല വേർഷനുകളിലെല്ലാം ചിത്രങ്ങളിലെ ഓരോ അക്ഷരങ്ങൾക്കനുസരിച്ചും പ്രത്യേകം പ്രോഗ്രാമുകൾ എഴുതണമായിരുന്നു. കൂടാതെ ഒരു ഫോണ്ട് സെറ്റ് മാത്രമേ ഒരു സമയം പ്രവർത്തിച്ചിരുന്നുള്ളൂ.മിക്ക ഫോണ്ടുകളെയും കൃത്യതയോടെ തിരിച്ചറിയാനുള്ള ഇൻന്റലിജെൻസ് സിസ്റ്റം ഇപ്പോൾ സാധാരണമായി ലഭ്യമാണ്. യഥാർഥ സ്കാൻ ചെയ്ത പേജിനോട് കിടപിടിയ്ക്കുന്ന തരത്തിൽ, ചിത്രങ്ങളും കോളങ്ങളും മറ്റു ടെക്സ്റ്റ് ഇതരരൂപങ്ങളും പുനർനിർമ്മിക്കാൻ തക്ക ശേഷിയുള്ള ഒ.സി.ആർ സങ്കേതങ്ങൾ ഇന്ന് ലഭ്യമാണ്.

ആദ്യകാല പതിപ്പുകൾ ഓരോ കാരക്ടരിന്റെയും ചിത്രങ്ങൾ ഉപയോഗിച്ച് പരിശീലിപ്പിക്കേണ്ടതുണ്ട്, കൂടാതെ ഒരു സമയം ഒരു ഫോണ്ടിൽ പ്രവർത്തിക്കുകയും വേണം. മിക്ക ഫോണ്ടുകൾക്കും ഉയർന്ന അളവിലുള്ള തിരിച്ചറിയൽ കൃത്യത ഉൽപ്പാദിപ്പിക്കാൻ കഴിവുള്ള വിപുലമായ സംവിധാനങ്ങൾ ഇപ്പോൾ സാധാരണമാണ്, കൂടാതെ വൈവിധ്യമാർന്ന ഡിജിറ്റൽ ഇമേജ് ഫയൽ ഫോർമാറ്റ് ഇൻപുട്ടുകൾക്കുള്ള പിന്തുണയും ഉണ്ട്.[2] ചിത്രങ്ങൾ, കോളങ്ങൾ, മറ്റ് നോൺ-ടെക്‌സ്‌ച്വൽ കമ്പോണന്റ് എന്നിവയുൾപ്പെടെ ഒറിജിനൽ പേജിനെ ഏകദേശം കണക്കാക്കുന്ന ഫോർമാറ്റ് ചെയ്‌ത ഔട്ട്‌പുട്ട് പുനർനിർമ്മിക്കാൻ ചില സിസ്റ്റങ്ങൾക്ക് കഴിയും.

ചരിത്രം

തിരുത്തുക

ആദ്യകാല ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെഗ്നിഷൻ ടെലിഗ്രാഫിയും അന്ധർക്കായി വായനാ ഉപകരണങ്ങൾ സൃഷ്ടിക്കുന്നതും ഉൾപ്പെടുന്ന സാങ്കേതികവിദ്യകൾ രൂപപ്പെടുത്തി. 1914-ൽ ഇമ്മാനുവൽ ഗോൾഡ്‌ബെർഗ് അക്ഷരങ്ങൾ വായിക്കുകയും അവയെ സാധാരണ ടെലിഗ്രാഫ് കോഡാക്കി മാറ്റുകയും ചെയ്യുന്ന ഒരു യന്ത്രം വികസിപ്പിച്ചെടുത്തു.[3] അതേ സമയം, എഡ്മണ്ട് ഫോർണിയർ ഡി ആൽബ് ഒരു ഹാൻഡ്‌ഹെൽഡ് സ്‌കാനറായ ഒപ്‌ടോഫോൺ വികസിപ്പിച്ചെടുത്തു, അത് പ്രിന്റ് ചെയ്‌ത പേജിലുടനീളം നീക്കുമ്പോൾ, പ്രത്യേക അക്ഷരങ്ങൾക്കോ പ്രതീകങ്ങൾക്കോ അനുയോജ്യമായ ടോണുകൾ നിർമ്മിക്കുന്നു.[4][5]

1920-കളുടെ അവസാനത്തിലും 1930-കളിലും ഇമ്മാനുവൽ ഗോൾഡ്ബെർഗ് ഒരു ഒപ്റ്റിക്കൽ കോഡ് തിരിച്ചറിയൽ സംവിധാനം ഉപയോഗിച്ച് മൈക്രോഫിലിം ആർക്കൈവുകൾ തിരയുന്നതിനായി "സ്റ്റാറ്റിസ്റ്റിക്കൽ മെഷീൻ" വികസിപ്പിച്ചെടുത്തു. 1931-ൽ ഈ കണ്ടുപിടുത്തത്തിന് 1,838,389 എന്ന യുഎസ്എ പേറ്റന്റ് ലഭിച്ചു. പേറ്റന്റ് ഐബിഎം ഏറ്റെടുത്തു.

  1. OnDemand, HPE Haven. "OCR Document". Archived from the original on April 15, 2016.
  2. OnDemand, HPE Haven. "undefined". Archived from the original on April 19, 2016.
  3. Schantz, Herbert F. (1982). The history of OCR, optical character recognition. [Manchester Center, Vt.]: Recognition Technologies Users Association. ISBN 9780943072012.
  4. Dhavale, Sunita Vikrant (March 10, 2017). Advanced Image-Based Spam Detection and Filtering Techniques. Hershey, PA: IGI Global. p. 91. ISBN 9781683180142. Retrieved 27 September 2019.
  5. d'Albe, E. E. F. (1 July 1914). "On a Type-Reading Optophone". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. 90 (619): 373–375. Bibcode:1914RSPSA..90..373D. doi:10.1098/rspa.1914.0061.

പുറം കണ്ണികൾ

തിരുത്തുക