ऑप्टिकल कैरेक्टर रिकग्नीशन (OCR) ऐसा उपकरण है जिसके द्वारा कंप्यूटर किसी कागज पर लिखित, मुद्रित या टंकित पाठ को पढ़कर उसे कंप्यूटर पर टाइप किए जैसे पाठ में बदल देता है जिसे आसानी से संपादित भी किया जा सकता है।
इसका व्यापक रूप से उपयोग मुद्रित पेपर डेटा रिकॉर्ड की कंप्यूटर डेटा प्रविष्टि के लिए किया जाता है, जैसे पासपोर्ट दस्तावेज़, चालान, बैंक स्टेटमेंट, कंप्यूटरीकृत रसीदें, व्यावसायिक कार्ड, मेल, सांख्यिकी-डेटा के प्रिंट आउट आदि को पढ़ना। इसका उपयोग प्रिंट सामग्री को इलेक्ट्रॉनिक रूप से संपादित करने, खोजने, संग्रहीत करने, ऑनलाइन रूप से प्रदर्शित करने और मशीन संचालनों जैसे मशीन अनुवाद, टेक्स्ट-टू-स्पीच और टेक्स्ट माइनिंग में भी किया जाता है।
उपलब्ध विभिन्न ओसीआर:
टीडीआईएल का हिन्दी ओसीआर सबसे लोकप्रिय है जिसे http://ildc.in/Hindi/Hindex.aspx से डाउनलोड किया जा सकता है।
गूगल, परिचित, उबंतू, सीडैक (चित्रांकन) आदि ने भी हिन्दी ओसीआर की सुविधाएँ प्रदान की हैं।
हिन्दी भाषा की उन्नति के बिना हमारी उन्नति असंभव है। - गिरधर शर्मा