هنگاميکه يک متن تايپ شده روي کاغذ را توسط اسکنر، اسکن ميکنيد نتيجه کار يک عکس خواهد شد و اگر لازم باشد که اين متن مجدد ويرايش شود ( در صورتيکه متن اوليه در دسترس نباشد ) بايستي متن مجدد تايپ شود.
البته موضوع تايپ مجدد متن، تا موقعي پا برجاست که از تکنولوژي OCR بيخبر باشيد!
OCR مخفف عبارت Optical Character Recognition است و در يک تعريف کلي، تکنولوژي است که توسط آن يک عکس ( مانند يک متن اسکن شده ) به يک متن قابل ويرايش تبديل ميشود.
در آفيس 2003 براي تبديل عکس به متن ميتوانيد از نرمافزار
Microsoft Office Document Imaging استفاده کنيد، البته براي متون انگليسي وجود دارد. اين برنامه را ميتوانيد از مسير زير اجرا کنيد:
|
Start >All Programs > Microsoft Office Tools > Microsoft Office Document Imaging |
براي تبديل يک عکس ( به عنوان مثال شکل 1) به متن ابتدا بايد عکس مورد نظر را از File > Open باز کنيد.
نکته: در اين نرمافزار عکسهايي که پسوند Tiff دارند باز ميشوند.
نکته: هر عکسي را ميتوان به Tiff تبديل کرد اين کار را اکثر نرمافزارهاي ساده مديريت عکسها انجام ميدهند مثلا ميتوان فايل خود را در Paint ويندوز باز کنيد و آن را در حالت Tiff ذخيره کنيد.

شکل1
حال از نوار ابزار يا منوي Tools گزينه Send text to Word را انتخاب کنيد. با توجه به متن، چند ثانيه طول ميکشد تا عکس تبديل به متن شود. سپس نرمافزار Word اجرا ميشود و متنهاي موجود در عکس در آن قابل ويرايش شدهاند.

شکل2
نکته: توجه داشته باشيد که در تبديل عکس به متن ممکن است برخي از کلمات اشتباه خوانده شوند و يا صفحه آرايي به هم ريخته شود.
اگر در هنگام تبديل متن با پيغامي مانند شکل 3 مواجه شديد به آن معني است که OCR براي زبان مورد نظر شما وجود ندارد ( در اين شکل زبان عربي ). براي حل اين پيغام بايد از منوي Tools گزينه Options را باز کرده و با توجه به شکل 4 گزينه مورد نظر را انتخاب نماييد.

شکل3

شکل4
سوال اينکه آيا اين تکنولوژي براي زبان فارسي نيز وجود دارد؟ پاسخ مثبت است. چند شرکت اقدام به طراحي و ارائه اين محصول به زبان فارسي کردهاند که مهمترين عامل در خريد آنها دقت اين نرمافزارها ميباشد.