پروژه ای دیگر از شورای عالی اطلاع رسانی
معاون فنی دبیرخانه شورای عالی اطلاعرسانی گفت: به منظور ایجاد زیرساخت تولید نرمافزار نویسهخوان نوری بانک اطلاعات حروف گسسته دستنویس از سوی دبیرخانه شورای عالی اطلاع رسانی عرضه شد.
دکتر بهروز مینایی در گفتگو با خبرنگار مهر ضمن بیان این مطلب گفت: انتشار بانکهای اطلاعاتی مانند "بانک اطلاعات حروف گسسته دست نویس" نقش بسترسازی و ایجاد زیرساختهای مناسب برای تولید نرم افزارهای اتوماتیک نویسه خوان نوری به زبان فارسی را به عهده دارد.
وی با اشاره به اهمیت این پروژه گفت: اهمیت این پروژه از این منظر است که به دلیل روند رو به گسترش تولید و استفاده از سیستمهای مبتنی بر نویسه خوانی نوری (OCR) اهمیت وجود بانکهای اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس میشود، این بانکهای اطلاعاتی هم به منظور توسعه و آموزش الگوریتمهای آموزش پذیر و هم به منظور ارزیابی سیستمهای ساخته شده، استفاده میشوند.
مینایی در توضیح مبنای تهیه این بانک اطلاعاتی گفت: نویسهخوانی نوری (OCR) امکان تشخیص متون فارسی از روی تصویر به شکل تایپ و دستنویس را دارد، یعنی یا باید یک متن قبلاً تایپ شده را (مثل کتابها و روزنامههای چندین سال قبل یا حتی متنی را که فایل تایپی آن موجود نیست و فقط نسخه چاپ شده آن را داریم) یا متن دستنویس را به زبان رایانه تبدیل کنیم.
وی ادامه داد: متنهای دستنویس به دو صورت گسسته و پیوسته وجود دارند. متن دستنویس پیوسته مثل همان چیزهایی است که روی کاغذ در قالب نامه یا هر چیز دیگر مینویسیم اما متن دستنویس گسسته همان نوشتههایی است که حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگی که در فرمهای آزمون ثبتنام به صورت هر حرف داخل یک کادر نوشته میشوند.
معاون فنی دبیرخانه شورای عالی اطلاعرسانی خاطرنشان کرد: بانک اطلاعاتی حروف گسسته دستنویس اولین نمونه از این بانکهای اطلاعاتی است که در حجم بزرگی تهیه و منتشر میشود، همچنین این بانک مجموعهای از حروف دستنویس گسسته فارسی است.
وی در ادامه این بانک را مشتمل بر 10 میلیون و 236 هزار و 40 نمونه تصویر دانست و افزود: این بانک در قالب ۵۱ حلقه CD عرضه میشود و تصاویر موجود در این بانک را هم همگی در قالب BMP با وضوح تصویر ۳۰۰ نقطه در اینچ و بهصورت خاکستری ۲۵۶ سطحی عرضه شدهاند.
مینایی گفت : به دلیل حجم بالای فایلهای پروژه علاقهمندان اعم از دانشجویان ارشد و دکتری، اساتید دانشگاه و شرکتهای تولیدکننده نرمافزار نویسهخوان برای دریافت این بانک اطلاعاتی میتوانند با کارگروه خط و زبان فارسی دبیرخانه شورای عالی اطلاعرسانی تماس حاصل کنند.
به گزارش مهر، نشر و تکثیر این بانک اطلاعاتی مجاز نیست اما استفاده پژوهشگران از آن و یا بکارگیری در یک نرمافزار آزاد است.
- ۸۷/۰۲/۱۰