ITanalyze

تحلیل وضعیت فناوری اطلاعات در ایران :: Iran IT analysis and news

ITanalyze

تحلیل وضعیت فناوری اطلاعات در ایران :: Iran IT analysis and news

  عبارت مورد جستجو
تحلیل وضعیت فناوری اطلاعات در ایران

پروژه ای دیگر از شورای عالی اطلاع رسانی

| سه شنبه, ۱۰ ارديبهشت ۱۳۸۷، ۰۱:۵۶ ب.ظ | ۰ نظر

معاون فنی دبیرخانه شورای عالی اطلاع‌رسانی گفت: به منظور ایجاد زیرساخت‌ تولید نرم‌افزار نویسه‌خوان نوری بانک اطلاعات حروف گسسته دست‌نویس از سوی دبیرخانه شورای عالی اطلاع رسانی عرضه شد.

دکتر بهروز مینایی در گفتگو با خبرنگار مهر ضمن بیان این مطلب گفت: انتشار بانک‌های اطلاعاتی مانند "بانک اطلاعات حروف گسسته دست‌ نویس" نقش بسترسازی و ایجاد زیرساختهای مناسب برای تولید نرم ‌افزارهای اتوماتیک نویسه ‌خوان نوری به زبان فارسی را به عهده دارد.

وی با اشاره به اهمیت این پروژه گفت: اهمیت این پروژه از این منظر است که به دلیل روند رو به گسترش تولید و استفاده از سیستمهای مبتنی بر نویسه‌ خوانی نوری (OCR) اهمیت وجود بانک‌های اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس می‌شود، این بانکهای اطلاعاتی هم به منظور توسعه و آموزش الگوریتم‌های آموزش ‌پذیر و هم به منظور ارزیابی سیستمهای ساخته شده، استفاده می‌شوند.

مینایی در توضیح مبنای تهیه این بانک اطلاعاتی گفت: نویسه‌خوانی نوری (OCR) امکان تشخیص متون فارسی از روی تصویر به شکل تایپ و دست‌نویس را دارد، یعنی یا باید یک متن قبلاً تایپ شده را (مثل کتابها و روزنامه‌های چندین سال قبل یا حتی متنی را که فایل تایپی آن موجود نیست و فقط نسخه چاپ شده آن را داریم) یا متن دست‌نویس را به زبان رایانه تبدیل کنیم.

وی ادامه داد: متن‌های دست‌نویس به دو صورت گسسته و پیوسته وجود دارند. متن دست‌نویس پیوسته مثل همان چیزهایی است که روی کاغذ در قالب نامه یا هر چیز دیگر می‌نویسیم اما متن دست‌نویس گسسته همان نوشته‌هایی است که حروف آن جدا از هم و به صورت گسسته نوشته شده‌اند، مثل نام و نام‌خانوادگی که در فرم‌های آزمون ثبت‌نام به صورت هر حرف داخل یک کادر نوشته می‌شوند.

معاون فنی دبیرخانه شورای عالی اطلاع‌رسانی خاطرنشان کرد: بانک اطلاعاتی حروف گسسته دست‌نویس اولین نمونه از این بانک‌های اطلاعاتی است که در حجم بزرگی تهیه و منتشر می‌شود، همچنین این بانک مجموعه‌ای از حروف دست‌نویس گسسته فارسی است.

وی در ادامه این بانک را مشتمل بر 10 میلیون و 236 هزار و 40 نمونه تصویر دانست و افزود: این بانک در قالب ۵۱ حلقه CD عرضه می‌شود و تصاویر موجود در این بانک را هم همگی در قالب BMP با وضوح تصویر ۳۰۰ نقطه در اینچ و به‌صورت خاکستری ۲۵۶ سطحی عرضه شده‌اند.

مینایی گفت : به‌ دلیل حجم بالای فایل‌های پروژه علاقه‌مندان اعم از دانشجویان ارشد و دکتری، اساتید دانشگاه و شرکتهای تولیدکننده نرم‌افزار نویسه‌خوان برای دریافت این بانک اطلاعاتی می‌توانند با کارگروه خط و زبان فارسی دبیرخانه شورای عالی اطلاع‌رسانی تماس حاصل کنند.

به گزارش مهر، نشر و تکثیر این بانک اطلاعاتی مجاز نیست اما استفاده پژوهشگران از آن و یا بکارگیری در یک نرم‌افزار آزاد است.

  • ۸۷/۰۲/۱۰

نظرات  (۰)

هیچ نظری هنوز ثبت نشده است

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">