شروط تحقق واقعی سکوی ملی هوش مصنوعی

عباس پورخصالیان - طی ۲۰۰ سال اخیر به ندرت میتوان رسانهای یافت که حکمرانان و حتی علمای حوزههای علمیه ایران آن را با طیب خاطر پذیرفته و به سرعت در بومیسازیِ استفاده و فناوری ایجادش کوشیده باشند: «رسانۀ هوش مصنوعی» از این لحاظ یک استثناء است:
در ۲۵ اسفند ۱۴۰۳ یک (به اصطلاح) «اِم.وی.پیِ» «سکوی هوش مصنوعی ایران» با حضور معاون علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری معرفی و قول داده شد که نسخۀ نهایی آن در کمتر از یک سال (تا اسفند ۱۴۰۴) منتشر شود.
البته منظور از اصطلاح «اِم.وی.پی» یا Minimum Viable Product (محصول کمینۀ زیستپذیر) در تبلیغات بورسِ «های-تِک» معمولاً نسخهای ابتدایی از پروژهای بزرگ است که بناست در آیندهای برنامهریزیشده عملیاتی شود. این «اِم.وی.پی» را معمولاً به امید جذب منابع لازم معرفی میکنند. منابع لازم نیز عمدتاً از سرمایه و نیروی انسانی کافی تشکیل میشود؛ شامل مدیران و کارشناسانی که پروژه را به پیش میبرند به علاوۀ کاربرانی که به موازات پیشرفت پروژه، کار با نسخۀ آزمایشی محصولِ پیشرونده را تجزیه و در رفع ایرادات آن کمک میکنند. این در حالی است که در مورد (به اصطلاح) «اِم.وی.پی» مورد نظر معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری، هیچ یک از سنجههای مذکور مطرح نیستند:
- یکم، گفته میشود که ۱۰۰ نفر از کارشناسان و تعدادی از کاربران نسخۀ ابتدایی«سکوی هوش مصنوعی ایران» را در داخل کشور از پیش جذب کردهاند؛
- دوم، باید در نظر داشت که منابع تأمین مالی این پروژه را در لایحۀ بودجۀ سال ۱۴۰۴ گنجاندهاند و
- سوم، گذشته از این دو واقعیت (آماده بودن منابع مالی و پرسنلی پروژه که تعریف و رونماییِ هرگونه «اِم.وی.پی» را بی مورد میکند و زیر سؤال میبرد) برخی از کاربران و روزنامه نگاران، «اِم.وی.پی» مورد نظر معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری را بسیار ناقص ارزیابی کردند، زیرا که وبگاه مربوط به سکو، شامل لینکهای غیرفعالی بود که موجب نارضایتی و نگرانی مضاعف علاقهمندانِ «سکوی هوش مصنوعی ایران» شد؛
- چهارم، «نگرانی مضاعف» از این بابت مطرح است که نمونههای زیادی از «اِم.وی.پی» مثل این «اِم.وی.پی»ها: Google Wave ,Google Glass, Amazon Fire Phone, Microsoft Zune¸ Color (App), HP TouchPad, Google+, Quibi, Juicero, و Nokia N-Gageپس از رونمایی شدن از سوی مدیران شرکتهای بزرگ هایتِک بعداً به دلایلی همه به شکست انجامیدند و بینتیجه رها شدند. پس «اِم.وی.پیِ» مورد نظر معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری ما نیز امکان دارد به هچل و مخمصهای دچار شود و در این زمانۀ وانفسا پس از مدتی کار و صرف هزینه روی آن، به بهرهبرداری نهایی نرسیده و به ورطۀ هزاران پروژۀ نیمه-تمام-رهاشدۀ دیگر در افتد.
- پنجم، اگر معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری مطمئن است که تا یک سال دیگر نسخۀ نهایی «سکوی هوش مصنوعی ایران» راهاندازی میشود، معنایش این است که نسخۀ ابتدایی معرفی و رونمایی شده در ۲۵ اسفند ۱۴۰۳ اصلاً و ابداً از جنسِ «محصول کمینۀ زیستپذیر» (MVP) نیست بلکه پلتفرمی تقریباً کامل است که فقط نیاز به ۶ ماه «تربیت» و «آموزش» از طریق پرامپتینگ (Prompting) و ترینینگ (Training) دارد تا در شهریور ۱۴۰۴ نسخۀ آزمایشی آن معرفی شده و تا اسفند ۱۴۰۴ نسخۀ نهایی آن نیز عرضۀ عمومی شود.
زیرا که محال است بتوان فقظ طی یک سال (از اسفند ۱۴۰۳ تا اسفند ۱۴۰۴) طرح ابتدایی یک پلتفرم هوش مصنوعی را به این سرعت عملیاتی کرد؛ آن هم با بودجۀ اندکی که از طرف حکومت، تنها «۴ همت» پیشنهاد شده و مجلس آن را به کمتر از «۲ همت» [شاید حدود «۱.۲ همت»] تقلیل داده است؛ پروژهای که تحقق آن در واقع به لشکری از کارشناسان و کاربران، هزینه کردِ «هزاران همت» و «چند دَمَت (ده هزار میلیارد تومان)» به علاوۀ فعالیت تیمی مستمر، طی حداقل دو برنامۀ ۵ ساله نیازدارد! این بودجۀ اندک و آن عجلۀ برقآسا تنها تصویری منفی را تداعی میکند: چاله-چولههایی برای منارهای «چند همت»ی کندن! اگر به آب نرسیدیم، دست کم به نان خواهیم رسید!
اما چرا پروژۀ سکوی ملی هوش مصنوعی، اینقدر هزینه بر، کاربر و زمانبر است؟
دیجیتالی کردن اسناد ملی، یک گام اساسی و مهم قبل از ایجاد پلتفرم ملی هوش مصنوعی برای دستاندرکاران است. البته قسمتی از اسناد ملی کشور در فرایند ایجاد دولت الکترونیکی، دیجیتالی شده است اما قسمت قابل توجهی از اسناد ملی هنوز دیجیتالی نشدهاند. دیجیتالی شدنِ حتی المقدور همۀ اسناد ملی به این دلیل لازم است که:
- کیفیت خدمات سکوی هوش مصنوعی ملی، به در دسترس بودن حجم بزرگی از دادهها، شامل بیگدیتاهای کشوری و لشکری و شرکتی به عنوان گنجینهای عظیم از دادههای دیجیتالی شده متکی است. مدلهای هوش مصنوعی به دادههای ساختاریافته و بدون ساختار برای آموزش، تجزیه و تحلیل و ایجاد بینش در ماشین یادگیری نیاز دارند. اگر اکثر اسناد (قوانین، خطمشیها، گزارشها و سوابق شهروندان) هنوز در فرمتهای کاغذی یا غیر دیجیتالی نگهداری میشوند، سکوی ملی هوش مصنوعی نمیتواند آنها را به طور موثر پردازش کند. در همین رابطه، استانداردسازی دادهها به منظور تحقق قابلیت بهرهبرداری متقابل از پایگاه دادهها، ضروری است.
اگر فعلاً فقط به مشکل دیجیتالیکردن و استانداردسازی یک آرشیو اسناد حکومتی به بزرگی اسناد ملی ایران (که شامل دهها میلیون سند و احتمالاً صدها کیلومتر قفسهبندی پروندهها است) با استفاده از«زبان نشانهگذاری گسترش یافته» (XML) بپردازیم، باید بپذیریم که در حوزۀ مطالعات امکانسنجی سکوی ملی هوش مصنوعی ایرانی با پروژهای عظیم و چندوجهی مواجهیم؛ پروژهای که نیازمند منابع مالی، انسانی و زمانی قابلتوجهی است. برآورد دقیق هزینهها و پیش بینی مدت زمان مورد نیاز، به عوامل متعددی بستگی دارد، شاملِ موارد زیر:
۱. حجم اسناد و پیچیدگی فرآیند دیجیتالیسازی- تخمین حجم اسناد هنوز دیجیتالی نشدۀ کشور مشکل است. در این مورد حداقل میتوان گفت: بایگانی ملی ایران شامل چند صد کیلومتر قفسهبندی و صدها میلیون سند (از متون و پروندهها تا نقشهها، عکسها و فیلمها) است. فرمتهای مختلف اسناد ممکن است شامل متون دستنویس، نامههای تایپشده، اسناد چاپی، تصاویر و عکسها و اسکنها؛ اسناد چندرسانهای صوتی و ویدئویی؛ اسناد ساختاریافته مثل فرمهای اداری و دیتابیسهای قدیمی باشد.
۲. نیروی انسانی مورد نیاز- تیم اسکن و پیشپردازش کننده شامل اپراتورهای اسکن-کار، تیم فنی متخصصان XML و متادیتا به علاوۀ گروههای برنامهنویسی برای توسعۀ ابزارهای پردازش خودکار؛ متخصصان مدیریت پایگاه داده و ذخیرهسازی دادهها و برنامهها؛ تیم بایگانی و علوم اطلاعات کتابخانهای، متخصصان سازماندهی اسناد، تاریخدانان و متخصصان محتوا برای طبقهبندی محتوا؛ تیم پشتیبانی و مدیریت پروژه شامل مدیران پروژه و تحلیلگران؛ اگر به همین تعداد بسنده کنیم، جمع کل این نیروی انسانی مورد نیاز برای اجرای پروژۀ سکوی ملی هوش مصنوعی ایران، بسیار بیشتر از آن ۱۰۰ نفری است که در گزارش معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری در ۱۵ اسفند ۱۴۰۴ آمده است.
۳. زمان مورد نیاز- پروژههای مشابه (مانند دیجیتالیکردن کتابخانه ملی انگلیس یا آرشیو ملی آمریکا) معمولاً ۱۰-۲۰ سال زمان بردهاند. در صورت استفاده از فناوریهای پیشرفته اسکن و پردازش خودکار (مانند OCR پیشرفته و استفاده از هوش مصنوعی از پیش موجود برای طبقهبندی)، ممکن است این زمان برای ما به ۵ تا۱۰ سال کاهش یابد.
۴. برآورد هزینههای مالی - هزینه اسکن و پردازش اولیه شامل اسکن دستیِ صدها میلیون صفحه، به علاوۀ هزینۀ توسعۀ سیستمهای XML و متادیتا شامل طراحی استانداردهای اختصاصی؛ هزینۀ توسعه نرمافزارهای پردازش دیتا؛ هزینه ذخیرهسازی و توسعۀ زیرساختها، هزینۀ سرورها و فضای ابری و حقوق پرسنل؛ و در نهایت: هزینههای جانبی!
۵. چالشهای کلیدی- حجم بالای اسناد غیرمتنی (عکسها، فیلمها) که نیاز به پردازش خاص دارند و صرف دقت به منظور حصول کیفیت در تبدیل اسناد دستنویس و مدارک قدیمی به فرمت دیجیتالی، رعایت استانداردهای امنیت دادهها بهویژه برای اسناد محرمانه به علاوۀ حصول اطمینان از پایداری استانداردها و سازگاری در بلندمدت.
۶. اجرای راهکارهای کاهش هزینه و زمان - با استفاده از هوش مصنوعی برای طبقهبندی خودکار و استخراج متادیتا، برونسپاری بخشی از پروژه به شرکتهای تخصصی اسکن، استفاده از کار داوطلبان (مانند پروژههای دیجیتالیکردن کتابخانههای عمومی.
لذا برآورد دقیق هزینهها و پیش بینی واقعگرایانۀ مدت زمان مورد نیاز تنها برای رسیدن به نسخۀ نهایی سکوی هوش مصنوعی ایران، کار سادهای نیست و به عوامل متعددی بستگی دارد که شمهای از آنها را در این یادداشت ذکر کردم.
فقط پروژۀ ایجاد یک چتبات ملی هوش مصنوعی ایران نیازمند برنامهریزی دقیق، بودجه کلان و همکاری بین سازمانهای دولتی، دانشگاهی و مجامع فناوری ذیربط است.
این در حالی که آنچه در روز ۲۵ اسفند ۱۴۰۳ تحت عنوان سکوی ملی هوش مصنوعی ایران توسط معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری بیان شد، آرزو و آمالی بسیار فراتر از رسیدن به یک سکوی ملی هوش مصنوعی بود (که در واقع یک چتبات هوشمند است). برنامههای معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری انواع دیگری از هوش مصنوعی لازم برای هوشمندسازی مدیریت زنجیرۀ تأمین (لجیستیک) و ترابری را نیز شامل میشد؛ اهدافی که ربط چندانی به رسیدن یا نرسیدن به سکوی ملی هوش مصنوعی ندارند، زیرا هوشمندسازی شان از لحاظ فنی و سیستمی راه حلها، برنامهها و پروژههای دیگری را میطلبند که فرق اساسی با راهکارهای پلتفرم ملی هوش مصنوعی ایران دارند. پلتفرم ملی هوش مصنوعی ایران مبتنی بر یک LLM است و هوشمندسازی مدیریت زنجیرۀ تأمین مبتنی است بر هوشیارمندی شبکههایی از حسگر مرتبط با چیزنت (IoT) ! این کجا و آن کجا!
نتیجه گیری: در یک کلام: به برآورد من، وعدۀ ایجاد یک سکوی ملی هوش مصنوعی ایران، در اوضاع و احوال موجود، به وقت گل نی موکول، و در خوشبینانهترین حالت، عارضۀ AI-شیدایی ما به رونمایی از یک میانای برنامۀ کاربردی (API) مرتبط با دیپسیک یا چت جی.پی.تی و امثالهم در وقت موعود (اسفند ۱۴۰۴) منجر میشود.
وقتی که هر کاربر وارد میتواند یک Repository از دیپ سیک را دربست دانلود کند و تمام دانش و اطلاعات موجود در دیپ سیک تا سال ۲۰۲۳ را روی رایانۀ رومیزیاش به صوت برون خط نگهداری و استفاده کند، کسانی هم پیدا میشوند که گنجشک را رنگ میکنند و جای قناری میفروشند؛ معاونت محترم علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری باید به هوش باشد: اکنون بازار مکارۀ هوش مصنوعی ایران گرفتار این تقلب است: با یک پرامپت، به نسخۀ کپی شده از دیپ سیک یا چت جی.پی.تی و امثالهم یاد میدهند که اگر از کنیهات پرسیدند، هرگز برند خود را دیپ سیک یا چت جی.پی.تی و امثالهم معرفی نکن! بلکه بگو یا بنویس: «من خودم هستم، فلان و بهمان؛ مثلاً: سکوی ملی پژوهش و نوآوری ایران!» (منبع:عصرارتباط)