جهان

معماری جدید دیپ‌سیک برای عبور از جنگ تراشه‌ای آمریکا

شرکت چینی دیپ‌سیک با معرفی یک معماری فنی نوین، راهکار عملیاتی برای غلبه بر کمبود سخت‌افزار پیشرفته ارائه کرد تا روند توسعه هوش مصنوعی بدون نیاز به پردازنده‌ه... شرکت چینی دیپ‌سیک با معرفی یک معماری فنی نوین، راهکار عملیاتی برای غلبه بر کمبود سخت‌افزار پیشرفته ارائه کرد تا روند توسعه هوش مصنوعی بدون نیاز به پردازنده‌های انویدیا ادامه یابد.

سال ۲۰۲۶ برای این شرکت پیشرو با معرفی تکنیک «اتصالات درونی محدودشده» (mHC) آغاز شد؛ روشی که در قالب یک مقاله علمی تشریح شده و راه‌حلی نوین برای یکی از بزرگ‌ترین چالش‌های دنیای فناوری یعنی مقیاس‌پذیری ارائه می‌دهد. نویسندگان مقاله مدعی هستند که این معماری جدید اجازه می‌دهد مدل‌های هوش مصنوعی بدون اینکه دچار ناپایداری شوند یا ساختارشان به هم بریزد، بسیار بزرگ‌تر و قدرتمندتر از نمونه‌های فعلی آموزش ببینند.

لیانگ ونفنگ، بنیان‌گذار دیپ‌سیک، در توضیح ضرورت این ابداع بیان کرده است که وقتی مهندسان تلاش می‌کنند ابعاد یک مدل زبانی را گسترش دهند، معمولاً بخش‌های مختلف مدل باید اطلاعات بیشتری را با هم ردوبدل کنند. این ترافیک اطلاعاتی بالا اغلب باعث بی‌ثباتی سیستم می‌شود. راهکار جدید دیپ‌سیک، اما اجازه می‌دهد ارتباطات داخلی مدل غنی‌تر و پیچیده‌تر شود، اما این ارتباطات را در یک چارچوب کنترل‌شده نگه می‌دارد تا هم سرعت پردازش حفظ شود و هم پایداری آموزش به خطر نیفتد.

این رویکرد پاسخی هوشمندانه به چالش هزینه و سخت‌افزار است. وی سان، تحلیلگر ارشد موسسه کانترپوینت ریسرچ، به بیزنس اینسایدر گفت که دیپ‌سیک با بازطراحی کامل نحوه آموزش مدل‌ها، نشان داده است که می‌تواند محدودیت‌های محاسباتی را دور بزند. به گفته او، این متدولوژی جدید حتی اگر هزینه آموزش را اندکی تغییر دهد، خروجی نهایی و میزان هوشمندی مدل را به شکل چشمگیری افزایش می‌دهد که در نهایت به صرفه‌جویی کلان منجر می‌شود.

انتشار عمومی جزئیات این معماری پیچیده، پیامی روشن برای رقبا دارد. لیان جی سو، تحلیلگر ارشد اومدیا، تأکید می‌کند که تمایل دیپ‌سیک به اشتراک‌گذاری چنین یافته‌های مهمی، نشان‌دهنده اعتمادبه‌نفس بالای صنعت هوش مصنوعی چین است. او پیش‌بینی می‌کند که این اقدام باعث ایجاد موجی در صنعت خواهد شد و سایر آزمایشگاه‌های بزرگ هوش مصنوعی نیز مجبور می‌شوند نسخه‌های اختصاصی خود را بر مبنای همین تفکر توسعه دهند.

زمان‌بندی انتشار این پژوهش باعث شده تا گمانه‌زنی‌ها درباره عرضه قریب‌الوقوع محصولات جدید قوت بگیرد. گزارش‌ها نشان می‌دهد که عرضه مدل پرچمدار R۲ که قرار بود رقیب مدل‌های غربی باشد، پیش‌ازاین به دلیل کمبود تراشه‌های پیشرفته و چالش‌های فنی به تعویق افتاده بود. اکنون به نظر می‌رسد این معماری جدید، همان قطعه گم‌شده‌ای است که می‌تواند مشکلات قبلی را حل کند و راه را برای ورود نسل بعدی هوش مصنوعی باز کند.

کارشناسان درباره نحوه استفاده از این فناوری نظرات متفاوتی دارند. برخی معتقدند این معماری مستقیماً در مدل R۲ استفاده خواهد شد و برخی دیگر مانند خانم سان بر این باورند که این تکنیک احتمالاً زیربنای مدل جامع‌تری به نام V۴ خواهد بود. دیپ‌سیک که پیش‌تر در دی‌ماه سال گذشته با مدل R۱ توانسته بود با کسری از هزینه رقبای قدرتمندی مثل اوپن‌ای‌آی را به چالش بکشد، اکنون با این دستاورد فنی تلاش می‌کند بار دیگر معادلات بازار را به نفع خود تغییر دهد.

منبع
آنا
عضویت در تلگرام آی تی آنالیز

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا