معماری جدید دیپسیک برای عبور از جنگ تراشهای آمریکا

سال ۲۰۲۶ برای این شرکت پیشرو با معرفی تکنیک «اتصالات درونی محدودشده» (mHC) آغاز شد؛ روشی که در قالب یک مقاله علمی تشریح شده و راهحلی نوین برای یکی از بزرگترین چالشهای دنیای فناوری یعنی مقیاسپذیری ارائه میدهد. نویسندگان مقاله مدعی هستند که این معماری جدید اجازه میدهد مدلهای هوش مصنوعی بدون اینکه دچار ناپایداری شوند یا ساختارشان به هم بریزد، بسیار بزرگتر و قدرتمندتر از نمونههای فعلی آموزش ببینند.
لیانگ ونفنگ، بنیانگذار دیپسیک، در توضیح ضرورت این ابداع بیان کرده است که وقتی مهندسان تلاش میکنند ابعاد یک مدل زبانی را گسترش دهند، معمولاً بخشهای مختلف مدل باید اطلاعات بیشتری را با هم ردوبدل کنند. این ترافیک اطلاعاتی بالا اغلب باعث بیثباتی سیستم میشود. راهکار جدید دیپسیک، اما اجازه میدهد ارتباطات داخلی مدل غنیتر و پیچیدهتر شود، اما این ارتباطات را در یک چارچوب کنترلشده نگه میدارد تا هم سرعت پردازش حفظ شود و هم پایداری آموزش به خطر نیفتد.
این رویکرد پاسخی هوشمندانه به چالش هزینه و سختافزار است. وی سان، تحلیلگر ارشد موسسه کانترپوینت ریسرچ، به بیزنس اینسایدر گفت که دیپسیک با بازطراحی کامل نحوه آموزش مدلها، نشان داده است که میتواند محدودیتهای محاسباتی را دور بزند. به گفته او، این متدولوژی جدید حتی اگر هزینه آموزش را اندکی تغییر دهد، خروجی نهایی و میزان هوشمندی مدل را به شکل چشمگیری افزایش میدهد که در نهایت به صرفهجویی کلان منجر میشود.
انتشار عمومی جزئیات این معماری پیچیده، پیامی روشن برای رقبا دارد. لیان جی سو، تحلیلگر ارشد اومدیا، تأکید میکند که تمایل دیپسیک به اشتراکگذاری چنین یافتههای مهمی، نشاندهنده اعتمادبهنفس بالای صنعت هوش مصنوعی چین است. او پیشبینی میکند که این اقدام باعث ایجاد موجی در صنعت خواهد شد و سایر آزمایشگاههای بزرگ هوش مصنوعی نیز مجبور میشوند نسخههای اختصاصی خود را بر مبنای همین تفکر توسعه دهند.
زمانبندی انتشار این پژوهش باعث شده تا گمانهزنیها درباره عرضه قریبالوقوع محصولات جدید قوت بگیرد. گزارشها نشان میدهد که عرضه مدل پرچمدار R۲ که قرار بود رقیب مدلهای غربی باشد، پیشازاین به دلیل کمبود تراشههای پیشرفته و چالشهای فنی به تعویق افتاده بود. اکنون به نظر میرسد این معماری جدید، همان قطعه گمشدهای است که میتواند مشکلات قبلی را حل کند و راه را برای ورود نسل بعدی هوش مصنوعی باز کند.
کارشناسان درباره نحوه استفاده از این فناوری نظرات متفاوتی دارند. برخی معتقدند این معماری مستقیماً در مدل R۲ استفاده خواهد شد و برخی دیگر مانند خانم سان بر این باورند که این تکنیک احتمالاً زیربنای مدل جامعتری به نام V۴ خواهد بود. دیپسیک که پیشتر در دیماه سال گذشته با مدل R۱ توانسته بود با کسری از هزینه رقبای قدرتمندی مثل اوپنایآی را به چالش بکشد، اکنون با این دستاورد فنی تلاش میکند بار دیگر معادلات بازار را به نفع خود تغییر دهد.
