گزارش مفصل: گروک ۴.۵، مدل وی۹ و انتشار ماهانه در اسپیس اکس

گزارش مفصل: گروک ۴.۵، مدل وی۹ و انتشار ماهانه در اسپیس اکس

نظرات

3 دقیقه

وقتی وارد یک آزمایشگاه در اسپیس‌اکس یا اتاق جلسه‌ای در تسلا می‌شوید ممکن است چیزی بشنوید که شبیه یک چرخش داستانی است: یک هوش مصنوعی جدید که آرام و بی‌سر و صدا مانند پیشتاز عمل می‌کند. این صحنه‌ای است که ایلان ماسک این هفته تصویر کرد وقتی اعلام کرد گروک ۴.۵ وارد نسخه بتای خصوصی در هر دو شرکت شده است.

او گفت که آزمایش‌های داخلی اولیه گروک ۴.۵ را "نزدیک به کلود اوپوس و شاید فراتر" قرار می‌دهند. این جمله اهمیت دارد چون کلود اوپوس در کنار جی‌پی‌تی-۵.۵ به‌عنوان یکی از مدل‌های معیار است که تیم‌های دیگر خود را با آن اندازه‌گیری می‌کنند. خلاصه اینکه ماسک می‌گوید گروک فاصله خود را با برخی از برجسته‌ترین مدل‌های بزرگ زبانی کاهش داده است.

جزییات فنی

گروک ۴.۵ بر پایه‌ی یک مدل بنیادی به نام وی۹ اجرا می‌شود. این یک جهش بزرگ است: تقریباً ۱.۵ تریلیون پارامتر، حدود سه برابر بزرگ‌تر از وی۸ که همچنان بخش عمده ترافیک تولیدی گروک را امروزه مدیریت می‌کند. بزرگ‌تر بودن اینجا یعنی یک پایه قوی‌تر برای استدلال، حافظه و خروجی‌های ظریف‌تر. سوال بعدی این است که آیا این مقیاس به بهبودهای سازگار و قابل لمس در دنیای واقعی تبدیل می‌شود یا خیر.

  • خانواده مدل: مدل بنیادی وی۹
  • تعداد پارامترها: حدود ۱.۵ تریلیون
  • سایز نسبی: حدود ۳ برابر وی۸
  • استقرار: نسخه بتای خصوصی در اسپیس‌اکس و تسلا

بعد وعده جسورانه‌تری از ماسک مطرح می‌شود. او می‌گوید اسپیس‌اکس قصد دارد هر ماه تا پایان ۲۰۲۶ یک مدل بنیادی جدید از صفر آموزش‌دیده منتشر کند. اگر این ریتم رخ دهد، بی‌سابقه خواهد بود؛ چرا که بیشتر آزمایشگاه‌های پیشرو در حال حاضر هر سه تا شش ماه یک مدل بزرگ منتشر می‌کنند.

اگر این زمان‌بندی واقعی باشد، ضرب‌آهنگ صنعت را بازنویسی خواهد کرد.

زمینه کمک می‌کند. این اعلام تنها چند روز پس از آن بود که اسپیس‌اکس اوایل این ماه خرید شرکت دیگری به نام کرسر را به ارزش ۵۵.۲ میلیارد یورو تکمیل کرد. چنین جابه‌جایی‌های داخلی نشان می‌دهد ماسک در حال ترکیب قدرت محاسباتی و استعدادها با جدول زمانی تهاجمی برای محصول است.

پی‌آمدهای واضحی وجود دارد. انتشارهای ماهانه چگونه بر کنترل کیفیت مدل، آزمایش‌های ایمنی و پژوهش بلندمدت تأثیر خواهد گذاشت؟ آیا تیم‌های مهندسی می‌توانند چرخه‌های سریع و تازه آموزش را بدون افزایش ریسک حفظ کنند؟ سریع‌تر همیشه به معنای بهتر نیست؛ ممکن است به بی‌نظمی منجر شود. اما زمانی که با اعتبارسنجی سخت‌گیرانه همراه شود، می‌تواند کشف را تسریع کند.

بنابراین خوانندگان باید چه چیزی را دنبال کنند؟ بنچمارک‌های مستقل که گروک ۴.۵ را با کلود اوپوس و مدل‌های خانواده جی‌پی‌تی مقایسه می‌کنند. ارزیابی‌های عمومی ایمنی. و مهم‌تر از همه، اینکه آیا اسپیس‌اکس و تسلا گروک را به شرکای خارجی باز می‌کنند یا توسعه را پشت درهای بسته نگه می‌دارند.

ادعای ایلان ماسک تحریک‌آمیز است و رقبا را مجبور به واکنش می‌کند. آیا فکر می‌کنید ریتم انتشار ماهانه مدل‌های بنیادی قابل‌تحقق است، یا این بیشتر یک نمایش استراتژیک تا یک نقشه راه؟ چند فصل آینده باید داستان را روشن کند.

منبع: smarti

ارسال نظر

نظرات

مطالب مرتبط