3 دقیقه
وقتی وارد یک آزمایشگاه در اسپیساکس یا اتاق جلسهای در تسلا میشوید ممکن است چیزی بشنوید که شبیه یک چرخش داستانی است: یک هوش مصنوعی جدید که آرام و بیسر و صدا مانند پیشتاز عمل میکند. این صحنهای است که ایلان ماسک این هفته تصویر کرد وقتی اعلام کرد گروک ۴.۵ وارد نسخه بتای خصوصی در هر دو شرکت شده است.
او گفت که آزمایشهای داخلی اولیه گروک ۴.۵ را "نزدیک به کلود اوپوس و شاید فراتر" قرار میدهند. این جمله اهمیت دارد چون کلود اوپوس در کنار جیپیتی-۵.۵ بهعنوان یکی از مدلهای معیار است که تیمهای دیگر خود را با آن اندازهگیری میکنند. خلاصه اینکه ماسک میگوید گروک فاصله خود را با برخی از برجستهترین مدلهای بزرگ زبانی کاهش داده است.
جزییات فنی
گروک ۴.۵ بر پایهی یک مدل بنیادی به نام وی۹ اجرا میشود. این یک جهش بزرگ است: تقریباً ۱.۵ تریلیون پارامتر، حدود سه برابر بزرگتر از وی۸ که همچنان بخش عمده ترافیک تولیدی گروک را امروزه مدیریت میکند. بزرگتر بودن اینجا یعنی یک پایه قویتر برای استدلال، حافظه و خروجیهای ظریفتر. سوال بعدی این است که آیا این مقیاس به بهبودهای سازگار و قابل لمس در دنیای واقعی تبدیل میشود یا خیر.

- خانواده مدل: مدل بنیادی وی۹
- تعداد پارامترها: حدود ۱.۵ تریلیون
- سایز نسبی: حدود ۳ برابر وی۸
- استقرار: نسخه بتای خصوصی در اسپیساکس و تسلا
بعد وعده جسورانهتری از ماسک مطرح میشود. او میگوید اسپیساکس قصد دارد هر ماه تا پایان ۲۰۲۶ یک مدل بنیادی جدید از صفر آموزشدیده منتشر کند. اگر این ریتم رخ دهد، بیسابقه خواهد بود؛ چرا که بیشتر آزمایشگاههای پیشرو در حال حاضر هر سه تا شش ماه یک مدل بزرگ منتشر میکنند.
اگر این زمانبندی واقعی باشد، ضربآهنگ صنعت را بازنویسی خواهد کرد.
زمینه کمک میکند. این اعلام تنها چند روز پس از آن بود که اسپیساکس اوایل این ماه خرید شرکت دیگری به نام کرسر را به ارزش ۵۵.۲ میلیارد یورو تکمیل کرد. چنین جابهجاییهای داخلی نشان میدهد ماسک در حال ترکیب قدرت محاسباتی و استعدادها با جدول زمانی تهاجمی برای محصول است.
پیآمدهای واضحی وجود دارد. انتشارهای ماهانه چگونه بر کنترل کیفیت مدل، آزمایشهای ایمنی و پژوهش بلندمدت تأثیر خواهد گذاشت؟ آیا تیمهای مهندسی میتوانند چرخههای سریع و تازه آموزش را بدون افزایش ریسک حفظ کنند؟ سریعتر همیشه به معنای بهتر نیست؛ ممکن است به بینظمی منجر شود. اما زمانی که با اعتبارسنجی سختگیرانه همراه شود، میتواند کشف را تسریع کند.
بنابراین خوانندگان باید چه چیزی را دنبال کنند؟ بنچمارکهای مستقل که گروک ۴.۵ را با کلود اوپوس و مدلهای خانواده جیپیتی مقایسه میکنند. ارزیابیهای عمومی ایمنی. و مهمتر از همه، اینکه آیا اسپیساکس و تسلا گروک را به شرکای خارجی باز میکنند یا توسعه را پشت درهای بسته نگه میدارند.
ادعای ایلان ماسک تحریکآمیز است و رقبا را مجبور به واکنش میکند. آیا فکر میکنید ریتم انتشار ماهانه مدلهای بنیادی قابلتحقق است، یا این بیشتر یک نمایش استراتژیک تا یک نقشه راه؟ چند فصل آینده باید داستان را روشن کند.
منبع: smarti
ارسال نظر