10 دقیقه
پژوهشگران چینی میگویند یک کلاس جدید از چیپهای هوش مصنوعی فوتونیک ساختهاند که برخی از وظایف یادگیری ماشینی را بهطور چشمگیری سریعتر میکنند — در مواردی ادعا میشود عملکرد بیش از 100 برابر نسبت به GPUهای مرسوم داشته و در عین حال انرژی بسیار کمتری مصرف میکنند. این دستگاهها جایگزین عمومی برای شتابدهندههای چندمنظوره نیستند، اما میتوانند نحوهٔ پردازش تصویر، ویدئو و وظایف بینایی ماشین را تغییر دهند.
چیپهای هوش مصنوعی فوتونیک چه هستند؟
دو نمونهٔ برجسته بهتازگی از دانشگاههای معتبر چین معرفی شدهاند. ACCEL که در دانشگاه تسینگهوا توسعه یافته، یک طرح هیبریدی است که عناصر فوتونیک را با مدارهای الکترونیکی آنالوگ ترکیب میکند. این چیپ با فرایندهای تولید شرکت SMIC ساخته شده و تیم سازنده گزارش میدهد ACCEL در برخی بارهای کاری آنالوگ میتواند به حدود 4.6 پتافلاپس برسد در حالی که تنها کسری از توان معمول GPUها را مصرف میکند. این ادعاها شامل معیارهای خاص آنالوگ و عملیات ماتریسی هستند که طراحی فوتونیک برای آن بهینه شده است.
پروژهٔ دیگر، LightGen، همکاری بین دانشگاه شانگهای جیاو تونگ و تسینگهوا است؛ یک چیپ کاملاً نوری که بیش از دو میلیون «نورون فوتونیک» را درون خود جای داده است. به گفتهٔ محققان، LightGen در وظایف محدود و مشخصی مانند تولید تصویر (image generation)، انتقال سبک (style transfer)، حذف نویز (denoising) و پردازش تصویر سهبعدی دستاوردهای قابلتوجهی در سرعت و کارایی نشان میدهد. این معماری تماماً نوری از مفهوم عملیات متعامد نور (optical interference) و تبدیلهای آنالوگ نوری برای محاسبات ماتریسی بهره میبرد.

چرا فوتونیک میتواند در برخی وظایف هوش مصنوعی از الکترونها پیشی بگیرد
GPUهای مدرن مانند Nvidia A100 بر جریان الکترون از میان میلیاردها ترانزیستور تکیه دارند. این معماری در اجرای گامبهگام و برنامهپذیری انعطافپذیر عالی است، اما مصرف انرژی بالا، تولید گرمای قابلتوجه و وابستگی به گرههای ساخت پیشرفته را نیز به همراه دارد. این محدودیتها در مقیاسبندی انرژی و هزینهٔ مراکز داده اهمیت بسیاری دارند.
چیپهای فوتونیک برعکس با نور محاسبه میکنند. آنها عملیات را از طریق تداخل نوری، فیلترهای طیفی و تبدیلات آنالوگ انجام میدهند که میتوانند برخی عملیات ریاضی را بهصورت موازی و تقریباً با سرعت نور اجرا کنند. این ویژگی باعث میشود در بارهای کاری ماتریسی و پرتونمحور (matrix‑heavy) که از پیش تعریف شدهاند، بسیار سریع و کارآمد باشند. افزون بر این، عناصر فوتونیک گاهی با فناوریهای تولید بالغتر و گرههای متداولتر قابل ساخت هستند که میتواند هزینهها و ریسک تولید را کاهش دهد.
در سطح فنیتر، معماریهای فوتونیک معمولاً از شبکهای از اینترفرومترهای ماخ-زِهندِر (Mach–Zehnder interferometers - MZI)، موجبرهای نوری، تقسیمکنندهها و ترکیبکنندههای نوری و تکنیکهای multiplexing فرکانسی یا طول موج (WDM) بهره میبرند تا ضرب ماتریسی و جمع وزندار را بهصورت آنالوگ پیادهسازی کنند. این روشها امکان محاسبهٔ همزمان تعداد زیادی ضرب-جمع را فراهم میکنند، که در شبکههای عصبی کانولوشنی و مدلهای تولید تصویر اهمیت دارد.
دستاوردهای واقعی — اما در یک مسیر محدود
گزارشها نشان میدهد ACCEL و LightGen در بنچمارکهای خاص مرتبط با وظایف بینایی و تولید محتوا نسبت به GPUهای مرسوم برتریهای چشمگیری داشتهاند. با این حال، تیمها با احتیاط محدودیتها را تأکید میکنند: این پردازندههای فوتونیک محاسبات آنالوگ از پیشتعریفشده را اجرا میکنند و برای اجرای کد عمومی یا عملیات با نیازهای حافظهٔ سنگین مناسب نیستند. خلاصه اینکه آنها شتابدهندههای تخصصی هستند و نه جایگزینهای عمومی برای GPUها.
- نقاط قوت: سرعت بسیار بالا در عملیات ماتریسی و کانولوشنی، مصرف انرژیِ بسیار پایینتر بهازای هر عملیات، و پتانسیل قوی برای خطهای پردازش تصویر/ویدئو و کاربردهای بینایی ماشین.
- محدودیتها: عدم تناسب برای بارهای کاری عمومی، برنامهپذیری محدود، و مدیریت حافظهٔ مقید که مانع استفادهٔ گسترده در وظایفی با نیازهای متغیر حافظه میشود.

معیارهای فنی و چالشهای عملکردی
برای درک بهتر اهمیت این پیشرفتها لازم است چند جنبهٔ فنی را بررسی کنیم. اولاً دقت محاسبات آنالوگ نوری معمولاً از دقت محاسبات دیجیتال شناختهشده کمتر است؛ مشکلاتی مانند نویز، درهمرفتگی فاز، خطای اندازهگیری و درایفت دما میتواند به دقت خروجی آسیب بزند. بنابراین این چیپها برای الگوریتمهایی که تحمل خطا دارند یا میتوانند با کمدقت (low-precision) کار کنند مناسبتر هستند.
ثانیاً مقیاسپذیری و کالیبراسیون در زمان واقعی از دیگر چالشها هستند. شبکههای MZI بزرگ نیاز به کالیبراسیون دقیق، کنترل فاز و مکانیزمهای تصحیح خطا دارند که معمولاً با حسگرها و مدارهای الکترونیکی همراه میشوند؛ همین امر باعث میشود طراحیهای هیبریدی مثل ACCEL محبوب شوند، چرا که ترکیب فوتونیک و الکترونیک میتواند مزایای هر دو حوزه را جمع کند.
ثالثاً، محدودیتهای حافظه و نحوهٔ بارگذاری وزنها (weights) در عناصر فوتونیک یک نگرانی مهم است. وزنهای مدل باید به فرمت نوری قابلاجرا تبدیل شوند و نگهداری حجم بزرگ پارامترها مستلزم راهکارهای جانبی از جمله حافظهٔ الکترونیکی یا روشهای تقسیمبار است. این محدودیتها معماریهای شبکه را تحت تأثیر قرار میدهد و نیاز به طراحیهای ترکیبی یا تقسیموظیفه دارد.
سرانجام، مسألهٔ سازگاری و اکوسیستم نرمافزاری مطرح است. برای بهرهبرداری از تواناییهای چیپهای فوتونیک، ابزارهای برنامهنویسی، کتابخانههای سطح بالا و مدلهای تبدیلشده به فرمتی که با پردازندهٔ نوری سازگار باشد لازم است. بدون وجود SDK و مدلهای آماده، هزینهٔ توسعه و یکپارچهسازی میتواند مانع پذیرش گسترده شود.
این برای سختافزار هوش مصنوعی چه معنا دارد
تصور کنید خطوط پردازشی هوش مصنوعی که بار سنگین پردازشهای بینایی را به گرههای فوتونیک کممصرف واگذار میکنند، در حالی که GPUها مسئول آموزش انعطافپذیر، مدیریت حافظه و بارهای کاری عمومیتر هستند. چنین رویکرد هیبریدی میتواند هزینههای انرژی را کاهش دهد و نرمافزارهای بلادرنگی مانند استنتاج در دستگاه (on-device inference)، مزرعههای پردازش ویدئو و برخی خدمات تولید محتوا را سرعت بخشد.
نکتهٔ مهم این است که تیمهای چینی یافتههای خود را در مجلهٔ Science منتشر کردند که نشاندهندهٔ اعتبار آکادمیک نتایج است. مسیر از نمونهٔ آزمایشگاهی تا تولید انبوه دشوار است: یکپارچهسازی با زیرساختهای موجود، هزینهٔ ساخت در حجم انبوه، مدلهای برنامهنویسی، استانداردسازی و پشتیبانی اکوسیستم همگی موانعی هستند که باید رفع شوند.
برای صنعت آیا جای نگرانی هست؟ هنوز نه. چیپهای فوتونیک احتمالاً در حوزههای هدفمند مکمل GPUها خواهند بود و قرار نیست بهطور کلی آنها را از میدان خارج کنند. اما برای شرکتهایی که روی هوش مصنوعی تصویری در مقیاس بزرگ تمرکز دارند، این تحولات ارزش رصد دقیق را دارند؛ چرا که میتوانند هزینه و زمان پاسخ را در پردازشهای بینایی بهطور قابلتوجهی کاهش دهند.
موارد کاربردی و سناریوهای تجاری
برخی از حوزههایی که پیشتر میتوانند از شتابدهندههای فوتونیک بهره ببرند عبارتاند از:
- شبکههای تولید تصویر و مدلهای diffusion: تبدیل بخشهایی از محاسبات ماتریسی بزرگ مانند لایههای کانولوشن یا ضرب-جمع وزنها به شتابدهندهٔ فوتونیک میتواند زمان تولید تصویر را کاهش دهد.
- پردازش ویدئو در زمان واقعی: رمزگشایی و پردازش فریمها در مزرعههای پردازش ویدئو با مصرف انرژی کمتر برای تحلیل و فشردهسازی هوشمند قابل بهرهبرداری است.
- استنتاج در لبه (edge inference): دستگاههایی که نیاز به پردازش تصویری سریع و کممصرف دارند مانند دوربینهای هوشمند، وسایل نقلیهٔ خودران یا رباتها.
- پردازش سهبعدی و واقعیت ترکیبی: تسریع تبدیل و بازسازیهای سهبعدی که شامل ضرب ماتریسی گسترده هستند.
در هر یک از این سناریوها، تحلیل هزینه-فایده باید شامل قیمت هر تراشه، مصرف انرژی کل سیستم، هزینهٔ یکپارچهسازی نرمافزاری و مزایای عملکردی باشد. برای مثال در دیتاسنترها، کاهش مصرف انرژی بهتنهایی میتواند توجیه اقتصادی قویای برای استفاده از گرههای فوتونیک فراهم کند، بهویژه در پردازشهای ویدئویی که بهطور مداوم و در حجم بالا انجام میشوند.
چالشهای راهبردی و زنجیرهٔ تأمین
از منظر زنجیرهٔ تأمین، تولید انبوه چیپهای فوتونیک نیازمند زیرساختهای تولید، تامین مواد اپتیکی و تجهیزات بستهبندی خاص است. شرکتهای سازنده باید هم در سطح طراحی و هم در سطح تولید، استانداردهایی تعریف کنند تا سازگاری و قابلیت اطمینان در تولید انبوه فراهم شود. علاوه بر این، محدودیتهای جهانی در دسترسی به تجهیزات پیشرفته یا تحریمهای فناوری میتواند مسیر توسعه را پیچیده کند.
مسألهٔ دیگر حفظ نوآوری نرمافزاری و توسعه ابزارهای طراحی برای معماریهای فوتونیک است. شتابدهندههای موفق معمولاً با یک اکوسیستم نرمافزاری قوی همراهاند؛ بنابراین سرمایهگذاری در ابزارهای تبدیل مدلها، کتابخانههای بهینهسازی و نمونههای آمادهٔ صنعتی ضروری است.
تطبیق با مدلهای یادگیری ماشین و معماری شبکهها
بسیاری از مدلهای مدرن مانند شبکههای عصبی کانولوشنی (CNN) و بخشهایی از مدلهای ترنسفورمر (برای قسمتهای توجه ماتریسی خاص) میتوانند از قابلیتهای ضرب-جمع موازی فوتونیک سود ببرند. با این وجود، معماری مدل باید بهگونهای طراحی یا اصلاح شود که به محدودیتهای دقت، بارگذاری وزن و کالیبراسیون پاسخ دهد. تحقیقات بیشتری در زمینهٔ تبدیل مدلها (model quantization)، آموزش ترکیبی (hybrid training) و مقاومسازی در برابر نویز برای تطبیق بهتر با سختافزار فوتونیک نیاز است.
جمعبندی و چشمانداز
در مجموع، چیپهای فوتونیک چینی مانند ACCEL و LightGen نشان میدهند که محاسبهٔ نوری میتواند در حوزههای مشخصی از هوش مصنوعی تصویری عملکرد و کارایی انرژی را بهطور قابلتوجهی ارتقا دهد. با این حال، محدودیتهای دقیق بودن محاسبات آنالوگ، برنامهپذیری محدود و چالشهای حافظه و یکپارچهسازی مانع از آن میشود که این فناوری بهسرعت جایگزین GPUها در همهٔ حوزهها گردد.
در عمل، محتملترین سناریو تلفیق این دو جهان است: استفاده از شتابدهندههای فوتونیک برای بارهای کاری ماتریسی سنگین و تکراری در کنار GPUها برای آموزش، مدیریت حافظه و وظایف عمومی. این ترکیب میتواند منجر به کاهش هزینههای عملیاتی، افزایش بازدهی انرژی و بهبود عملکرد در برنامههای پردازش تصویر و ویدئو شود.
برای شرکتها و پژوهشگرانی که به هوش مصنوعی بصری در مقیاس میاندیشند، پیگیری توسعههای فوتونیک و سرمایهگذاری در آمادهسازی اکوسیستم نرمافزاری و سختافزاری یک فرصت استراتژیک خواهد بود. در عین حال مزیتهای رقابتی در بازار میتواند از آنِ کسانی باشد که زودتر راهکارهای هیبریدی کارآمد را به تولید و بهرهبرداری انبوه برسانند.
منبع: smarti
ارسال نظر