8 دقیقه
OpenAI از سورا 2 رونمایی کرده است؛ بهروزرسانی مهمی برای مدل تولید صدا و تصویر که همزمان با آن یک اپ اجتماعی جدید ارائه شده که کلیپهای ساختهشده توسط هوش مصنوعی را در قالب فید عمودی نمایش میدهد. این نسخه وعده حرکتهای واقعیتر و کنترل دقیقتر را میدهد، اما همزمان پرسشهای تازهای درباره تشابه چهره، پالایش محتوا و مدلهای درآمدزایی مطرح میکند.
چه تغییراتی در سورا 2 دیده میشود: واقعگرایی و کنترل بهتر
سورا 2 تمرکزش را بر چیزی که OpenAI آن را «شبیهسازی جهان» مینامد قرار داده است؛ هدف بازتولید دقیقتر حرکتهای فیزیکی و رفتار محیطی نسبت به مدلهای پیشین است. شرکت از بهبودهایی در زمینه نحوه حرکت افراد، تعامل اجسام و توانایی مدل در پیروی از دستورالعملهای چندشات و دقیق سخن میگوید. این یعنی بهجای تولید تکفریمهای جداگانه که احساس ناهماهنگی دارند، سورا 2 تلاش میکند پیوستگی فیزیکال را حفظ کند: وزن، اینرسی، برخوردها و نورپردازی پویاتر و منطبقتر با قوانین دنیای واقعی نمایش داده میشوند.
OpenAI صریحاً اذعان دارد که سورا 2 کامل نیست، اما میگوید مدل بهتر از قبل از قوانین فیزیکی پیروی میکند و میتواند از یک پرامپت واحد زاویههای دوربین متنوع یا توالیهای مختلفی تولید کند. برای مثال، میتوان از مدل خواست از یک نما به نمایی دیگر منتقل شود، یا چند دوربینِ همزمان را شبیهسازی کند تا حس سینماتیک و واقعگرایانهتری ایجاد شود. در عمل، این قابلیت به تولید صحنههایی با هماهنگی حرکتی و تغییرات منطقی در نور و سایه کمک میکند که پیشتر دشوار بود.
بهعلاوه، سورا 2 در مدیریت لمسهای ظریفترِ صوتی و ادغام صدا با تصویر هم بهبود دارد؛ یعنی نه تنها تصویر بهتر از حرکتهای طبیعی پیروی میکند، بلکه مُدولاسیون و تطابق صدا با موقعیت و ریتم حرکتها نیز روانتر شده است. این موضوع برای کاربردهایی مثل دوبله خودکار، ایجاد جلوههای صوتی واقعگرایانه و تولید محتواهای کوتاه با همخوانی صوتی-تصویری اهمیت زیادی دارد.
در میان نمونههای معرفیشده، OpenAI ادعا میکند برخی کلیپها کاملاً توسط مدل تولید شدهاند — از جمله یک قطعهٔ شبیهسازیشده که نسخهای ساختگی از بیانیههای مدیرعامل شرکت، سم آلتمن، را نمایش میداد. این دمو هم پتانسیل خلاقانه سورا 2 را نشان میدهد و هم هشدار واضحی درباره خطرات deepfake، چون هرچه تولید ویدئو واقعیتر شود، امکان سوءاستفاده نیز افزایش مییابد. بنابراین توسعهدهندگان و سیاستگذاران باید همزمان روی مقررات و ابزارهای تشخیص کار کنند تا مزیتهای فناوری حفظ شود ولی خطراتش کاهش یابد.

فید اجتماعی مبتنی بر ویدئوهای تولیدشده توسط هوش مصنوعی
همزمان با مدل، OpenAI اپلیکیشنی به نام Sora معرفی کرده است: یک پلتفرم اجتماعی که ورود به آن تنها با دعوت امکانپذیر است و فید آن صرفاً شامل ویدئوهایی است که با مولد تصویری سورا تولید شدهاند. رابط کاربری بر پایه اسکرول عمودی طراحی شده و سیستم پیشنهاددهی محتوا تلاش میکند ویدئوهایی متناسب با سلیقهٔ کاربران ارائه کند تا تجربهای شبیه شبکههای اجتماعی مدرن فراهم شود، اما با تمرکز ویژه روی محتوای ساختهشده توسط هوش مصنوعی.
خالقان محتوا میتوانند از مدل بخواهند سبکها، تمها یا قالبهای مشخصی را نمایش دهد؛ برای مثال میشود درخواست سبک سینمایی خاص، فریمبندی معین، یا حتی روایت چندبخشی را مطرح کرد. این تاکید بر خلق محتوا به جای مصرف منفعلانه میتواند کاربران را تشویق کند تا تنظیمات و پارامترها را امتحان کنند و نتایج خلاقانه بسازند — از کلیپهای کوتاه تبلیغاتی گرفته تا روایتهای بصری مستقل و آثار هنری دیجیتال.
یکی از ویژگیهای قابل توجه «Cameo» نام دارد. این قابلیت به کاربران اجازه میدهد کلیپ کوتاهی از خود ضبط کنند تا اپلیکیشن شباهت ظاهری آنها را ضبط کند و از آن در ویدئوهای تولیدشده استفاده کند. OpenAI میگوید کنترل استفاده از کِیمئو در اختیار کاربر است: شما تعیین میکنید چه افرادی میتوانند از کِیمئو شما استفاده کنند، امکان لغو دسترسی وجود دارد و میتوانید ویدئوهایی که شباهت شما را نشان میدهند حذف کنید. با این حال، شرکت هشدار میدهد که اگر شما اجازه دهید، دیگران ممکن است از شباهت شما استفاده کنند که این موضوع مسائل واضحی در حوزه حریم خصوصی و رضایت مطرح میکند.
بهطور کلی، ترکیب یک مولد قدرتمند با یک فید اجتماعی عمودی پتانسیل ایجاد روندهای تازهای در تولید محتوا را دارد: میتوان شاهد موج جدیدی از محتوای ویروسی ساخت که بدون دوربین و فرمهای تولید سنتی ایجاد میشوند. اما همین ویژگی میتواند سوگیریهای الگوریتمی، مشکلات مالکیت فکری و بحرانهای مربوط به استفاده از تشابه افراد را تشدید کند، مگر اینکه سیاستها و ابزارهای کنترلی دقیق اعمال شود.

ایمنی، محدودیتها و مسیرهای احتمالی درآمدزایی
OpenAI میگوید قصد دارد اپ Sora را «مسئولانه» عرضه کند و کنترلهایی را برای حمایت از سلامت روان و کاربران کمسن اعمال نماید. حسابهای نوجوانان با محدودیتهای روزانه برای تماشای ویدئوها روبهرو خواهند شد و قوانین سختگیرانهتری درباره استفاده از شباهت آنها در ویدئوها اعمال میشود. این رویکرد نشاندهندهٔ آگاهی از آسیبپذیری گروههای جوان و نیاز به محافظت اضافی است، هرچند پیادهسازی و نظارت بر این سیاستها در عمل چالشزا خواهد بود.
علاوه بر این، کاربران میتوانند با دادن بازخورد یا دستور به مدل، تعیین کنند چه محتوایی در فید آنها نمایش داده شود؛ به عبارت دیگر، سطح شخصیسازی قابلتغییری در اختیار مخاطب قرار دارد که میتواند تجربه مصرف را تنظیم کند. از منظر طراحی سیستم، این امر ترکیبی از کنترل مستقیم کاربر و پیشنهاددهی هوشمند است که باید با احتیاط پیادهسازی شود تا از غلبه محتواهای مخاطرهآمیز یا بسته شدن در حبابهای اطلاعاتی جلوگیری کند.
در باب درآمدزایی، OpenAI اعلام کرده برنامهٔ فوری برای نمایش تبلیغات ندارد، اما انتظار میرود در صورت تقاضای بیش از ظرفیت محاسباتی، گزینههای پرداختی معرفی شود. رویکرد مشخصشده این است که به کاربران امکان داده شود در زمان محدودیت ظرفیت، برای تولید ویدئوهای اضافی هزینه پرداخت کنند. این مدلِ «پرداخت برای اولویتِ تولید» میتواند منبع درآمد مستقیم و همزمانی برای مدیریت بار سرویس ایجاد کند، اما تعادل میان درآمدزایی و تجربهٔ کاربری، قیمتگذاری منصفانه و شفافیت در هزینهها عوامل کلیدی خواهند بود.
علاوه بر پرداخت برای تولید بیشتر، مسیرهای دیگری برای کسب درآمد بالقوه مطرح است: فروش اشتراکهای پریمیوم برای دسترسی به سبکها یا جلوههای اختصاصی، بازار آثار تولیدشده (با مکانیزمهای حقوق مالکیت فکری مشخص)، و ارائه ابزارهای سازمانی برای برندها و سازندگان بزرگ که نیاز به تولید محتوای باکیفیت در حجم بالا دارند. هر یک از این مسیرها نیازمند سیاستهای شفاف برای مالکیت آثار، اعتبارسنجی منبع دادههای آموزشی و مکانیزمهای مبارزه با سوءاستفاده است.
جمعبندی
سورا 2 گامی مهم در مسیر تولید ویدئو و صدا با هوش مصنوعی محسوب میشود: حرکت واقعیتر، کنترل دقیقتر و یک تجربهٔ اجتماعی یکپارچه که دعوت به اشتراکگذاری گسترده رسانهٔ مصنوعی میکند. ترکیب ابزارهای قدرتمند تولید با فید اجتماعی عمودی هم فرصتهای خلاقانه را تسریع میکند و هم معضلات اخلاقی را تشدید خواهد کرد. موفقیت یا شکست این پروژه به نحوه اجرای مقررات رضایت و کنترلی، شیوههای پالایش محتوا، و توازن بین رشد و ایمنی بستگی دارد. اگر OpenAI بتواند چارچوبهای شفافی برای موافقت از استفاده از شباهت افراد، شناسایی و حذف محتوای سوءاستفادهکننده و اطلاعرسانی تغییرات سیاستی فراهم کند، سورا میتواند به پلتفرمی خلاق بدل شود؛ در غیر این صورت احتمال دارد به محوری در مناقشات مربوط به deepfake و حریم خصوصی تبدیل گردد.
منبع: openai
ارسال نظر