3 دقیقه
اوپنایآی ابزارهای تولید تصویر خود را یک گام به چیزی نزدیکتر کرده که کمتر شبیه یک فیلتر و بیشتر مانند یک دستیار خلاق است. تصاویر ChatGPT 2.0 اکنون با آنچه شرکت آن را «قابلیتهای تفکر» مینامد در دسترس قرار گرفته و این موضوع سریعاً روند بحث را تغییر میدهد.
به جای تبدیل صرف یک دستور به تصویر، سیستم جدید میتواند از وب تحقیق کرده و اطلاعات را ترکیب کند، سپس آن مواد را به تصاویر پالایششده و سطح تولید تبدیل کند. در عمل، این بدان معناست که این ابزار تنها به عنوان یک تولیدکننده تصویر مطرح نیست، بلکه میتواند در ساخت نمودارها، اینفوگرافیکها، دیاگرامها و سایر داراییهای بصری با زمینهٔ بیشتر کمک کند.
اوپنایآی همچنین تصاویر 2.0 را به عنوان جایگزینی جدی برای اپلیکیشنهای ویرایشی مستقل معرفی میکند. این ابزار میتواند پسزمینهها را حذف کند، نسبت تصویر را تنظیم کند و تا هشت تصویر همزمان با رزولوشن 2K تولید کند. این ویژگی آن را برای خالقان محتوا، بازاریابان و تیمهایی که به سرعت به تصاویر نیاز دارند و نمیخواهند بین چند ابزار جابجا شوند، گزینهای انعطافپذیرتر میسازد.

نگاه دقیقتر به جزئیات
یکی از بزرگترین بهبودها نحوهٔ عملکرد مدل در برابر تصاویر ساختاریافته است. گفته میشود اینفوگرافیکها و دیاگرامها با دقت قابلتوجهتری تولید میشوند و بهروزرسانی از دامنهٔ وسیعتری از زبانها با دقت بالاتر پشتیبانی میکند. به نظر میرسد که در اجرای دستورهای ورودی هم وفاداری بیشتری دارد، مسئلهای که اغلب تفاوت بین یک نتیجهٔ قابلاستفاده و یک تلاش مکرر ناامیدکننده را رقم میزند.
اهمیت این موضوع بیشتر از چیزی است که بهنظر میرسد. هر کسی که از ابزارهای تصویری مبتنی بر هوش مصنوعی استفاده کرده باشد، درد از دست دادن یک جزئیات کلیدی، خارجشدن از محور موضوع یا نمایش نامناسب متن را میشناسد. اوپنایآی ظاهراً مستقیماً آن نقاط ضعف را هدف گرفته است، بهویژه برای کاربرانی که به تصاویری نیاز دارند که نهتنها جذاب باشند، بلکه در محیطهای حرفهای واقعاً قابلاستفاده باشند.

تصاویر ChatGPT 2.0 برای همهٔ کاربران ChatGPT در دسترس است، اما حالت پیشرفتهتر «تصاویر با تفکر» مختص پلنهای پلاس، پرو، کسبوکار و سازمانی است. بنابراین در حالی که همه به موتور نسل جدید دسترسی دارند، لایهٔ هوشمندتر تجربه در پشت سطحهای پولی قرار دارد.
تصویر کلی بهراحتی قابلتشخیص است. اوپنایآی تولید تصویر را از نوآوری یکباره به سمت ابزاری در جریان کاری که میتواند استدلال کند، زمینه را جمعآوری کند و خروجیهای پاکتر در مقیاس تولید کند، سوق میدهد. برای تیمهایی که سرعت، ثبات و کیفیت بصری برایشان حیاتی است، این تحولی معنادار است.
ارسال نظر