4 دقیقه
تصور کنید میخواهید بدون تولید هیچ صدایی صحبت کنید و با این حال دیگران شما را بفهمند. این دیگر داستان علمی-تخیلی نیست.
پژوهشگران دانشگاه علم و فناوری پوهانگ سیستمی پوشیدنی توسعه دادهاند که میتواند گفتار خاموش را با ردیابی حرکات بسیار ریز عضلات و پوست اطراف گردن به صدای شنیداری تبدیل کند. این کار به سرپرستی پروفسور سونگ-مین پارک و دکتر سونگوک هانگ انجام شد، در نشریه سامانههای سایبورگ و بیونیک منتشر شده و فصل جدیدی در ارتباط انسان و ماشین را نوید میدهد.
چگونه یک نجوا به صدا تبدیل میشود
ایده ساده اما هوشمندانه است. حتی وقتی یک نفر با صدای بلند صحبت نمیکند، بدن هنوز حرکت میکند. تغییرات ظریف در گردن، فک و پوست اطراف شکل کلمات مورد نظر را نمایان میسازند. آن حرکات یک سیگنال فیزیکی ایجاد میکنند که قابل ثبت و تفسیر است.
برای انجام این کار، تیم پوهانگ دستگاه پوشیدنیای به نام «حسگر نقشهبرداری کرنش چندمحوری» ساخت. این دستگاه از یک دوربین مینیاتوری و سیلیکون انعطافپذیر علامتگذاری شده با نقاط مرجع استفاده میکند تا حتی تغییرات سطحی بسیار جزئی را تشخیص دهد. در عمل، یعنی حسگر میتواند بهراحتی روی گردن قرار گیرد، حرکتها را با دقت دنبال کند و در صورت جابهجایی موقعیت خود را بازتنظیم کند.
پس از جمعآوری دادهها، هوش مصنوعی وارد عمل میشود. سیستم الگوهای کرنش را میخواند، قصد گفتاری را شناسایی میکند و کلمات یا جملات کامل را بازسازی میکند. سپس آن خروجی را با سنتز صدایی که بر اساس ویژگیهای صوتی خود پوشنده آموزش دیده جفت میکند تا گفتاری طبیعی و قابل شناسایی تولید شود.
پیشرفت واقعی این نیست که سیستم بتواند «سکوت» را بشنود، بلکه این است که صدای خود گوینده را حفظ کند.

پاسخی سبکتر برای یک مشکل سرسخت
فناوری بازسازی صدا مدتها بر ابزارهایی مانند الکترومایوگرافی و الکتروانسفالوگرافی متکی بوده است. آن سیستمها میتوانند موثر باشند، اما اغلب با مشکلاتی همراهاند: سختافزار حجیم، راهاندازی پیچیده و راحتی محدود برای استفاده روزمره.
اینجاست که رویکرد پوهانگ متمایز میشود. این راهکار پوشیدنی، سبک و برای استفاده عملی طراحی شده است نه صرفاً نمایشگاههای آزمایشگاهی. در آزمایشها، سیستم دقت بالایی در بازسازی گفتار نشان داد، حتی در محیطهای پرسر و صدایی که میکروفنهای معمولی اغلب ناکام میمانند. محیطهای صنعتی بهویژه میدانهای آزمایشی دشواری هستند و به نظر میرسد این فناوری دقیقاً برای چنین چالشهایی ساخته شده است.
موارد استفاده بالقوه آشکارند. برای بیمارانی که بهخاطر آسیب تارهای صوتی یا جراحی حنجره صدایشان را از دست دادهاند، این میتواند راهی برای برقراری ارتباط دوباره با چیزی نزدیک به صدای طبیعی خودشان فراهم کند. این موضوع بیاهمیت نیست؛ برای بسیاری از افراد میتواند تحولآفرین باشد.
اما تأثیر ممکن است فراتر از حوزه درمانی باشد.
ارتباط خاموش میتواند در جلسات، کتابخانهها، مراکز حملونقل شلوغ یا محیطهای کاری پرسروصدا که صحبت کردن بلند نامناسب یا غیرممکن است مفید واقع شود. همچنین میتواند نحوه تعامل مردم با سیستمهای هوش مصنوعی را بازتعریف کند و فرمانها و پاسخها را کمتر مکانیکی و بیشتر شهودی کند. نه صفحهکلید، نه میکروفن؛ تنها نیت تبدیلشده به گفتار.
فعلاً تیم تحقیق روی بهبود دقت، گسترش پشتیبانی زبانی و سازگارتر کردن سیستم برای استقرار در دنیای واقعی تمرکز دارد. اگر این قطعات کنار هم قرار بگیرند، این نوع هوش مصنوعی پوشیدنی ممکن است زودتر از آنچه بسیاری تصور میکنند از نمونههای اولیه امیدوارکننده به ابزاری روزمره تبدیل شود.
روند کلی بهسختی قابل چشمپوشی است. هوش مصنوعی کمتر دیده میشود، شخصیتر میشود و در دستگاههایی که میپوشیم بیش از پیش جای میگیرد. و با نوآوریهایی مانند این، حتی کلمات ناگفته نیز ممکن است به زودی صدا پیدا کنند.
ارسال نظر