دستگاه پوشیدنی پوهانگ برای تبدیل گفتار بی صدا به صدای طبیعی

دستگاه پوشیدنی پوهانگ برای تبدیل گفتار بی صدا به صدای طبیعی

نظرات

4 دقیقه

تصور کنید می‌خواهید بدون تولید هیچ صدایی صحبت کنید و با این حال دیگران شما را بفهمند. این دیگر داستان علمی-تخیلی نیست.

پژوهشگران دانشگاه علم و فناوری پوهانگ سیستمی پوشیدنی توسعه داده‌اند که می‌تواند گفتار خاموش را با ردیابی حرکات بسیار ریز عضلات و پوست اطراف گردن به صدای شنیداری تبدیل کند. این کار به سرپرستی پروفسور سونگ-مین پارک و دکتر سونگوک هانگ انجام شد، در نشریه سامانه‌های سایبورگ و بیونیک منتشر شده و فصل جدیدی در ارتباط انسان و ماشین را نوید می‌دهد.

چگونه یک نجوا به صدا تبدیل می‌شود

ایده ساده اما هوشمندانه است. حتی وقتی یک نفر با صدای بلند صحبت نمی‌کند، بدن هنوز حرکت می‌کند. تغییرات ظریف در گردن، فک و پوست اطراف شکل کلمات مورد نظر را نمایان می‌سازند. آن حرکات یک سیگنال فیزیکی ایجاد می‌کنند که قابل ثبت و تفسیر است.

برای انجام این کار، تیم پوهانگ دستگاه پوشیدنی‌ای به نام «حسگر نقشه‌برداری کرنش چندمحوری» ساخت. این دستگاه از یک دوربین مینیاتوری و سیلیکون انعطاف‌پذیر علامت‌گذاری شده با نقاط مرجع استفاده می‌کند تا حتی تغییرات سطحی بسیار جزئی را تشخیص دهد. در عمل، یعنی حسگر می‌تواند به‌راحتی روی گردن قرار گیرد، حرکت‌ها را با دقت دنبال کند و در صورت جابه‌جایی موقعیت خود را بازتنظیم کند.

پس از جمع‌آوری داده‌ها، هوش مصنوعی وارد عمل می‌شود. سیستم الگوهای کرنش را می‌خواند، قصد گفتاری را شناسایی می‌کند و کلمات یا جملات کامل را بازسازی می‌کند. سپس آن خروجی را با سنتز صدایی که بر اساس ویژگی‌های صوتی خود پوشنده آموزش دیده جفت می‌کند تا گفتاری طبیعی و قابل شناسایی تولید شود.

پیشرفت واقعی این نیست که سیستم بتواند «سکوت» را بشنود، بلکه این است که صدای خود گوینده را حفظ کند.

پاسخی سبک‌تر برای یک مشکل سرسخت

فناوری بازسازی صدا مدت‌ها بر ابزارهایی مانند الکترومایوگرافی و الکتروانسفالوگرافی متکی بوده است. آن سیستم‌ها می‌توانند موثر باشند، اما اغلب با مشکلاتی همراه‌اند: سخت‌افزار حجیم، راه‌اندازی پیچیده و راحتی محدود برای استفاده روزمره.

اینجاست که رویکرد پوهانگ متمایز می‌شود. این راهکار پوشیدنی، سبک و برای استفاده عملی طراحی شده است نه صرفاً نمایشگاه‌های آزمایشگاهی. در آزمایش‌ها، سیستم دقت بالایی در بازسازی گفتار نشان داد، حتی در محیط‌های پرسر و صدایی که میکروفن‌های معمولی اغلب ناکام می‌مانند. محیط‌های صنعتی به‌ویژه میدان‌های آزمایشی دشواری هستند و به نظر می‌رسد این فناوری دقیقاً برای چنین چالش‌هایی ساخته شده است.

موارد استفاده بالقوه آشکارند. برای بیمارانی که به‌خاطر آسیب تارهای صوتی یا جراحی حنجره صدایشان را از دست داده‌اند، این می‌تواند راهی برای برقراری ارتباط دوباره با چیزی نزدیک به صدای طبیعی خودشان فراهم کند. این موضوع بی‌اهمیت نیست؛ برای بسیاری از افراد می‌تواند تحول‌آفرین باشد.

اما تأثیر ممکن است فراتر از حوزه درمانی باشد.

ارتباط خاموش می‌تواند در جلسات، کتابخانه‌ها، مراکز حمل‌ونقل شلوغ یا محیط‌های کاری پرسروصدا که صحبت کردن بلند نامناسب یا غیرممکن است مفید واقع شود. همچنین می‌تواند نحوه تعامل مردم با سیستم‌های هوش مصنوعی را بازتعریف کند و فرمان‌ها و پاسخ‌ها را کمتر مکانیکی و بیشتر شهودی کند. نه صفحه‌کلید، نه میکروفن؛ تنها نیت تبدیل‌شده به گفتار.

فعلاً تیم تحقیق روی بهبود دقت، گسترش پشتیبانی زبانی و سازگارتر کردن سیستم برای استقرار در دنیای واقعی تمرکز دارد. اگر این قطعات کنار هم قرار بگیرند، این نوع هوش مصنوعی پوشیدنی ممکن است زودتر از آنچه بسیاری تصور می‌کنند از نمونه‌های اولیه امیدوارکننده به ابزاری روزمره تبدیل شود.

روند کلی به‌سختی قابل چشم‌پوشی است. هوش مصنوعی کمتر دیده می‌شود، شخصی‌تر می‌شود و در دستگاه‌هایی که می‌پوشیم بیش از پیش جای می‌گیرد. و با نوآوری‌هایی مانند این، حتی کلمات ناگفته نیز ممکن است به زودی صدا پیدا کنند.

ارسال نظر

نظرات

مطالب مرتبط