مواظب حرف زدنتان باشید! هوش مصنوعی لب خوانی می کند

0
948

کالاسودا_نوعی هوش مصنوعی رونمایی شده است که می تواند اقدام به لب خوانی کند. این هوش مصنوعی برای افراد نابینا و ناشنوا بسیار کاربردی است.

در حال حاضر، میلیون‌ها نفر در سراسر جهان ناشنوا هستند. برای این افراد، لب‌خوانی دریچه‌ای به سوی مکالمه با افراد دیگر است که بدون آن کاملا تعامل‌شان را از دست خواهند داد.

 البته خود این لب‌خوانی کار بسیار دشوار و با خطای بسیار است. بر همین اساس متخصصان هوش مصنوعی‌ای را طراحی کرده‌اند که به لب‌خوانی افراد ناشنوا کمک می‌کند.

ماجرای سیستم لب خوانی چیست؟

پژوهشگران خبر از طراحی یک هوش مصنوعی داده‌اند که از لب‌خوانان حرفه‌ای و بهترین برنامه هوش مصنوعی‌ای که تاکنون ساخته‌ شده است، بهره می‌برد. فقط کافی است که این برنامه به دستگاه هوشمندی وصل شود تا کل لب‌خوانی را کف دستان افراد ناشنوا بگذارد.

نوشتن کد کامپیوتری که بتواند لب‌خوانی کند کار بسیار سخت است. به همین دلیل دانشمندان در مطالعات جدید خود از نوعی هوش مصنوعی با عنوان یادگیری ماشینی بهره برده‌اند که این برنامه آزمون و خطا انجام می‌دهد و خودش تجربه کسب می‌کند و می‌آموزد.

این برنامه واقعا کار می کند؟

این سیستم مسیر ساده ای را برای موفقیت طی نکرده است. درواقع این سیستم برای این که این هوش مصنوعی لب‌خوانی را یاد بگیرد، ۱۴۰ هزار ساعت ویدئو از یوتیوب از افرادی که در شرایط مختلف در حال صحبت هستند را بررسی کرده است. سپس پژوهشگران برنامه‌ای را طراحی کردند که کلیپ‌های چند ثانیه‌ای از حرکات لب برای ادای کلمات تولید می‌کرد.

برنامه ای برای انگلیسی زبان ها یا غیر انگلیسی زبان ها؟

این برنامه سخنرانی‌های غیرانگلیسی، صورت‌هایی که اصلا صحبت نمی‌کنند، ویدئوهای بی‌کیفیت و همچنین آنهایی که صورت فرد به صورت کامل مشخص نیست را از بقیه جدا می‌کرد. سپس تکه‌هایی از ویدئو را که در آنها صورت و لب‌های افراد مشخص بودند، ذخیره کردند. نتیجه این کار ۴ هزار ساعت ویدئو از مکالمات انسانی باقی ماند که در آنها به‌درستی حرکات لب قابل دیدن و شناسایی است و شامل ۱۲۷ هزار کلمه انگلیسی است.

روش کار پیچیده است؟

کل فرآیند گفته شده و همچنین تنظیم اطلاعات نتیجه‌گیری شده، هفت برابر سخت‌تر از زمانی است که می‌خواهید سیستم لب‌خوانی را به یک انسان یاد دهید.

فرایند یادگیری لب‌خوانی به هوش مصنوعی در این بخش به شبکه عصبی مصنوعی متکی است. الگوریتم‌های هوش مصنوعی حاوی بسیاری از عناصر محاسباتی ساده متصل با یکدیگر هستند که اطلاعات را به نحوی شبیه به مغز انسان یاد می‌گیرند و پردازش می‌کنند.

به نظر شما می توانیم با این فرایند به ناشنوایان کمک کنیم؟

با عضویت در کانال تلگرام کالاسودا در جریان آخرین خبرهای حوزه فناوری قرار بگیرید