خلاصه: این تحقیق راهی برای کمک به افرادی است که نمیتوانند از طریق گفتار ارتباط برقرار کنند. هوش مصنوعی میتواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفتآور – اما هنوز محدود – رمزگشایی کند. هوش مصنوعی تنها با استفاده از چند ثانیه از دادههای فعالیت مغز، آنچه را که شخص شنیده است حدس می زند. محققان در یک مطالعه اولیه دریافتند که این پاسخ صحیح را در 73 درصد مواقع در 10 احتمال برتر فهرست میکند.
جیووانی دی لیبرتو، دانشمند کامپیوتر در کالج ترینیتی دوبلین که در این تحقیق شرکت داشت، میگوید: «عملکرد هوش مصنوعی بالاتر از آن چیزی است که بسیاری از مردم فکر میکردند».
محققان در 25 آگوست در arxiv.org گزارش دادند که هوش مصنوعی که در شرکت مادر فیسبوک و متا توسعه یافته است، در نهایت میتواند برای کمک به هزاران نفر در سراسر جهان که قادر به برقراری ارتباط از طریق گفتار، تایپ یا اشاره نیستند، استفاده شود. این شامل بسیاری از بیمارانی است که با حداقل هوشیاری، قفل شده، یا “حالت رویشی” هستند – چیزی که اکنون به طور کلی بهعنوان سندرم بیداری بیپاسخ شناخته میشود (SN: 2/8/19).
بیشتر فناوریهای موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحیهای خطرناک مغز برای کاشت الکترود دارند. ژان رمی کینگ، عصب شناس، محقق هوش مصنوعی متا که در حال حاضر در اکول نرمال سوپریور واق در پاریس مشغول به کار است، میگوید: «این رویکرد جدید میتواند بدون استفاده از روشهای تهاجمی، راهی مناسب برای کمک به بیماران مبتلا به نقصهای ارتباطی فراهم کند.
کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در 56000 ساعت ضبط گفتار از 53 زبان آموزش دادند. این ابزار که بهعنوان یک مدل زبان نیز شناخته میشود، یاد گرفت که چگونه ویژگیهای خاص زبان را هم در سطح دقیق – به حروف یا هجاها فکر کنید – و هم در سطح گستردهتر، مانند یک کلمه یا جمله، تشخیص دهد.
این تیم یک هوش مصنوعی با این مدل زبان را در پایگاههای اطلاعاتی چهار موسسه که شامل فعالیت مغزی 169 داوطلب میشد، اعمال کردند. در این پایگاههای اطلاعاتی، شرکتکنندگان به داستانها و جملات مختلفی از جمله «پیرمرد و دریا» اثر ارنست همینگوی و «ماجراهای آلیس در سرزمین عجایب» اثر لوئیس کارول گوش میدادند، درحالی که مغز افراد با استفاده از مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی اسکن میشد. این تکنیکها اجزای مغناطیسی یا الکتریکی سیگنالهای مغز را اندازه گیری میکنند.
سپس با کمک یک روش محاسباتی که به توضیح تفاوتهای فیزیکی بین مغزهای واقعی کمک میکند، تیم سعی کرد آنچه را که شرکتکنندگان شنیده بودند با استفاده از تنها سه ثانیه دادههای فعالیت مغز از هر فرد رمزگشایی کنند. این تیم به هوش مصنوعی دستور داد تا صداهای گفتار را از ضبط داستان با الگوهای فعالیت مغزی که هوش مصنوعی مطابق با آنچه مردم میشنوند محاسبه میکرد، تراز کند. سپس با توجه به بیش از 1000 احتمال، پیشبینیهایی درباره آنچه ممکن است فرد در این مدت کوتاه میشنود، انجام داد.
محققان دریافتند با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در 73 درصد مواقع در 10 حدس برتر هوش مصنوعی قرار داشت. با الکتروانسفالوگرافی، این مقدار به بیش از 30 درصد کاهش یافت. دی لیبرتو میگوید: «عملکرد [MEG] بسیار خوب است، اما او نسبت به استفاده عملی آن خوشبین نیست. «ما با آن چه کنیم؟ هیچ چی. مطلقاً هیچ چیزی.”
او میگوید دلیل آن این است که MEG به یک دستگاه حجیم و گران قیمت نیاز دارد. آوردن این فناوری به کلینیکها مستلزم نوآوریهای علمی است که ماشینها را ارزانتر و آسانتر میکند.
جاناتان برنان، زبان شناس در دانشگاه میشیگان در آن آربور، میگوید که درک معنای واقعی «رمزگشایی» در این مطالعه نیز مهم است. این کلمه اغلب برای توصیف فرآیند رمزگشایی اطلاعات بهطور مستقیم از یک منبع – در این مورد، گفتار از فعالیت مغز – استفاده میشود. اما هوش مصنوعی تنها به این دلیل میتوانست این کار را انجام دهد، زیرا فهرست محدودی از پاسخهای صحیح ممکن برای حدسهای خود ارائه شده بود.
برنان میگوید: «در مورد زبان، اگر بخواهیم برای استفاده عملی مقیاسبندی کنیم، آن را کاهش نمیدهد، زیرا زبان بینهایت است.
علاوهبر این، دی لیبرتو میگوید، هوش مصنوعی اطلاعات شرکتکنندگانی را که منفعلانه به صدا گوش میدهند رمزگشایی میکند، که مستقیماً به بیماران غیرکلامی مربوط نمیشود. برای اینکه این ابزار به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید بیاموزند که چگونه از فعالیت مغز آنچه این بیماران قصد گفتن دارند رمزگشایی کنند، از جمله ابراز گرسنگی، ناراحتی یا یک «بله» یا «نه» ساده.
نویسنده: جاناتان مونز
منبع: کالج ترینیتی دوبلین