هوش مصنوعی می‌تواند گفتار را از فعالیت مغز با دقت شگفت انگیزی رمزگشایی کند.

فوریه 10, 2023

خلاصه: این تحقیق راهی برای کمک به افرادی است که نمی‌توانند از طریق گفتار ارتباط برقرار کنند. هوش مصنوعی می‌تواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفت‌آور – اما هنوز محدود – رمزگشایی کند. هوش مصنوعی تنها با استفاده از چند ثانیه از داده‌های فعالیت مغز، آنچه را که شخص شنیده است حدس می زند. محققان در یک مطالعه اولیه دریافتند که این پاسخ صحیح را در 73 درصد مواقع در 10 احتمال برتر فهرست می‌کند.

جیووانی دی لیبرتو، دانشمند کامپیوتر در کالج ترینیتی دوبلین که در این تحقیق شرکت داشت، می‌گوید: «عملکرد هوش مصنوعی بالاتر از آن چیزی است که بسیاری از مردم فکر می‌کردند».

محققان در 25 آگوست در arxiv.org گزارش دادند که هوش مصنوعی که در شرکت مادر فیسبوک و متا توسعه یافته است، در نهایت می‌تواند برای کمک به هزاران نفر در سراسر جهان که قادر به برقراری ارتباط از طریق گفتار، تایپ یا اشاره نیستند، استفاده شود. این شامل بسیاری از بیمارانی است که با حداقل هوشیاری، قفل شده، یا “حالت رویشی” هستند – چیزی که اکنون به طور کلی به‌عنوان سندرم بیداری بی‌پاسخ شناخته می‌شود (SN: 2/8/19).

بیشتر فناوری‌های موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحی‌های خطرناک مغز برای کاشت الکترود دارند. ژان رمی کینگ، عصب شناس، محقق هوش مصنوعی متا که در حال حاضر در اکول نرمال سوپریور واق در پاریس مشغول به کار است، می‌گوید: «این رویکرد جدید می‌تواند بدون استفاده از روش‌های تهاجمی، راهی مناسب برای کمک به بیماران مبتلا به نقص‌های ارتباطی فراهم کند.

کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در 56000 ساعت ضبط گفتار از 53 زبان آموزش دادند. این ابزار که به‌عنوان یک مدل زبان نیز شناخته می‌شود، یاد گرفت که چگونه ویژگی‌های خاص زبان را هم در سطح دقیق – به حروف یا هجاها فکر کنید – و هم در سطح گسترده‌تر، مانند یک کلمه یا جمله، تشخیص دهد.

این تیم یک هوش مصنوعی با این مدل زبان را در پایگاه‌های اطلاعاتی چهار موسسه که شامل فعالیت مغزی 169 داوطلب می‌شد، اعمال کردند. در این پایگاه‌های اطلاعاتی، شرکت‌کنندگان به داستان‌ها و جملات مختلفی از جمله «پیرمرد و دریا» اثر ارنست همینگوی و «ماجراهای آلیس در سرزمین عجایب» اثر لوئیس کارول گوش می‌دادند، درحالی که مغز افراد با استفاده از مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی اسکن می‌شد. این تکنیک‌ها اجزای مغناطیسی یا الکتریکی سیگنال‌های مغز را اندازه گیری می‌کنند.

سپس با کمک یک روش محاسباتی که به توضیح تفاوت‌های فیزیکی بین مغزهای واقعی کمک می‌کند، تیم سعی کرد آنچه را که شرکت‌کنندگان شنیده بودند با استفاده از تنها سه ثانیه داده‌های فعالیت مغز از هر فرد رمزگشایی کنند. این تیم به هوش مصنوعی دستور داد تا صداهای گفتار را از ضبط داستان با الگوهای فعالیت مغزی که هوش مصنوعی مطابق با آنچه مردم می‌شنوند محاسبه می‌کرد، تراز کند. سپس با توجه به بیش از 1000 احتمال، پیش‌بینی‌هایی درباره آنچه ممکن است فرد در این مدت کوتاه می‌شنود، انجام داد.

محققان دریافتند با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در 73 درصد مواقع در 10 حدس برتر هوش مصنوعی قرار داشت. با الکتروانسفالوگرافی، این مقدار به بیش از 30 درصد کاهش یافت. دی لیبرتو می‌گوید: «عملکرد [MEG] بسیار خوب است، اما او نسبت به استفاده عملی آن خوش‌بین نیست. «ما با آن چه کنیم؟ هیچ چی. مطلقاً هیچ چیزی.”

او می‌گوید دلیل آن این است که MEG به یک دستگاه حجیم و گران قیمت نیاز دارد. آوردن این فناوری به کلینیک‌ها مستلزم نوآوری‌های علمی است که ماشین‌ها را ارزان‌تر و آسان‌تر می‌کند.

جاناتان برنان، زبان شناس در دانشگاه میشیگان در آن آربور، می‌گوید که درک معنای واقعی «رمزگشایی» در این مطالعه نیز مهم است. این کلمه اغلب برای توصیف فرآیند رمزگشایی اطلاعات به‌طور مستقیم از یک منبع – در این مورد، گفتار از فعالیت مغز – استفاده می‌شود. اما هوش مصنوعی تنها به این دلیل می‌توانست این کار را انجام دهد، زیرا فهرست محدودی از پاسخ‌های صحیح ممکن برای حدس‌های خود ارائه شده بود.

برنان می‌گوید: «در مورد زبان، اگر بخواهیم برای استفاده عملی مقیاس‌بندی کنیم، آن را کاهش نمی‌دهد، زیرا زبان بی‌نهایت است.

علاوه‌بر این، دی لیبرتو می‌گوید، هوش مصنوعی اطلاعات شرکت‌کنندگانی را که منفعلانه به صدا گوش می‌دهند رمزگشایی می‌کند، که مستقیماً به بیماران غیرکلامی مربوط نمی‌شود. برای اینکه این ابزار به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید بیاموزند که چگونه از فعالیت مغز آنچه این بیماران قصد گفتن دارند رمزگشایی کنند، از جمله ابراز گرسنگی، ناراحتی یا یک «بله» یا «نه» ساده.

نویسنده: جاناتان مونز

منبع: کالج ترینیتی دوبلین

نویسنده: آقای حسن طاهری

سرپرست آکادمی نوروساینس زانا

0 0 رای ها

امتیازدهی به مقاله

اشتراک در

اسم*

ایمیل*

آدرس سایت

0 نظرات

بازخورد (Feedback) های اینلاین

مشاهده همه دیدگاه ها

درباره آکادمی

آکادمی نوروساینس زانا با هدف توانمند سازی دانشجویان و در دسترس قرار دادن آموزش‌های علمی و معتبر در حوزه‌های مختلف علوم اعصاب، آماده ارائه خدمات به شما دوستداران علم می‌باشد.

شبکه‌های اجتماعی

جدیدترین اخبار

منوی سریع

سوالات متداول

همکاری در آکادمی

اگر مایل به عضویت و همکاری در آکادمی نوروساینس زانا می‌باشید درخواست خود را مبنی بر نوع همکاری‌تان و مهارت‌های که دارید را از طریق ایمیل ارسال نمایید، بعد بررسی از طریق ایمیل به شما اطلاع داده خواهد شد.

ارسال خبر

جهت ارسال خبر به آکادمی نوروساینس زانا و درج آن در سایت می‌توانید جدیدترین اخباری که در حیطه‌های علوم اعصاب و سایر حوزه‌های مرتبط را ترجمه و به ایمیل آکادمی ارسال نمایید پس از بررسی در صورت تایید خبر با اسم شما در سایت درج خواهد شد.

مزایای عضویت

با عضویت در آکادمی نوروساینس زانا از تخفیفات ویژه جهت سفارش خدمات و دوره‌های آنلاین و آفلاین برخودار خواهید شد، همچنین می‌توانید در قرعه کشی شرکت داده شوید و برنده خوش شانس ما جهت دریافت کد تخفیف 90 درصدی محصولات و خدمات شوید.

منتظر حضور گرمتان در خانواده آکادمی نوروساینس زانا هستیم.

اشتراک گذاری

بازدید کل: 9899

هوش مصنوعی می‌تواند گفتار را از فعالیت مغز با دقت شگفت انگیزی رمزگشایی کند.

چهارشنبه سوری از منظر روان‌شناسی

چه چیزی باعث دژاوو می‌شود؟

هوش مصنوعی می‌تواند گفتار را از فعالیت مغز با دقت شگفت انگیزی رمزگشایی کند.

سلامت دهان و دندان ضعیف باعث کاهش سلامت مغز می‌شود

رشد توده‌‌های سلول‌‌های عصبی انسان در مغز موش

منتظر حضور گرمتان در خانواده آکادمی نوروساینس زانا هستیم.

شماره تلفن:

زمان پاسخگویی:

ایمیل:

دسترسی سریع

خبرستان

ویژه نامه ها

درباره ما

تماس با ما