به نقل از نیچر، یک سیستم هوش مصنوعی که برای گرفتن شرح حال پزشکی از بیماران آموزش دیده بود، از عملکرد پزشکان انسانی پیشی گرفت. این سیستم در مکالمه با بیماران فرضی و فهرستبندی تشخیصهای احتمالی بر اساس سابقه پزشکی بیماران بهتر عمل کرد.
این چت بات که بر اساس یک مدل زبانی بزرگ توسعه یافته توسط گوگل ساخته شده است، در تشخیص بیماریهای تنفسی و قلبی عروقی و غیره، از پزشکان دقیقتر بود. ربات در مقایسه با پزشکان انسانی، توانست مقدار مشابهی از اطلاعات را در طول مصاحبه های پزشکی به دست آورد و در همدردی با بیمار در رتبه بالاتری قرار گرفت.
آیا دنیا برای چت جی پی تی درمانگر آماده است؟
آلن کارتیکسالینگام، دانشمند تحقیقات بالینی در گوگل هلث و یکی از نویسندگان این مقاله میگوید: طبق اطلاعات ما، این اولین بار است که یک سیستم هوش مصنوعی مبتنی بر مکالمه برای گفتگوهای تشخیصی و گرفتن تاریخچه بالینی طراحی شده است.
این ربات چت که به AMIE معروف است، هنوز کاملاً آزمایشی است و روی افرادی با مشکلات واقعی سلامتی آزمایش نشده است. نویسندگان استدلال می کنند که حتی با وجود اینکه چت بات در مراقبت های بالینی استفاده نمی شود، در نهایت می تواند نقشی در دموکراتیک کردن مراقبت های بهداشتی ایفا کند. آدام رادمن، پزشک داخلی در دانشکده پزشکی هاروارد در بوستون، می گوید که این ابزار می تواند مفید باشد، اما نباید جایگزین تعامل با پزشکان شود. او میگوید: «پزشکی خیلی بیشتر از جمعآوری اطلاعات است و همه چیز به روابط انسانی مربوط میشود.»
یادگیری یک کار ظریف
رادمن می گوید که دانشجویان پزشکی زمان زیادی را برای آموزش برای گرفتن سابقه پزشکی فرد و استفاده از آن جهت رسیدن به تشخیص صرف می کنند.»
ویوک ناتاراجان، دانشمند تحقیقاتی هوش مصنوعی در گوگل هلث و یکی از نویسندگان این مطالعه، میگوید یکی از چالشهای پیش روی توسعهدهندگان کمبود مکالمات پزشکی در دنیای واقعی برای استفاده به عنوان دادههای آموزشی بود. برای مقابله با این چالش، محققان راهی ابداع کردند که ربات چت بتواند روی مکالمات خود آموزش ببیند.
محققان دور اولیه تنظیم دقیق مدل زبانی بزرگ پایه را با مجموعه داده های موجود در دنیای واقعی، مانند پرونده الکترونیک سلامت و مکالمات پزشکی رونویسی شده انجام دادند. برای آموزش بیشتر این مدل، محققان مدل زبانی بزرگ را ترغیب کردند که نقش یک فرد مبتلا به یک بیماری خاص و یک پزشک همدل را با هدف درک تاریخچه فرد و انجام تشخیص ایفا کند.
این تیم همچنین از مدل خواست تا یک نقش دیگر بازی کند: نقش منتقدی که تعامل پزشک با فرد تحت درمان را ارزیابی میکند و بازخوردی در مورد چگونگی بهبود این تعامل ارائه میدهد. این نقد برای آموزش بیشتر مدل زبانی بزرگ و ایجاد دیالوگ های بهبود یافته استفاده می شود.
محققان برای آزمایش این سیستم، از 20 نفر خواستند تا خود را به عنوان بیمار جا زده و با ربات AMIE و پزشک مشاوره های متنی آنلاین داشته باشند. به آنها گفته نشد که آیا با یک انسان چت می کنند یا یک ربات.
هوش مصنوعی از پزشکان جانماند
سیستم هوش مصنوعی در هر 6 تخصص پزشکی در نظر گرفته شده با دقت تشخیصی پزشکان مطابقت داشت یا از آن پیشی گرفت. این ربات در ۲۴ مورد از ۲۶ معیار کیفیت مکالمه، از جمله ادب، توضیح شرایط و درمان، صادق بودن، ابراز مراقبت و تعهد، از پزشکان بهتر عمل کرد.
کارتیکسالینگام گفت: «این به هیچ وجه به این معنی نیست که یک مدل زبانی در گرفتن تاریخچه بالینی بهتر از پزشکان است.» او خاطرنشان می کند که پزشکان شرکت کننده در این مطالعه احتمالاً به تعامل با بیماران از طریق چت مبتنی بر متن عادت نداشتند و این ممکن است بر عملکرد آنها تأثیر بگذارد. از طرفی یک مدل زبانی بزرگ دارای مزیت هایی است که میتواند به سرعت پاسخهای طولانی و ساختاربندی شده زیبا بنویسد که به آن اجازه میدهد بدون اینکه خسته شود، مدام با ملاحظه باشد.
ربات گفت و گوی بی طرف
دانشمندان اعلام کردند گام بعدی مهم برای این تحقیق، انجام مطالعات دقیقتر برای ارزیابی سوگیریها و اطمینان از منصفانه بودن سیستم در بین جمعیتهای مختلف است. تیم گوگل همچنین شروع به بررسی الزامات اخلاقی برای آزمایش این سیستم با انسانهایی میکند که مشکلات پزشکی واقعی دارند.
دانیل تینگ، دانشمند بالینی هوش مصنوعی سنگاپور، می گوید که حریم خصوصی کاربران چت بات جنبه مهمی است که باید در نظر گرفته شود. او افزود: « ما در حال حاضر برای بسیاری از این پلتفرمهای مدل زبانی بزرگ تجاری، مطمئن نیستیم که دادهها در کجا ذخیره میشوند و چگونه تجزیه و تحلیل میشوند.»