متیو سالگانیک، جامعهشناس دانشگاه پرینستون که در این کار دخالتی نداشت، میگوید اگر بتوان این رویکرد را در جوامع مختلف نشان داد، میتواند ابزار جدیدی را در اختیار دانشمندان علوم اجتماعی قرار دهد تا بررسی کنند که چگونه ویژگیها و رویدادها بر سرنوشت افراد تأثیر میگذارند. من فکر میکنم که بیشتر سؤالات را به وجود میآورد تا پاسخ دهد. و منظور من این است که به روشی مثبت.
پیش از این، سالگانیک و همکارانش - همراه با بیش از 100 تیم دیگر - تلاش کردند تا مدلهای یادگیری ماشینی را برای پیشبینی نتایج زندگی با استفاده از دادههای مربوط به سلامت، روابط خانوادگی و آموزش حدود 5000 کودک بالای 15 سال توسعه دهند. با این حال، هیچ یک از مدلهای آنها پیشبینی دقیقی نداشتند .
در مطالعه جدید، محققان به نوع دیگری از مدل روی آوردند: مدلهای زبان بزرگ، مانند مدلی که ChatGPT را تقویت میکند. این الگوریتم ها ابتدا حجم عظیمی از متن را تجزیه و تحلیل می کنند و به دنبال الگوهایی در رشته های کلمات و جملات می گردند. سپس مدلها از اطلاعاتی که آموختهاند برای پیشبینی کلمات بعدی در یک جمله استفاده میکنند.
Sune Lehmann، دانشمند شبکه و پیچیدگی در دانشگاه فنی دانمارک، و همکارانش تعجب کردند که آیا این مدلها میتوانند در توالیهای دیگر نیز معنا پیدا کنند، مانند مواردی که داستان زندگی ما را میسازند. او میگوید: «درست مانند زبان، ترتیب وقایع زندگی واقعاً مهم است. به عنوان مثال، تشخیص سرطان بلافاصله پس از یافتن شغلی با مزایای سلامتی خوب، احتمالاً تأثیر متفاوتی با معکوس شدن آن رویدادها خواهد داشت.
برای اینکه داده ها به الگوریتم متصل شوند، محققان به ثبت ملی دانمارک مراجعه کردند که حاوی سوابق کار و سلامت برای هر یک از تقریباً 6 میلیون شهروند این کشور است. این تیم جزئیاتی مانند حقوق، مزایای اجتماعی، عنوان شغلی، و بازدید از بیمارستان و تشخیص را به زبانی مصنوعی ترجمه کردند که در آن رویدادهای زندگی مجردی تبدیل به جمله شدند. به عنوان مثال، "در آگوست 2010، اگنس 30000 کرون دانمارک به عنوان ماما در بیمارستانی در کپنهاگ به دست آورد." این مدل با قرار دادن این رویدادها در یک جدول زمانی، داستان زندگی دیجیتالی هر فرد را بازسازی کرد.
محققان بین سالهای 2008 تا 2016 مدلی به نام «life2vec» را بر روی داستان زندگی هر فرد آموزش دادند و مدل به دنبال الگوهایی در این داستانها بود. در مرحله بعد، آنها از این الگوریتم برای پیشبینی اینکه آیا فردی در فهرست ملی دانمارک تا سال 2020 فوت کرده است یا خیر، استفاده کردند.
پیشبینیهای این مدل در ۷۸ درصد مواقع دقیق بود. چندین فاکتور را شناسایی کرد که باعث افزایش خطر مرگ زودرس می شود، از جمله داشتن درآمد کم، داشتن تشخیص سلامت روان و مرد بودن. اشتباهات این مدل معمولاً ناشی از تصادفات یا حملات قلبی است که پیش بینی آنها دشوار است.
اگرچه نتایج جالب است - اگر کمی تلخ باشد - برخی از دانشمندان هشدار می دهند که این الگوها ممکن است برای جمعیت های غیر دانمارکی صادق نباشد. یویو وو، روانشناس در دانشگاه کالج لندن، می گوید: «دیدن این مدل که با استفاده از داده های گروهی از کشورهای دیگر اقتباس شده است، به طور بالقوه الگوهای جهانی را آشکار می کند، یا تفاوت های ظریف فرهنگی منحصر به فرد را برجسته می کند، جذاب خواهد بود.
او اضافه میکند که سوگیری در دادهها میتواند پیشبینیهای آن را مخدوش کند. وو می افزاید ( تشخیص بیش از حد اسکیزوفرنی در میان سیاه پوستان می تواند باعث شود که الگوریتم ها به اشتباه آنها را در معرض خطر بالاتر مرگ زودرس قرار دهند.) وو می افزاید.
Lehmann و همکارانش همچنین دریافتند که مدل آنها به طور دقیق سایر جنبه های زندگی افراد را پیش بینی می کند، مانند اینکه آیا آنها بیشتر یا کمتر برون گرا هستند یا خیر. ساندرا ماتز، دانشمند علوم اجتماعی محاسباتی در مدرسه بازرگانی کلمبیا، میگوید که این چندان تعجب آور نیست. حتی الگوریتمهای سادهتر هم میتوانند مشاغل خاصی را - مثلاً یک آرایشگر - با برونگرایی مرتبط کنند. "این که آیا می تواند همه نوع رفتار را پیش بینی کند، من تا حدودی شک دارم."
Lehmann میگوید که تصور میکند این مدل ممکن است روزی برای شناسایی خطر بیماری یک فرد مفید باشد، که میتواند به آنها کمک کند تا گامهایی برای حفظ سلامت خود بردارند. او خاطرنشان می کند که چنین برنامه هایی با انبوهی از سوالات در مورد حریم خصوصی داده ها همراه هستند که قبل از اینکه مدل او بتواند به کسی کمک کند باید مرتب شود. "بهترین راهی که می توانم برای شروع این بحث فکر کنم این است که تصویری از آنچه حتی ممکن است ایجاد کنم."