این مدل که بر اساس داستان زندگی میلیون ها نفر در دانمارک آموزش داده شده است، به طرز شگفت آوری دقیق است

یک تصویر مفهومی از 1ها و 0ها که نمای کلی سر افراد را پوشش می دهد.
BRAIN LIGHT/ALAMY STOCK PHOTO

متیو سالگانیک، جامعه‌شناس دانشگاه پرینستون که در این کار دخالتی نداشت، می‌گوید اگر بتوان این رویکرد را در جوامع مختلف نشان داد، می‌تواند ابزار جدیدی را در اختیار دانشمندان علوم اجتماعی قرار دهد تا بررسی کنند که چگونه ویژگی‌ها و رویدادها بر سرنوشت افراد تأثیر می‌گذارند. من فکر می‌کنم که بیشتر سؤالات را به وجود می‌آورد تا پاسخ دهد. و منظور من این است که به روشی مثبت.

پیش از این، سالگانیک و همکارانش - همراه با بیش از 100 تیم دیگر - تلاش کردند تا مدل‌های یادگیری ماشینی را برای پیش‌بینی نتایج زندگی با استفاده از داده‌های مربوط به سلامت، روابط خانوادگی و آموزش حدود 5000 کودک بالای 15 سال توسعه دهند. با این حال، هیچ یک از مدل‌های آنها پیش‌بینی دقیقی نداشتند .


در مطالعه جدید، محققان به نوع دیگری از مدل روی آوردند: مدل‌های زبان بزرگ، مانند مدلی که ChatGPT را تقویت می‌کند. این الگوریتم ها ابتدا حجم عظیمی از متن را تجزیه و تحلیل می کنند و به دنبال الگوهایی در رشته های کلمات و جملات می گردند. سپس مدل‌ها از اطلاعاتی که آموخته‌اند برای پیش‌بینی کلمات بعدی در یک جمله استفاده می‌کنند.

Sune Lehmann، دانشمند شبکه و پیچیدگی در دانشگاه فنی دانمارک، و همکارانش تعجب کردند که آیا این مدل‌ها می‌توانند در توالی‌های دیگر نیز معنا پیدا کنند، مانند مواردی که داستان زندگی ما را می‌سازند. او می‌گوید: «درست مانند زبان، ترتیب وقایع زندگی واقعاً مهم است. به عنوان مثال، تشخیص سرطان بلافاصله پس از یافتن شغلی با مزایای سلامتی خوب، احتمالاً تأثیر متفاوتی با معکوس شدن آن رویدادها خواهد داشت.

برای اینکه داده ها به الگوریتم متصل شوند، محققان به ثبت ملی دانمارک مراجعه کردند که حاوی سوابق کار و سلامت برای هر یک از تقریباً 6 میلیون شهروند این کشور است. این تیم جزئیاتی مانند حقوق، مزایای اجتماعی، عنوان شغلی، و بازدید از بیمارستان و تشخیص را به زبانی مصنوعی ترجمه کردند که در آن رویدادهای زندگی مجردی تبدیل به جمله شدند. به عنوان مثال، "در آگوست 2010، اگنس 30000 کرون دانمارک به عنوان ماما در بیمارستانی در کپنهاگ به دست آورد." این مدل با قرار دادن این رویدادها در یک جدول زمانی، داستان زندگی دیجیتالی هر فرد را بازسازی کرد.


محققان بین سال‌های 2008 تا 2016 مدلی به نام «life2vec» را بر روی داستان زندگی هر فرد آموزش دادند و مدل به دنبال الگوهایی در این داستان‌ها بود. در مرحله بعد، آنها از این الگوریتم برای پیش‌بینی اینکه آیا فردی در فهرست ملی دانمارک تا سال 2020 فوت کرده است یا خیر، استفاده کردند.

پیش‌بینی‌های این مدل در ۷۸ درصد مواقع دقیق بود. چندین فاکتور را شناسایی کرد که باعث افزایش خطر مرگ زودرس می شود، از جمله داشتن درآمد کم، داشتن تشخیص سلامت روان و مرد بودن. اشتباهات این مدل معمولاً ناشی از تصادفات یا حملات قلبی است که پیش بینی آنها دشوار است.

اگرچه نتایج جالب است - اگر کمی تلخ باشد - برخی از دانشمندان هشدار می دهند که این الگوها ممکن است برای جمعیت های غیر دانمارکی صادق نباشد. یویو وو، روانشناس در دانشگاه کالج لندن، می گوید: «دیدن این مدل که با استفاده از داده های گروهی از کشورهای دیگر اقتباس شده است، به طور بالقوه الگوهای جهانی را آشکار می کند، یا تفاوت های ظریف فرهنگی منحصر به فرد را برجسته می کند، جذاب خواهد بود.

او اضافه می‌کند که سوگیری در داده‌ها می‌تواند پیش‌بینی‌های آن را مخدوش کند. وو می افزاید ( تشخیص بیش از حد اسکیزوفرنی در میان سیاه پوستان می تواند باعث شود که الگوریتم ها به اشتباه آنها را در معرض خطر بالاتر مرگ زودرس قرار دهند.) وو می افزاید.

Lehmann و همکارانش همچنین دریافتند که مدل آنها به طور دقیق سایر جنبه های زندگی افراد را پیش بینی می کند، مانند اینکه آیا آنها بیشتر یا کمتر برون گرا هستند یا خیر. ساندرا ماتز، دانشمند علوم اجتماعی محاسباتی در مدرسه بازرگانی کلمبیا، می‌گوید که این چندان تعجب آور نیست. حتی الگوریتم‌های ساده‌تر هم می‌توانند مشاغل خاصی را - مثلاً یک آرایشگر - با برون‌گرایی مرتبط کنند. "این که آیا می تواند همه نوع رفتار را پیش بینی کند، من تا حدودی شک دارم."

Lehmann می‌گوید که تصور می‌کند این مدل ممکن است روزی برای شناسایی خطر بیماری یک فرد مفید باشد، که می‌تواند به آنها کمک کند تا گام‌هایی برای حفظ سلامت خود بردارند. او خاطرنشان می کند که چنین برنامه هایی با انبوهی از سوالات در مورد حریم خصوصی داده ها همراه هستند که قبل از اینکه مدل او بتواند به کسی کمک کند باید مرتب شود. "بهترین راهی که می توانم برای شروع این بحث فکر کنم این است که تصویری از آنچه حتی ممکن است ایجاد کنم."


آخرین تغییر: شنبه، 7 بهمن 1402، 10:23 صبح