Исследователи из Дании использовали мощные алгоритмы машинного обучения для точного прогнозирования определенных аспектов человеческой жизни, в том числе того, насколько рано человек может умереть.
В исследовании, опубликованном в журнале Nature Computational Science, подробно описано, как модель алгоритма машинного обучения под названием life2vec предсказывает исход жизни человека и его поступки, когда ему предоставляются весьма специфические данные о нем.
В частности, ученые собрали ежедневные записи более чем 6 млн человек, живущих в Дании. Набор данных включил в себя медицинские записи, зарплату, рабочее время, место жительства и многое другое. А также адаптировали методы обработки языка и создали словарь жизненных событий, чтобы life2vec мог интерпретировать предложения на основе этих данных. Например, «В сентябре 2012 года Франциско получил двадцать тысяч датских крон, работая охранником в замке в Эльсиноре» или «В течение третьего года обучения в средней школе-интернате Гермиона посещала пять факультативных занятий».
По словам Леманна, алгоритм учился на основе этих данных и мог делать прогнозы относительно некоторых аспектов жизни людей, включая то, как они могут думать, чувствовать и вести себя, и даже то, умрет ли человек в ближайшие несколько лет.
Чтобы предсказать, как рано человек может умереть, команда использовала данные с 1 января 2008 года по 31 декабря 2015 года на выборке более чем из 2,3 млн человек в возрасте от 35 до 65 лет. По словам Суне Леманна, профессора Технического университета Дании и ведущего автора исследования, эта группа была выбрана потому, что смертность в этом возрастном диапазоне предсказать труднее.
В результате Life2vec был прав примерно в 78% случаев. Было обнаружено, что люди с высокими доходами или те, кто занимал руководящие должности, имели больше шансов выжить. Было также обнаружено, что мужчины, квалифицированные рабочие или люди, у которых было диагностировано психическое расстройство, чаще умирали.
По словам авторов, модель превзошла существующие современные методы примерно на 11%. Неудивительно, что life2vec работает лучше для групп с большим объемом событий со здоровьем в своих записях. Исследователи обнаружили, что метод также показал лучшие результаты среди молодых людей и женщин.
Модель также использовалась для прогнозирования более субъективных особенностей человека, таких как личностные качества, которые обычно собираются с помощью анкет. Life2vec смог сделать прогнозы по множеству личностных качеств человека, от самооценки до его общительности.
«Имея эти данные, мы можем делать любые прогнозы», – отметил сказал Суне Леманн.
Однако ученые отмечают, что это «исследовательский прототип» и в своем нынешнем состоянии он не может выполнять никаких «реальных задач».