「殺人予測プロジェクト」では、膨大な個人データを用いて“将来、重大な暴力犯罪に至る可能性が高い人物”を炙り出そうとしています。
ここで鍵となるのは、一口に「犯罪履歴」といっても、決して“逮捕された”か“前科がある”かといった単純な情報だけではないという点です。
実際には「警察に何らかの形で相談したことがある」「事件の被害者や目撃者になった」「メンタルヘルスの問題を抱えている」「家庭内暴力に巻き込まれた」「自傷行為の履歴がある」など、多岐にわたる個人的情報がすべて“リスク要因”として考慮され得るのです。
たとえば、グレーター・マンチェスター警察(GMP)が同プロジェクトに提供したデータの中には、100,000人から500,000人という大量の市民情報が含まれているといわれています。
その内訳は、犯罪の容疑者や被害者のデータはもちろん、失踪騒ぎや家庭内トラブルといった警察へ一度でも接触したことのある人の情報まで及ぶ可能性があるのです。
しかも、そこで収集されるのは名前や生年月日といった基本情報にとどまらず、「最初に警察と関わったときの年齢」「これまでの生活環境」「犯罪に至った経緯」など、その人の人生背景を詳細に知りうる内容まで含まれます。
さらに特徴的なのは、精神的な健康状態、依存症や自傷行為の既往歴などが“特に強い予測因子として期待される”と内部文書で明言されている点です。
ある種のアルゴリズムでは、薬物依存や深刻なうつ病が高いレベルで関連していると推計されると、当局は「この人は今後、暴力犯罪や殺人に発展するかもしれない」と見なす材料に使うわけです。
こうした「健康マーカー」の取り扱いは、医療情報の秘匿性やプライバシー保護の観点からとりわけセンシティブであり、多くの人権団体が懸念を示す重要なポイントとなっています。
アルゴリズムそのものは、統計学と機械学習を組み合わせた複雑な仕組みです。