反事実の複雑な計算は、Spotify が次のお気に入りの曲を選ぶのに役立つ可能性があります
新しい種類の機械学習モデルは、金融、ヘルスケア、広告ターゲティングなどにおける自動化された意思決定を改善するために設定されています。
音楽ストリーミング会社 Spotify の研究者チームが構築した新しい種類の機械学習モデルは、反事実分析の背後にある複雑な数学を初めて捉えています。反事実分析は、過去の出来事の原因を特定し、事態を予測するために使用できる正確な技術です。今後の影響。
今年初めに科学雑誌 Nature Machine Intelligence に掲載されたこのモデルは、金融からヘルスケアに至るまでの幅広い用途において、自動化された意思決定、特にパーソナライズされた推奨事項の精度を向上させる可能性があります。
反事実の背後にある基本的な考え方は、特定のことが異なっていたら状況で何が起こっていたかを問うことです。 それは世界を巻き戻し、いくつかの重要な詳細を変更してから、再生ボタンを押して何が起こるかを確認するようなものです。 適切な部分を微調整することで、真の因果関係を相関関係や偶然から分離することが可能になります。
「原因と結果を理解することは、意思決定にとって非常に重要です」と、このモデルを共同開発したSpotifyの因果推論研究ラボのリーダー、キアラン・ギリガン・リー氏は言う。 「あなたは、今の選択が将来にどのような影響を与えるかを理解したいと考えています。」
Spotify の場合、それはどの曲を表示するか、アーティストがいつ新しいアルバムをリリースするかを選択することを意味するかもしれません。 ギリガン=リー氏によると、Spotifyはまだ反事実を使っていないという。 「しかし、彼らは私たちが毎日扱っている質問の答えに役立つかもしれません。」
反事実は直感的です。 人はよく、あの代わりにこれが起こっていたら物事はどうなっただろうかと想像することによって世界を理解します。 しかし、それらは数学に組み込まれた怪物です。
「反事実は、非常に奇妙に見える統計的オブジェクトです」とギリガン=リー氏は言います。 「それらは考えてみると奇妙なことです。何かが起こらなかったとして、何かが起こる可能性を尋ねているのです。」
Gilligan-Lee と彼の共著者は、MIT Technology Review の記事で互いの研究について読んだ後、協力し始めました。 彼らは、ツイン ネットワークと呼ばれる反事実の理論的枠組みに基づいてモデルを構築しました。
ツイン ネットワークは、コンピューター科学者のアンドリュー バルケとジューデア パールによって 1990 年代に発明されました。 2011 年、パール氏は因果推論と人工知能に関する研究で、コンピュータ サイエンスのノーベル賞であるチューリング賞を受賞しました。
Pearl と Balke はツイン ネットワークを使用して、いくつかの単純な例を処理したと Gilligan-Lee 氏は言います。 しかし、数学的枠組みをより大規模で複雑な現実世界の事例に手作業で適用するのは困難です。
ここで機械学習が登場します。ツイン ネットワークは、反事実を 1 組の確率モデルとして扱います。1 つは現実の世界を表し、もう 1 つは架空の世界を表します。 モデルは、現実世界のモデルが架空の世界のモデルを制約するような方法でリンクされており、変更したい事実を除いてあらゆる点で同じ状態に保たれます。
Gilligan-Lee と彼の同僚は、ツイン ネットワークのフレームワークをニューラル ネットワークの青写真として使用し、架空の世界でイベントがどのように展開されるかを予測するようにネットワークを訓練しました。 その結果、反事実的推論を行うための汎用コンピューター プログラムが完成しました。 「これにより、希望するシナリオに関する反事実的な質問に答えることができます」と Gilligan-Lee 氏は言います。
Spotify チームは、いくつかの実世界のケーススタディを使用してモデルをテストしました。その中には、ドイツでの信用承認に関するもの、脳卒中治療薬の国際臨床試験に関するもの、ケニアの水道の安全性に関するものなどがあります。
2020年に研究者らは、ケニアのある地域で細菌汚染から泉を守るためにパイプとコンクリート容器を設置することで、小児の下痢のレベルが減少するかどうかを調査した。 彼らはプラスの効果を発見しました。 しかし、何が原因なのかを確かめる必要がある、とギリガン=リー氏は言います。 全国の井戸の周囲にコンクリートの壁を設置する前に、病気の減少が実際にその介入によって引き起こされたものであり、その副作用ではないことを確認する必要がある。
研究者らが研究に来て井戸の周囲にコンクリートの壁を設置したことで、人々が汚染水のリスクをより認識し、自宅で水を沸騰させるようになった可能性はある。 その場合、「介入を拡大するには教育がより安価な方法となるだろう」とギリガン=リー氏は言う。
弁護士のグループが増えており、貧しい住宅、仕事、基本的なサービスを拒否する自動化システムを暴き、操縦し、闘っている。
Gilligan-Lee と彼の同僚は、このシナリオをモデルで実行し、現実世界で保護されていない井戸から飲んだ後に病気になった子供たちが、架空の世界で保護されている井戸から飲んだ後に病気になるかどうかを尋ねました。 彼らは、子供が水を飲んだ場所の詳細だけを変更し、家庭での水の処理方法などの他の条件を維持したことは、結果に重大な影響を及ぼさないことを発見し、小児下痢のレベルの低下が(直接的に)影響を及ぼしたわけではないことを示唆しました。パイプやコンクリートコンテナの設置によって引き起こされます。
これは、反事実的推論も使用した 2020 年の研究結果を再現しています。 しかし、これらの研究者たちは、その 1 つの質問をするためだけに、オーダーメイドの統計モデルを手作業で構築したとギリガン=リー氏は言います。 対照的に、Spotify チームの機械学習モデルは汎用的なもので、さまざまなシナリオについて複数の反事実的な質問をするために使用できます。
原因と結果を推論できる機械学習モデルの構築を競うテクノロジー企業はSpotifyだけではない。 ここ数年、Meta、Amazon、LinkedIn、TikTokのオーナーであるByteDanceなどの企業もこの技術の開発を始めている。
「機械学習には因果推論が非常に重要です」と Meta のソフトウェア エンジニア、Nailong Zhang 氏は言います。 Meta は機械学習モデルで因果推論を使用し、Instagram がユーザーを再び訪問し続けるために、どのような種類の通知をどれだけ送信するかを管理します。
インディアナ州パーデュー大学のデータサイエンティスト、ロミラ・プラダン氏は、反事実を利用して自動化された意思決定の透明性を高めている。 組織は現在、機械学習モデルを使用して、誰が信用、仕事、仮釈放、さらには住宅を取得できるのか(誰が取得できないのか)を選択しています。 規制当局は、組織に対し、これらの決定の多くの結果を、影響を受ける人々に説明するよう要求し始めている。 しかし、複雑なアルゴリズムによって行われたステップを再構築するのは困難です。
プラダン氏は反事実が役に立つと考えている。 銀行の機械学習モデルが融資申請を拒否したため、その理由を知りたいとします。 この質問に答える 1 つの方法は、反事実を利用することです。 現実の世界で申請が拒否されたとすると、信用履歴が異なる架空の世界では申請は拒否されたでしょうか? 郵便番号、仕事、収入などが異なる場合はどうなるでしょうか? プラダン氏は、こうした質問に答える能力を将来の融資承認プログラムに組み込むことで、銀行は顧客に単に「はい」か「いいえ」ではなく理由を提示できるようになるだろうと述べている。
反事実は重要です。なぜなら、反事実はさまざまな結果について人々がどのように考えるかであるからです。「反事実は説明を捉える良い方法です。」とプラダン氏は言います。
また、企業が人々の行動を予測するのにも役立ちます。 反事実により、平均的なものだけでなく、特定の状況で何が起こるかを推測できるようになるため、テクノロジー プラットフォームは反事実を利用して、これまで以上に正確に人々を分類できるようになります。
汚れた水や融資決定の影響を解きほぐすことができるのと同じロジックを、Spotify のプレイリスト、Instagram の通知、広告ターゲティングの影響を高めるために使用できます。 この曲を再生すると、そのユーザーはより長く聞いてくれるでしょうか? この写真を見せたら、その人はスクロールし続けるでしょうか? 「企業は、平均的なユーザーではなく特定のユーザーに推奨事項を提供する方法を理解したいと考えています」と Gilligan-Lee 氏は言います。
「これらの生物が私たちよりも賢くなるのではないかということで、突然考え方を切り替えました。」
ヒントン氏は水曜日に EmTech Digital で講演します。
ChatGPT は汎用人工知能に関する憶測を引き起こしました。 しかし、AI の次の本当の段階は、特定のドメインとコンテキストで行われることになります。
EmTech Digital でヒントンが MIT Technology Review の AI 上級編集者である Will Douglas Heaven と話す様子をご覧ください。
特別オファー、トップ記事、今後のイベントなどをご覧ください。
メールを送信していただきありがとうございます。
何か問題があったようです。
設定を保存できません。 このページを更新して、もう一度更新してみてください。 このメッセージが引き続き表示される場合は、受信を希望するニュースレターのリストを添えて、[email protected] までご連絡ください。