未定の部屋

主にデータサイエンス関係の記事を書きます

因果推論とビジネス適用について考えてみる

こんにちは。

最近『統計的因果推論の理論と実装』という書籍を一通り読み終わったので、書籍の感想+ビジネス適用というテーマで思うところを書いてみます。
新卒二年目の視点なので、現場の感覚・観点になると思います。



書籍の感想

因果推論についてはちょこちょこ勉強していて、今までに岩波DS vol.3効果検証入門を読んできました。
なので基本的な知識はある程度持ち合わせた状態で読んだのですが、それを踏まえても『統計的因果推論の理論と実装』はかなりボリュームのある書籍だと感じました。因果推論という分野の中での手法を広く紹介しているだけでなく、最新論文から引用していたり理論面も抜けなく書かれている印象があったり、各手法について読者の負担になりすぎない範囲でしっかりと解説されていたので、とても満足感がありました。

この本は前半:回帰分析での効果推定→後半:因果推論の各手法での効果推定という流れなのですが、前半の回帰分析のパートも丁寧で、重回帰分析に必要な仮定についても詳しく言及されています。重回帰分析は実務では良く使うので、「多重共線性は禁則事項ではない」「迷う場合は、不要な変数は入れた方が良い」などの、分析や解釈をする際に役立つ知見がちりばめられていたのはすごく貴重だなと思いました。重回帰分析をちゃんとやるのは難しく、奥が深いなと改めて感じられました。
後半は因果推論の各手法についてで、傾向スコア、操作変数、回帰不連続デザイン、欠測データ処理といったトピックが含まれています。傾向スコア、操作変数法、回帰不連続デザインあたりは何となく知っている程度だった理解が深まりましたし、欠測データの処理は初見だったので勉強になりました。個人的に、回帰不連続デザインは局所で無作為割付けが成立していることは納得できたのですが、そこから回帰モデルをあてはめる部分はあまり納得できなかったので、再び勉強する機会があればちゃんと考えたいと思います。
全体(特に後半)を通して思ったこととして、実務よりは研究視点の内容だなと思いました。因果推論の各手法は前提条件が厳密なので、ビジネスシーンでは仮定を満たすデータがなかなか手に入らない印象があります。また、分析手法の中にはかなり難しい部分もあり、因果推論を適用した分析結果を上手く伝えるところにもハードルがあると思います。ですが、因果推論の考え方は分析屋としてしっかりとおさえたい内容だし適用できたら強力なツールだと感じるので、ビジネスへの応用ができないか考えながら仕事していきたいなと思っています。

因果推論のビジネス適用

書籍に加え、こちらのスライド内容も踏まえつつ話したいと思います。

「因果関係」をとらえるために / To grasp causal relationship

こちらのスライドにも「アカデミックな場では広く使われているが、ビジネスにおける直接適用は難しいかもしれない」といったことが書かれており、自分の感覚とも概ね一致していました。一方で「因果を考える際の基本的なフレームワークとしてはビジネスの場でも非常に有用だと思われる」と書いてあったのですが、具体的にどう有用なのかまでは言及されておらず、少しモヤっとする部分もありました。
なので、自分なりにビジネス適用について少し考えてみたのですが、以下のことが思いつきました。

  1. 分析結果について、数値の見かけの正負にごまかされなくなる
  2. 厳密な効果検証をするような場面があった時に、分析設計時に手持ちの武器になる

1については分析手法が因果推論かどうかに限らず言えることかなと思います。大体の分析は何らかの定量評価を行うことが多く、アウトプットされてくるのも定量的な数値であることが多いと思います。例えば効果検証の文脈だったら「CMを打ったことで売上が○○円上がった」みたいな結果が出たりしますが、因果推論を学ぶことでこの数値がどれくらい妥当なのか、一度立ち止まって考える癖が身につくような気がします。見かけ上の数値の大小だけでなくその数値の信頼性を加味して考察するのはとても重要ですが、信頼性についてはどうしても見かけの数値の二の次になってしまう傾向があるので、ここを踏まえて考察できるようになるのはメリットだと思います。信頼性について考察するときに、因果関係の洗い出し、交絡因子の影響、個体や処置が仮定に矛盾しないといった因果推論の考え方を持ち合わせている方が考察の筋が良くなると思います。ビジネスの分析では手法の使い方が正しくてもデータに不備があったり仮説が不適切だったりすることも多いので、分析結果を鵜呑みにしないスキルというのは大切だと感じています。

2については、実際に因果推論を適用できそうな時に武器になるというイメージです。といっても上述の通り、直接適用できる場面はなかなか少ないと思うのですが、例えば簡易的な分析を行った時に結果の信頼性が低い・妥当性が低いなどで納得感が得られず追加分析のような文脈で厳密性が重視されるようなときや、データ収集の段階から絡んでいけるようなプロジェクトでは因果推論の手法も候補に入ってくるのかなと思います。コストや難解さといった観点から、なかなかここまでの厳密性を要求されることはないと思いますが、要求されるような場面では間違いなく因果推論の知識がある方が良いと思います。

自分の中ではこれくらいしか思いつかなかったのですが、これでも結構メリットはあるのかなという感じがします。やや拙い内容になってしまったかもしれませんが、このあたりで終わります。

では。