コラム
1-1-5
テキストデータを活用した景気判断と消費動向変化の把握
1. 本コラムの背景・目的
中小企業・小規模事業者を取り巻く外部環境は足下で大きく変化しており、円安に起因した輸入物価高による原材料価格やエネルギー価格の高騰は、企業のコスト構造に大きな影響を与えただけでなく、消費者物価の上昇を通じて個人の消費動向にも波及している。したがって、企業が経営戦略を検討するに当たって、このような外部環境の変化や、それが企業の行動や消費の動向にもたらす影響を把握することは重要であり、景況感や市場動向を反映した企業側・消費者側双方の現場の声を分析することで、公的統計のみでは把握しきれない情報を得ることに繋がる可能性がある。
そこで、本コラムでは、内閣府「景気ウォッチャー調査 26 」から取得したテキストデータを用いて、生成AIを活用したテキストマイニングを行うことで、景気判断、企業の行動、消費の動向の時系列変化と業種別の違いを分析し、外部環境がこれらにどのような影響を及ぼしているのかについて考察する。
また、昨今の大規模言語モデルをはじめとする生成AIは技術進歩が目覚ましく、企業が抱える問題意識や経営課題を検索するシステムを構築することも、技術的に可能になりつつある 27 。しかし、単にChatGPTなどの大規模言語モデルに問いかけて検索するだけでは、膨大な情報の中から確率的に生成された「もっともらしい」出力が提示されるだけであり、根拠が不明確な印象論の域を出ない。むしろ、景気ウォッチャー調査などの特定のエビデンスに基づいた出力によって現状を把握することの方が有用と考えられる。これを実現するために、景気ウォッチャー調査の回答を基にベクトル検索を行った結果を出力するRetrieval Augmented Generation (RAG) 28 を使用することも考えられるが、それでは本コラムのコラム1-1-5②図などで示すような、因果関係の波及を含む全体像を捉えることが難しい。
その中で近年注目されているのが、Graph RAGやKnowledge Graph RAG 29 という手法で、外部から取得した情報を因果関係などに基づき整理したデータベースを背後に構築しておき、問われた内容に対してデータベース内の関連情報を検索した結果を出力する方法である。今回は、そうした検索システムを作る際のデータベース構築を試行するというもう一つの意図もあるため、特定のキーワードを指定してそれと繋がる因果関係を抽出し、作成したネットワークの有用性の検証も行った。
2. 分析手法の概要
テキストマイニングとは、大量のテキストデータから有用な情報や知識を抽出するプロセスである。テキストデータに含まれる膨大な情報を効率的に整理することで、重要なトレンドや傾向を把握することが可能になる。本分析では、2017年4月から2024年11月までの景気ウォッチャー調査から取得したデータのうち、「景気の現状判断の理由の追加説明及び具体的状況の説明」・「景気の先行きに対する判断理由」の文字数が50以上のものを使用
26 内閣府「景気ウォッチャー調査」は、地域ごとの景気動向を的確かつ迅速に把握し、景気動向判断の基礎資料とすることを目的として、毎月実施される調査である。家計動向、企業動向、雇用等、代表的な経済活動項目の動向を敏感に反映する現象を観察できる業種の、適当な職種の中から選定した2,050人を調査対象体とする。また、調査事項は、5段階で評価する「景気の現状に対する判断(方向性)」・「景気の先行きに対する判断(方向性)」と、選択式で回答する「景気の現状判断の理由」、自由回答である「景気の現状判断の理由の追加説明及び具体的状況の説明」・「景気の先行きに対する判断理由」となっている。今回の分析では、このうち「景気の現状に対する判断(方向性)」・「景気の先行きに対する判断(方向性)」のデータと、「景気の現状判断の理由の追加説明及び具体的状況の説明」・「景気の先行きに対する判断理由」のテキストデータを使用している。
27 Xiong et al. (2024)
28 「RAG」とは、構造化されていない外部の情報源から、問題に対して関連する情報を検索し、その情報を利用して回答文を生成する手法である。
29 「Graph RAG」及び「Knowledge Graph RAG」では、外部の情報源をグラフ形式で構造化したデータベースから検索することで、従来の「RAG」と比較して、全体の因果関係や文脈などを踏まえた、より精度の高い回答生成が可能となる。