Research Project on Renewable Energy Economics, Kyoto University

京都大学経済学研究科

再生可能エネルギー経済学講座

本講座(第2期)は、2024年3月31日をもって終了いたしました。

TOP > コラム一覧 > No.412 世界の一次情報の横顔

No.412 世界の一次情報の横顔

2024年3月7日
株式会社オシンテック・CEO 小田真人
株式会社オシンテック・番頭 小田一枝

「そんなサービス、誰が買うのかね。」

とある有名戦略コンサルタントにお話ししたときの言葉だ。

筆者らが運営する「RuleWatcher」は、環境や社会に関連した政策などを各国政府や国際機関のウェブサイトから収集するためのウェブツールとして、2018年から構想され、2020年から公開・運営されている。

いまでこそ、行政職員や企業の経営企画担当、大学の研究者など、多くのユーザーによって、諸外国の政策動向などを把握するために活用され、RuleWatcherは国際的な賞までもらえるようになったが、世にないサービスの最初というものは、概してこんな評価なのかもしれない。

図1 RuleWatcherイメージ
図1 RuleWatcherイメージ

情報収集ウェブツール「RuleWatcher」とは

このツールの構想のきっかけは、筆者(小田真人)の会社員時代に赴任していたシンガポールでの経験だった。

任地での担当業務は主に製造業の東南アジア諸国連合(ASEAN)向け輸出のマーケティング支援で、ソーシャルメディアからデータ収集して新製品発表時の反応などを分析してクライアントに報告する仕事をしていた。

タイ語やインドネシア語、ベトナム語を母語とするスタッフと、かき集めたデータを見ていく。ちょうど日本語で「ヤバい」という表現が「イケてる」ことを示すのか「サイテー」を示すのかを、日本語を母語にする者でないとなかなか判別できないように、当時はソーシャルメディアに表現されることのポジとネガはネイティブスピーカーの仕分けが必要だった。

苦労して情報をまとめ、経営判断に役立ててもらう。ありがたくもレポートの評価は良かったのだが、しばしば出くわす問題があった。それは、他国メーカーの(と思しき)ロビイングによるルール・メイキングだった。

東南アジアは規制の緩い国が多い。その間隙を縫って他国のロビイングによって新しいルールが差し込まれてくることがある。日本メーカーは環境規制に強い商品を多く持っており、平均点は高いのだが、必ずしも全方位で優れているわけではない。劣っている部分を評価対象にするルールが出来てしまうと市場にすら乗らない。ルールメイカーはこのあたりを巧みに突いてくる。こうなると、懸命にソーシャルメディアを分析してマーケティングの戦略を書いたところで、ルールで弾かれ、最初から勝負はついてしまうのだ。

「どんなルールがつくられつつあるかを、公開情報から先読みできないだろうか。」

そんなことが想起されたのは2016年のころだった。

しかし、それを実現するには、ネイティブスピーカーをただ雇えば済むものではない。より専門性のある人材の膨大な作業が必要だった。

このときの発想を現実化しよう、と思えたのが2018年。ディープラーニング翻訳が実用に耐えるレベルに到達したという時だった。各国政府の発表情報を機械翻訳して言語を統一すれば、カテゴリ分けしルールトレンドの分析に使えるのではないか。

諸外国ではすでに環境や人権のルールによって産業界への規制が始まっていた。大学院で気候変動問題に触れていたこともあり、そのあたりには勘所があった。当時の日本の産業界は持続可能性とルールメイクを紐づけて見ている人はまだ多くなかった。

この波はそう遠くないタイミングでやってくるだろう。データ収集の軸を環境や社会の持続可能性に関わるものに特化したものにできれば社会的な意味もある。これは、制約の多い会社員ではなく、独立してシステム開発することが必要となる。そんな決心から著者らの二人三脚が始まった。

晴れて開発が始まり、コンセプトを引っ提げてあちこちでビジネスコンテストなどに出ながら、数名のスタッフとともに情報源を特定し始めた。データ収集のプログラムを当て、整理のためのシソーラスを組んでいく。苦労しながらも1年半がかりで各国政府や国連関係機関、非政府組織(NGO)からのテキスト情報を載せたRuleWatcherが公開された。

「RuleWatcher」ができるまで

さて、前置きがやけに長くなり恐縮だが、このコラムで一番お話ししたかったのが、この情報源をかき集めるにあたってのエピソードである。

RuleWatcherのデータは、現在約100ヵ国、1400を超える組織のウェブサイトを情報源にしている。一般の検索エンジンと違って、公的な一次情報にデータソースを限定しているのが特徴なのだが、それは機械が勝手に「あ、これは公的一次情報だな」と判別してくれるわけではなく、開発者側が公的一次情報を探して一つずつ設定している。

そんなデータを見ていると色々な国の特徴が見えて面白い。

例えば韓国。他国の政府発信に比べてとても動画が多い。動画によって積極的に国民に情報を届けようという工夫がみられる。

図2 韓国政府のサイト
図2 韓国政府のサイト

ニュージーランドは、マオリ語と一対一で表記されている。マオリ語の「アオテアロア」への国名変更が議論された同国では、先住民と対等に情報アクセスできる工夫が随所にみられる。情報もかなり整っていて、全省庁のサイトを横断して政府情報を一元化している。

図3 ニュージーランド政府のサイト
図3 ニュージーランド政府のサイト

全省庁に跨ってデータを出しているところは他にもある。英国政府やEU委員会がそうだ。英国政府のサイトは気になる法案のページに変更が加わったことを知らせるアラートメールの設定があり、サイト訪問者は、その法案がその先どうなったかをアラート設定で受け取れる。EU委員会サイトでは法案の審議過程のスケジュールが図示されており、進捗が確認できるようになっている。

図4 英国政府のサイト
図4 英国政府のサイト

図5 欧州委員会のサイト
図5 欧州委員会のサイト

オードリー・タン氏の起用でDXが進んだ台湾のサイトも充実して使いやすい。他の政府と大きく違うのは、世界中の台湾華僑を管轄する「華僑問題委員会」が居住地である他国の情報も発信している点だ。

図6 台湾政府のサイト
図6 台湾政府のサイト

先進国だけではない。意外に進んでいるのがペルー政府だ。
こちらも情報が一元化されていて、内容もかなり充実している。発信数が非常に多いのが特徴である。

図6 ペルー政府のサイト
図6 ペルー政府のサイト

情報収集の難しい国

困ったサイトについても書いておこう。

「あれ?このサイト、データが写メで情報が採れませんね。」

インドのサイトを見ていたスタッフが言う。政府の委員会で話し合われた内容を示す書類(決裁権者の署名入り)の「画像」をサイトに掲載しているのだ。

最近は画像データからの文字起こしも比較的できるようになってきたとはいえ、機械ではかなり判読が難しい。このところインド政府のサイトも、以前に比べて次第に良くなってきているが、相変わらずの独自路線であることは、すべての省庁のサイトに「モディ首相の顔」がこれでもかという具合に入っているという点にも表れている。

図7 インド政府
図7 インド政府

インドのおちゃめぶりはともかく、データ収集で困らされるのは、何を隠そう日本の省庁のサイトである。

少しでも日本の政府サイトにアクセスしたことのある人ならお気づきだろうが、各省バラバラの構成であることと、すべて年度区切りで、令和5年3月の情報は「令和4年度」のところにあり、その上「月別にサイトが区切られている」省庁もかなりある。政府サイトを調査する仕事をされている方が「前年と同じ書類すら探せない」と言っていたのも頷ける。この独特な日本政府のウェブサイトに対し、デジタル庁発足以降、筆者らは2回も改善要望を送っていることをここに申し添えておきたい。

いずれ、こうした一次情報の特定も人工知能に任せるようになるだろう。

そうなる日まで、「RuleWatcher」の開発部隊は、こんな一次情報と格闘しつつ各国の違いを楽しみ、時として政府の公開レベルにモノ申す立場もとっているのである。



(キーワード:インテリジェンス、オシント (OSINT: Open Source INTelligence)、一次情報)