NEWS&EVENT
第11回「地理空間情報に関するベースレジストリ利活用研究会」レポート
2025/02/26
2024年12月23日(月)、第11回「地理空間情報に関するベースレジストリ利活用研究会」をオンラインにて開催し、委員とオブザーバーあわせて約80名の委員が参加しました。今回はAIGIDの取り組みとして「地理空間ベースレジストリ対象ユースケースの検討」および「オープンデータを用いた道路ID等のベースレジストリの研究開発」「河川系ベースレジストリ データ作成のための検討」について報告するとともに、3人の識者による話題提供が行われました。
●地理空間ベースレジストリ対象ユースケースの検討
東京大学 空間情報科学研究センター 関本義秀教授
東京大学の関本教授が、道路や河川、建物などさまざまな分野のベースレジストリについて、それぞれの想定ユースケースの検討結果を報告しました。
▽道路ID
道路IDを入れると属性を返す共通機能について検討中で、リンクの場合はライン形状や始終点ノードID、道路種別、路線名・路線番号など、ノードの場合は座標や接続するリンクIDなどの属性が得られると便利であると考えられます。一方、緯度経度を入力することで最寄りの道路リンクIDや道路ノードIDを返したり、経緯度範囲を指定することで範囲内のIDリストを返したりする逆引きの機能も必要です。ソースデータはオープンストリートマップ(OSM)を利用し、想定ユースケースとしてはオンライン電子納品(My City Construction:MCC)の成果登録を緯度・経度や施設名で登録するなど、IDベースで処理できるようにする方針です。第4四半期でどこまで進められるかは議論中ですが、引き続きプロトタイピングを行っていく方針です。
▽河川ID
流路IDを入れると河川IDや河川名、水系名、端点IDなどの属性を返す共通機能や、逆に河川名や緯度・経度を入力すると河川IDや構成する流路IDを返す機能の実現を目指しています。ソースデータは国土数値情報(河川)を利用し、ユースケースとしては、流路単位の流下方向や落差の抽出、流量の推計、近傍の河川管理施設の検索・抽出などの使い方を想定しています。
▽道路施設ID
道路施設IDを入れると座標や施設名、種別、市区町村名などの属性を返す共通機能や、緯度・経度を入力すると施設IDを返したり、経緯度範囲を指定すると範囲内のIDリストを返したりする逆引きの機能の実現を目指しています。ソースデータはxROAD(道路データプラットフォーム)を利用します。想定ユースケースとしては、MCCの電子納品成果登録時に道路施設と紐付ける際に、緯度・経度を入力すると道路リンクIDを返し、IDをもとに属性情報を取得してMCC側の成果情報に埋め込むといった使い方を想定しており、施設データを作成する際に既存のIDを埋め込むことで、そこに紐付いている属性データをそのまま使用するといったニーズがあると考えています。
▽不動産ID
IDを入れるとアドレスベースレジストリに準拠する住所を返す共通機能と、逆に緯度・経度を入力すると不動産IDとその住所を返す機能の実現を目指しています。ソースデータは今後の不動産IDがどのように提供されるか不透明なため、PLATEAUの建物データと不動産IDとマッチングさせる方法なども検討中です。
●オープンデータを用いた道路ID等のベースレジストリの研究開発
スピーカー:AIGID(株式会社情報試作室開発室・室長/東京大学CSIS客員研究員)相良毅氏
情報試作室開発室の相良氏が、道路関連の研究に利用できるオープンな地図データの研究開発について発表しました。同プロジェクトは、主に研究用として、全国を網羅する公開可能な道路基盤データを構築することを目的としています。現状では都道府県以上を「骨格道路」として全国整備しており、その次に市区町村道やその他の道路を「詳細道路」として地域別に整備していく方針です。また、研究成果の検証などを行えるように、時系列を持つ道路データ管理手法の開発も目指しています。
今年度はノードおよびリンクへのID付与と、それらを時系列で管理するための仕組み作りを検討しています。前回は、OSMのデータをもとに時系列を持つ骨格道路データのプロトタイプを構築しました。今回はこのデータをもとに、“軽微な修正”と“道路変化”を区別できるIDを付与しようと試みましたが、同一のOSM IDと隣接バージョンを持ち、位置が異なる骨格道路ノード間の距離と頻度の分布をグラフ化してみたところ、“修正”と“道路変化”の区別が困難であることが判明しました。そこで、現状では少しでも道路が編集されている場合は別のIDを割り振る仕様になっています。

同一のOSM IDと隣接バージョンを持ち、位置が異なる骨格道路ノード間の距離と頻度の分布
続いて、現在開発中のオンラインAPIのプロトタイプも紹介しました。このプロトタイプでは、地図上で道路のノードやリンクを検索することが可能で、道路の種別も色分けでわかりやすく表示されます。ノードやリンクをクリックすると道路名称や種別、路線番号などの属性に加えてGeoJSONのコードも表示されます。IDはOSMとバージョン番号を組み合わせたIDを採用しています。また、属性から道路を逆引き検索することもできます。ウェブだけでなくアプリケーションからも使えるように、GeoJSONを返すWebAPIとしても利用できるようにしています。
今後はリンクやノードのデータを配布することも検討しています。課題としては、リンクのUUIDが位置や時間に依存しないためわかりにくいことや、ノードIDにOSM IDを使用しているため著作権上の問題が発生する可能性があること、同一のリンク・ノードのバージョン間の対応付けなどが課題となっています。

オンラインAPIのプロトタイプ
●河川のベースレジストリ検討のための河川ID整備の準備調査
スピーカー:AIGID(アジア航測株式会社)徳田庸氏
アジア航測の徳田氏が、河川のベースレジストリ整備に利用可能な既往データに関する調査結果を報告しました。前回は、河川系ベースレジストリに求められる要件やデータ構成、ベースレジストリ構築に有用な既存データについて発表しました。今回はそれに引き続き、国土数値情報の河道中心線をもとに実際にベースレジストリを構築する方法を検討し、作業を開始しました。
国土数値情報の河川のデータは、「流路(リンク)」というラインのデータと、「河川端点(ノード)」というポイントのデータで構成されており、河川の始点と終点の間が流路のラインで結ばれ、その間の流路上には支流が合流する流路端点(流路始点/流路終点)があります。流路の属性には、水系域コードや河川コード、河川名、区間種別、流下方向判定(流路の流下方向が把握できているか否か)、端点IDなどの情報が含まれ、河川端点の属性には水系域コードや標高、端点IDなどが含まれます。

国土数値情報の河川データの構成
このデータをもとにベースレジストリを構築する場合の課題として、「県境に一部データの不整合がある」「整備年ごとにデータ仕様にぶれがある」「上下流の定義に曖昧な場所がある」「湖沼の空間的な取り扱い方法をどうするか」といった問題点があり、現在これらの課題について検討中です。
データ不整合については、河川が複数の都道府県をまたぐ場合の県境部に生じる河川始点または終点にデータが入っていないケースがあり、これを解消するため、河川IDが同一のリンクの河川端点のIDはすべて一致することを前提として、河川端点IDがNULL(データなし)の場合、同一河川の別リンクを参照して補完することにしました。この方針に沿って、サンプルデータとして四国4県分の河道中心線および流路端点を整備した上で、県境をまたぐ河道中心線リンクをマージし、河川始点および河川終点の属性値を修正しました。なお、整備したデータの中には名称が不明の河川が含まれており、この課題についても現在検討中です。

四国4県のサンプルデータ
事例紹介に続いて、3つの話題提供が行われました。
■さまざまな河川関連情報を統合する河川データ基盤の構築
スピーカー:東京大学 生産技術研究所 山崎大准教授
東京大学の山崎准教授が、河川に関する解析を行うための基礎データとしてさまざまな研究分野で利用されている「表面流向データ」を整備する取り組みと、これらのデータをもとにした河川データ基盤を構築する取り組みについて紹介しました。表面流向データとは、地表面をメッシュで分割した際に、各ピクセルの流下方向(通常は隣接8方向)を定めることで河川ネットワークを表現するラスター形式のデータです。
表面流向データは洪水氾濫モデリングや土砂・栄養塩・物質輸送シミュレーション、河川流域マネジメントや地形解析、水域生態系や生物多様性のアセスメント、地球システム研究・気候変動予測など幅広い分野で研究に利用されています。表面流向データは高精度の標高データをもとに構築できますが、標高データの誤差や解像度の制約のため、目視による修正が必要で手間がかかることが課題となっています。
全地球を対象とした表面流向データ(全球表面流向データ)の既存データとしては、スペースシャトルで計測した標高データをもとに構築され、2009年に整備完了して公開された「USGS HydroSHEDS」が有名ですが、データが更新されず、詳細な水路網を表現できていないため、最先端の研究課題に使うのには精度が不十分です。
そこで山崎准教授は、全球規模で表面流向の自動計算を実現することにより、最新の地理情報ビッグデータと整合性の取れた高解像度・高精度の全球表面流向データMERIT Hydroを開発しました。具体的には、高精度の標高データ「MERIT DEM」と、衛星データやOpenStreetMap(OSM)など複数のデータソースを合成した水域マップ(合成水域マップ)を組み合わせることにより、標高データから実際の水面に近い高さまで下げる処理を施した上で表面流向データを計算します。

標高データと水域マップを組み合わせて表面流向データを生成
ただし、この方法ではDEMの中に窪地が生じて、流れが窪地に集まってしまうため、水面を下げた場合でも、一つの河川が複数のサブ流域に分割されてしまうという問題があります。そこで、誤差による偽の窪地と実際の内陸河川とを自動的に判定するアルゴリズムを実装し、これにより河道データ構築をほぼ自動化することができました。
山崎准教授は、この手法でMERIT DEMをもとに作成した表面流向レイヤーに加えて、洪水シミュレーションにも使用できるように、河道幅のメタデータや、誤差により下流が上流よりも高いというエラーを補正した「水文補正標高」などのレイヤーを加えた河川関連データセット「MERIT Hydro」を作成しました。
さらに、MERIT Hydroとは別に、国土地理院が基盤地図情報として提供している5m/10mメッシュのDEMをもとに、国土数値情報の水域レイヤデータを組み合わせることで、日本地域に限定した高精度な河川基盤データ「J-FlwDir: Japan Flow Direction Map/日本域表面流向マップ」も京都大学と共同で開発しました。J-FlwDirは30mピクセルのラスターデータで、人為的な開削による狭窄部や農業用水路網なども表現するなど、小さな河川を含む詳細な河道網が表現されています。J-FlwDirにも河道幅や水文補正標高などを整備して、ウェブサイトにて無料で配布しています。

30m解像度の河川基盤データ「J-FlwDir」
J-FlwDirにより、流域データや地形データと組み合わせて、洪水シミュレーションを日本全国どこでも行えるようになり、2018年の西日本豪雨の際にも、すべての流域でそれぞれモデルを作るのではなく、一括でシミュレーションするだけで複数の河川の洪水を再現できることを確認できました。
山崎准教授は現在、さまざまな河川関連データを統合する基盤の構築を提案しています。J-FlwDirと、基盤地図情報の河川ラインデータや流域メッシュデータなど他の河川関連データとの相互参照を可能にして、河川IDや水路ネットワークなどを広域モデルでも活用できるようにするには、各データに含まれる誤差の修正やデータ連携などが今後の課題となります。海外でも河川関連情報を水文予測などさまざまな目的で活用できるように河川統合データ基盤を構築するプロジェクトが複数の国で進んでおり、日本でもさまざまな河川関連データを統合してアップデートできる統合体制を構築できると良いと考えています。
■e-Stat公開統計の現状と課題
スピーカー:大阪大学 村田忠彦教授
大阪大学の村田教授が、どこにどのような人が住んでいるのかを把握するための仮想的な社会を作る「HPCI-JHPCN合成人口プロジェクト」について紹介しました。同プロジェクトでは、公開されている統計情報に基づいて仮想的に地域ごとの家族構成を割り当てることにより“合成人口統計”のデータを構築し、これを使用することでその地域に関する分析やシミュレーションを行うことができます。
合成人口統計を作成するための元データとしては、国勢調査の自治体別の世帯人員別世帯数および家族類型別世帯数、20万人以上自治体別の1歳階級人口や20万人未満自治体別の5歳階級人口、1歳単位の夫婦年齢差、父子年齢差、母子年齢差などの情報を使って、自治体単位で世帯構成を作成した上で、小地域(町丁目別)の統計にあわせて各地域にどのような世帯が住んでいるかを割り当てます。小地域単位で割り付けたら、国土地理院の基盤地図情報を使って建物矩形に合わせて世帯の割り付けを行います。
さらに、国勢調査の就業状態や産業分類、就業形態、企業規模などの情報を用いて就業者に対する割当を行った上で、賃金構造基本統計調査をもとに所得の割り付けを行います。これらの情報を整理することで、地域ごとにどのような世帯が住んでいて、どれくらいの所得を得ているかを把握することができます。

人工合成の手法
人口合成の手法については、当初は市町村ごとに最適化するため、都道府県の統計を人口按分で調整し、自治体ごとに独立して合成を行っていましたが、現在は都道府県単位で最適化を行い、市町村統計の総計を都道府県統計として扱うようにしています。
これまで2000年度、2005年度、2010年度、2015年度と過去4回の国勢調査に対して、それぞれ100セットの人口合成を完了しており、建築物カバー率については2015年度のデータで99.7%が完了していますが、2014年に地図データの形式に変化があり、2010年は42.6%のカバー率で、2005年度以前は建築物の割り当てを行うことができませんでした。
村田教授は公開統計を経年的に利用する際の課題として、人口等基本集計において同じ地域名の属性で異なるコードが適用されていることや、小地域集計・基本単位集計において市区町村、町丁目、基本単位区のコード桁数の不統一が見られること、表番号が変わる場合があること、e-Stat APIにおいてファイル公開とAPIによる公開に不整合があることなどを挙げました。また、データに変更がある場合は円滑な利活用のために前のバージョンでの提供も継続してほしいことや、表の追加がある場合でも表番号を変更しないようにしてほしいことなども要望として挙げました。
■政府統計の総合窓口(e-Stat)と地理空間情報
スピーカー:独立行政法人統計センター 統計情報システム部情報システム企画課 課長代理 システム戦略担当 西村正貴氏
独立行政法人統計センターの西村正貴氏が、政府統計の総合窓口(e-Stat)で提供している地理空間情報について発表しました。e-Statでは、データとしては「標準地域コード」「都道府県・市区町村データ」「小地域データ」「メッシュデータ(統計データ・境界データ)」の4種類を提供しており、サービスとしては「地図で見る統計(jSTAT MAP)」を提供しています。
標準地域コード(都道府県・市区町村コード)は、都道府県および市区町村の統計情報の相互利用のために1970年に定められたもので、「統計に用いる標準地域コード」と呼ばれています。総務省が整備している全国地方公共団体コードと互換性があり、全国地方公共団体コードの改正と同時に改正されます。コード体系や2桁の都道府県コードと3桁の市区町村コードを組み合わせた5桁で構成されます。提供情報としては、コードや名称、ふりがな、行政区分情報、廃置分合情報などが含まれています。
都道府県・市区町村データ(統計データ)は、各統計系の調査方法や規模などによって提供地域が異なり、国勢調査や経済センサスなど調査対象数が多い統計調査は市区町村単位で公表されます。コード体系は原則的には「統計に用いる標準地域コード」が使用されますが、一部のデータについては独自のコードが使われる場合があります。都道府県・市区町村データはデータベースまたはファイルとして取得可能で、データベースとして登録されているデータはAPIでも取得できます。
小地域データ(統計データ・境界データ)は、町丁・字などの単位で提供されるデータで、主に国勢調査の結果が提供されます。国勢調査では基本単位区(街区)のデータも提供されており、農林業センサスでは農業集落の単位でも提供されます。コード体系は国勢調査基本単位区コード(町字コード4桁+基本単位区コード5桁)および国勢調査町丁・字等(基本単位区コードの先頭6桁)で、住居表示の町丁・字と一致しない場合があります。
メッシュデータ(統計データ・境界データ)は地域メッシュコード(JISX0410)の単位で提供されるデータで、国勢調査や経済センサス、農林業センサスの結果が提供されます。コード体系は1次メッシュ(80km)4桁、2次メッシュ(10km)6桁、3次メッシュ(1km)8桁、4次メッシュ(500m)9桁、5次メッシュ(250m)10桁で構成され、コードは緯度・経度から計算式で取得できます。
jSTAT MAPはe-Statの一機能として、インターネット上で誰でも無料で利用できます。地図上に特定の地点を登録する「プロット作成機能」、地図上に特定範囲のエリアを登録する「エリア作成機能」、統計データを表示した統計地図を作成する「統計グラフ作成機能」、データとグラフを使用したレポートを作成する「レポート作成機能」の主な4つの機能を提供しています。

jSTAT MAPの主な4機能
jSTAT MAPは独自のデータを取り込んでグラフ化することが可能で、たとえば「総務省ふるさと納税ポータルサイト」から取得した「令和5年の受入額の実績等」をもとに市区町村別の寄付金額データをCSVファイル形式で取り込み、取り込んだ寄付金額のデータをもとに市区町村別の統計グラフを作成するといった使い方も可能です。また、災害時に高齢単身世帯の状況を把握するなどの活用事例もあります。