GeoNLP
応募者の情報 | |
---|---|
ご氏名 | GeoNLP開発チーム(代表:北本朝展) |
ご所属 | 国立情報学研究所 |
e-mailアドレス | kitamoto [at] nii.ac.jp |
応募する基盤技術の情報 | |
基盤技術の名称 | GeoNLP |
基盤技術のURL | https://geonlp.ex.nii.ac.jp/ |
基盤技術の概略説明 |
文章から地名を抽出し、地名の曖昧さを解消して地図化できる、オープンな地名情報処理システムです。
地名を登録すると自動的にLODにも対応するため、文章を丸ごとLOD化する基盤技術としても使えます。 |
基盤技術の詳細説明 |
GeoNLPは、文章から地名を抽出し、地名の曖昧さも解消した上で地図化できる、オープンな地名情報処理システムです。ウェブサイト https://geonlp.ex.nii.ac.jp/ を中心に、様々な機能をすでに公開しています。
GeoNLPはGeo+NLPという名前が示すように,地理情報処理(Geographic Information Processing)と自然言語処理(Natural Language Processing)の境界領域に存在する「地名」を中心とした情報処理基盤の構築を目指しています。こうしたシステムの実現により、例えば災害のような緊急時における情報のマッピングが高速化できるといった効果が期待できます。 GeoNLPは以下の3つのコンポーネントから構成されるシステムです。 【1】GeoNLPデータ 地名の収集を担うコンポーネントで、地名辞書をみんなで作って共有するためのリポジトリとなります。地理的なオープンデータを地名語辞書形式に変換すれば、それをダウンロードしてGeoNLPソフトウェアの解析に利用することもできます。現在のところ提供する地名辞書は政府系オープンデータが中心で、地理情報という需要が大きいアプリケーションを通じてデータ活用を促進しています。さらに、地名辞書の公開が地名解析精度の向上に寄与することがモチベーションとなって、地名辞書構築に多くの人が参加してくれることを期待しています。 【2】GeoNLPソフトウェア 地名の解析を担うコンポーネントで、地名辞書を使って文章から地名を抽出するだけでなく、地名の曖昧さを解消するロジックも備えています。またDAMSライブラリをインストールすることで、地名だけでなく住所も解析することが可能です。GeoNLPの最大のメリットは「文章を丸ごと解析できる」という点にあり、テキスト処理に関連する面倒な前処理は必要ありません。またGeoNLPソフトウェア本体は修正BSDライセンスのオープンソースソフトウェアとして公開しており、ダウンロードすれば大規模データの内部処理も可能です。 【3】GeoNLPサービス 地名の活用を担うコンポーネントで、GeoNLPの解析機能を利用するいくつかのWebAPIと共に、GeoNLPをLODとして活用するための機能を提供しています。GeoNLPの基本的な解析機能を体験するAPIでは、ウェブサイトからAPIキーを取得することで誰でもお手軽に地名解析ができます。またGeoNLPデータにアップロードされた地名辞書に含まれる個々の地名には自動的にURIが付与され、D2RQを用いたSPARQLエンドポイントを経由して様々な情報にアクセス可能となっています。 このようにGeoNLPは、LOD時代の地名情報処理を支える基盤技術となりうるもので、例えば大規模な文書群から地理情報を抽出して自動的にLOD化するための基盤としても使えると考えています。また地名情報処理を中心としたオープンデータ、オープンソースのコミュニティを、これから成長させていきたいと考えています。 この基盤技術の詳細説明は、ウェブサイト https://geonlp.ex.nii.ac.jp/ をご覧ください。 |
ライセンス | 修正BSDライセンス |
関連する作品の情報 | |
関連するデータセット | |
関連するアイデア | |
関連するアプリケーション | |
関連するビジュアライゼーション作品 | |
関連する基盤技術作品 |