1. ホーム
  2. 研究活動
  3. 過去の研究プロジェクト
  4. H25年度~H27年度の研究プロジェクト
  5. 地域情報学プロジェクト
  6. CIAS所蔵資料の活用(h25~h27)

地域情報学プロジェクト

CIAS所蔵資料の活用(h25~h27)

複合共同研究ユニット
代表: 柳澤 雅之(京都大学地域研究統合情報センター・准教授)
共同研究員: 帯谷 知可(京都大学地域研究統合情報センター・准教授)、貴志 俊彦(京都大学地域研究統合情報センター・教授)、柴山 守(京都大学国際交流推進機構・研究員/地域研究統合情報センター・特任教授)、原 正一郎(京都大学地域研究統合情報センター・教授)、柳澤 雅之(京都大学地域研究統合情報センター・准教授)、山口 哲由(独立行政法人農業環境技術研究所・特別研究員)
期間: 平成25年4月~平成28年3月(3年間)
目的:  京都大学地域研究統合情報センター(CIAS)が所蔵する、映像・画像・フィールドノート・古文書・公文書・新聞情報・統計資料等を組み合わせた、地域研究関連のさまざまなデータベースを利用して、情報学の技術を援用した新しい地域研究(地域情報学)の展開を目的とする。そのために、CIAS所蔵資料のみに依拠するのではなく、他の資料と組み合わせた新しい研究の展開や、地域研究のなんらかの特定課題の解決に寄与するような、データベースを活用した新しい研究アプローチの検討も目的として含まれる。これらを通じ、地域研究の促進に必要な、データの収集、共有、分析、発信の方法を検討し、地域情報学の展開を促進することが本複合共同研究ユニットの目的である。
研究実施状況: -平成25年度-
 複合共同研究では、とくにフィールド・データベースと森林の写真データベースに焦点を当てた研究活動を進めた。フィールド・データベースでは、高谷好一(京都大学名誉教授)による現地の観察記録であるフィールドノートの記述を、複数のデータベース化すると同時に、フィールドノートに記載のテキスト分析を行った。データベースとしては、ウェブデザインの第一人者である首都大学東京の渡邉英徳研究室と協力し、グーグルアースを用いた可視化を行った。また、CIASのMyデータベースに登録すべき、メタデータの整理を進めた。森林の写真データベースでは、山田勇(京都大学名誉教授)による森林景観の写真データを用いて、Myデータベースに登録するためのメタデータの整理と、可視化作業を進めた。

-平成26年度-
 本年度の複合共同研究では、発見のツールとしてのデータの可視化と、可視化によって得られたヒントを検証可能な研究分析ツールをデータベースに組み込んだ統合型データベースの構築について検討するため、首都大学東京のwebデザインを専門とする渡邊英徳研究室および東京大学史料編纂所の山田太造氏と共同して、フィールド・データベースを題材とした研究を進めた。東京および京都で個別の研究打ち合わせを3回、開催し、その成果を、2015年2月12日に京都大学で報告した。

-平成27年度-
 本年度は、CIASが所蔵する研究資料のうち、フィールドノート・データベースと音楽データベースを活用した研究活動を実施した。フィールドノート・データベースでは、「誤差か、発見の糸口か?-情報学的分析結果を学際的に評価する-」と題する研究会を、東京大学空間情報学研究センターと共催し、共同研究メンバー(代表)の柳澤が「地域情報学の読み解き発見のツールとしての時空間表示とテキスト分析」と題する口頭発表を行った。また、音楽文化の分析における地域研究と情報学の融合研究会シリーズを立ち上げ、その第一回の研究会「文化データの計量分析:日本民謡楽曲コーパス構築への指針」を2016年2月5日に開催し、音楽文化の分析に情報学の視点・技術を取り入れ、従来の音楽研究と融合させた研究会を開催した。
研究成果の概要: -平成25年度-
 フィールド・データベースでは、インドネシア・スマトラ島でのフィールドノートの記録を用い、東京大学史料編纂所の山田太造氏の協力を仰ぎながら、共起する語句間の関係にもとづいたテキストマイニングの手法を用いて分析を行った。異なる語句数5千以上の中から30のグループを抽出し、地域研究の視点からテキストマイニングの妥当性を検討した。不要語の抽出や形容詞の扱い方の検討、グループ間のクラスター分析等を行い、グループの意味づけを検討した。その結果、歴史的な情報と、現代的な景観観察とが分類されることがわかった。また、明確な意味づけが可能なグループが存在し、研究目的に応用可能であることが明らかになった一方、意味づけが不明瞭なグループも存在し、さらなる文書の検討が必要であることがわかった。また、首都大学東京の渡邉研究室に依頼して、グーグルアースを利用した可視化システムを構築し、タイムスラーダーや検索機能を付加したデータベースを作成した。
 森林の写真データベースでは、写真とそのキャプション等に加えて、Myデータベースに必要な維持情報を付加し、可視化のプロトタイプを作成した。

-平成26年度-
 フィールド・データベースを題材に、発見のツールとしてのデータの可視化と、可視化によって得られたヒントを検証可能な研究分析ツールをデータベースに組み込んだ統合型データベースの構築について検討した。フィールド・データベースの特徴をいかすためには、地形図との重ね合わせが特に重要であり、GoogleEarthが提供する画像だけでなく、地形図を含む他の地図との重ね合わせが可能なシステムを導入した。また、テキスト分析のひとつの手法である共起する語彙の抽出を行い、関連する語彙が明瞭に区分できるよう可視化を行った。これにより、たとえばゴムという同一語彙であっても、文脈によって異なる使われ方をしていること、その文脈例として、開拓地で新たに導入されたゴムが広域かつ単独で栽培される場合や、すでに高木となった古いゴムが繁茂する2次林の中で栽培され、生業の一部として根付いている場合等があること、そして、本研究の可視化とテキスト分析でそうした文脈を抽出できることが明らかとなった。
 さらに、他の財源とも合わせる形でデータ入力を進め、これまでインドネシア・スマトラ島の記録だけがデータベースとされていたが、フィリピン、ラオス、南ベトナム、中国沿岸部の情報を追加することができた。

-平成27年度-
 フィールドノート・データベースを利用した研究会での発表「地域情報学の読み解き発見のツールとしての時空間表示とテキスト分析」では、高谷好一(京都大学名誉教授)が作成したフィールドノートの記録を時空間表示させた高谷好一フィールドアーカイブを用いた研究成果を発表した。地点ごとの情報を地図上で可視化させ、さらに、共起する語彙を抽出させたテキスト分析の結果を色別に表示させることにより、フィールドノートの記録を発見のツールとして利用するための方策を検討した。その結果、フリーワード検索とは異なり、人びとの歴史的経緯を抽出することが可能であることが明らかになった。「文化データの計量分析:日本民謡楽曲コーパス構築への指針」では、九州地方の音楽データベースの分析を通じ、方言との関連性等について考察した。その結果、日本民謡における小泉のテトラコルド論を計量学的に評価し、地域別のクラスタリングから地域性を抽出することができた。また、文学を題材にした情報分析の発表では、文学に使用される地名の位置情報をマッピングすることで、言葉がもつイメージが地理的特性と結びついていることや、それが作家による創作である可能性について検討した。
公表実績: -平成25年度-
 フィールド・データベースでは、インドネシア・スマトラ島でのフィールドノートの記録を用い、東京大学史料編纂所の山田太造氏の協力を仰ぎながら、共起する語句間の関係にもとづいたテキストマイニングの手法を用いて分析を行った。異なる語句数5千以上の中から30のグループを抽出し、地域研究の視点からテキストマイニングの妥当性を検討した。不要語の抽出や形容詞の扱い方の検討、グループ間のクラスター分析等を行い、グループの意味づけを検討した。その結果、歴史的な情報と、現代的な景観観察とが分類されることがわかった。また、明確な意味づけが可能なグループが存在し、研究目的に応用可能であることが明らかになった一方、意味づけが不明瞭なグループも存在し、さらなる文書の検討が必要であることがわかった。また、首都大学東京の渡邉研究室に依頼して、グーグルアースを利用した可視化システムを構築し、タイムスラーダーや検索機能を付加したデータベースを作成した。
 森林の写真データベースでは、写真とそのキャプション等に加えて、Myデータベースに必要な維持情報を付加し、可視化のプロトタイプを作成した。

-平成26年度-
 フィールド・データベースを題材に、発見のツールとしてのデータの可視化と、可視化によって得られたヒントを検証可能な研究分析ツールをデータベースに組み込んだ統合型データベースの構築について検討した。フィールド・データベースの特徴をいかすためには、地形図との重ね合わせが特に重要であり、GoogleEarthが提供する画像だけでなく、地形図を含む他の地図との重ね合わせが可能なシステムを導入した。また、テキスト分析のひとつの手法である共起する語彙の抽出を行い、関連する語彙が明瞭に区分できるよう可視化を行った。これにより、たとえばゴムという同一語彙であっても、文脈によって異なる使われ方をしていること、その文脈例として、開拓地で新たに導入されたゴムが広域かつ単独で栽培される場合や、すでに高木となった古いゴムが繁茂する2次林の中で栽培され、生業の一部として根付いている場合等があること、そして、本研究の可視化とテキスト分析でそうした文脈を抽出できることが明らかとなった。
 さらに、他の財源とも合わせる形でデータ入力を進め、これまでインドネシア・スマトラ島の記録だけがデータベースとされていたが、フィリピン、ラオス、南ベトナム、中国沿岸部の情報を追加することができた。
-平成27年度-
 フィールドノート・データベースを利用した研究会での発表「地域情報学の読み解き発見のツールとしての時空間表示とテキスト分析」では、高谷好一(京都大学名誉教授)が作成したフィールドノートの記録を時空間表示させた高谷好一フィールドアーカイブを用いた研究成果を発表した。地点ごとの情報を地図上で可視化させ、さらに、共起する語彙を抽出させたテキスト分析の結果を色別に表示させることにより、フィールドノートの記録を発見のツールとして利用するための方策を検討した。その結果、フリーワード検索とは異なり、人びとの歴史的経緯を抽出することが可能であることが明らかになった。「文化データの計量分析:日本民謡楽曲コーパス構築への指針」では、九州地方の音楽データベースの分析を通じ、方言との関連性等について考察した。その結果、日本民謡における小泉のテトラコルド論を計量学的に評価し、地域別のクラスタリングから地域性を抽出することができた。また、文学を題材にした情報分析の発表では、文学に使用される地名の位置情報をマッピングすることで、言葉がもつイメージが地理的特性と結びついていることや、それが作家による創作である可能性について検討した。
研究成果公表計画
今後の展開等:
-平成25年度-
 フィールド・データベースでは、不要語のさらなる削除や形容詞の位置づけを考慮したテキストマイニングを行う。また、テキストマイニングで得られたグループの意味づけに関する検討を行う。そのうえで、グーグルアースを利用した可視化システム上で、テキストマイニングの手法で得られた分析結果を可視化するための作業を行う。
森林の写真データベースでは、サムネイル画像やキャプションの追加を行う。それにより、建築関連の写真データベースや植物分類に関する写真といった類似のデータベースとも統合可能な基盤的データベースの構築を行う。

-平成26年度-
1.フィールド・データベースの公開
可視化プロジェクトで進めてきたフィールド・データベースを一般に公開する。そのために、2014年度までに入力を完了した地域の情報を地図上に表示する。また、データ入力用のインターフェースを整備する。
2.関連データのデータベース化
フィールドで撮影された写真のデータベースを2014年度までに、別途、作成していた。山田勇(京都大学名誉教授)および、阪本寧男(京都大学名誉教授)の写真につき、写真のキャプションと位置情報を付加することのできた写真から順次、フィールド・データベースとしてデータベース化し、公開する。

-平成27年度-
 フィールドノート・データベースでは、他地域のデータを入力し、インドネシア・スマトラ島だけでなく、より広域を対象にし、かつ、高谷好一以外の研究者によるフィールドノートの記録を掲載したデータベースを構築し、本研究の妥当性を検証する。また、音楽データベースでは九州以外の地域の分析、文学データベースでも他の文学での地域性マッピングを検証する予定である。それらにより、分析結果をより普遍的な情報として活用できる方策を検討する。