1. ホーム
  2. 研究活動
  3. 過去の研究プロジェクト
  4. H25年度~H27年度の研究プロジェクト
  5. 地域情報学プロジェクト
  6. 学術論文のマッピング・システムを通じた地域情報の統合と共有化(h25~h26)

地域情報学プロジェクト

学術論文のマッピング・システムを通じた地域情報の統合と共有化(h25~h26)

個別共同研究ユニット
代表: 山本 博之(京都大学地域研究統合情報センター)
共同研究員: 市川 哲(立教大学観光学部交流文化学科・助教)、及川 茜(神田外語大学外国語学部・講師)、黄 蘊(関西学院大学言語教育研究センター・講師)、山本 博之(京都大学地域研究統合情報センター・准教授)、横田 祥子(滋賀県立大学人間文化学部地域文化学科・助教)、亀田 尭宙(京都大学地域研究統合情報センター・助教) 
期間: 平成25年4月~平成27年3月(2年間)
目的:  地域誌(地域研究の論文)を研究対象の地名により地図上にマッピングして表示することで、地名から学術研究の動向(どのような研究が行われているか)や研究者情報(誰がどのような研究を行っているか)を検索できるようにし、特定地域に関する地域研究の知見の蓄積(=「地域の知」)を統合的に可視化するシステムを開発する。細分化された分野ごとになされる学術研究の蓄積を、地理情報を活用して研究対象地域ごとに分類することで、特定地域に関する情報の全体像を把握する助けとなる。これにより、研究者による研究成果の相互参照を助けるだけでなく、研究者以外で特定地域の情報を必要とする人々(たとえば報道、外交、行政、企業などの各分野の実務者)が地域研究の知見を活用しやすくなることが期待される。
研究実施状況: -平成25年度-
 マレーシアに関する日本語、英語、マレー語の学術誌、エッセイ、研究大会口頭発表について主要なものを選定して情報を収集し、発表者、発表タイトル、発表時期、概要、研究対象などの項目を入れた記事リストを作成した。学術誌の記事は一部をPDFファイルとした。これらの情報をもとに、地域研で作成・公開しているMyデータベースによりデータベース化し、どの項目をどのように記述すると利用しやすいデータベースになるかを検討した。また、情報技術に長けていない人でも初歩的な情報処理を行う方法として、(1)マレー語のテキストを機械処理するには接頭語・接尾語を除いた語幹の形を得る必要があるため、エクセルを用いて登録済みの語幹と対照させながら接頭語・接尾語を取り除く仕組みを試みた。(2)複数の記事の概要をもとにキーワードを抽出する仕組みを試みた。

-平成26年度-
 マレーシアに関するオンラインメディアのうち主要なものを選定して、日々更新される記事を自動収集して蓄積し、記事名、執筆場所、掲載時刻、記事本文などの項目によって記事が検索できる仕組みを構築した。また、これらの情報を京大地域研で作成・公開しているMyデータベースによりデータベース化し、どの項目をどのように記述すると利用しやすいデータベースになるかを検討した。また、現地語に通じていない人でも内容によって記事が分類できる初歩的な情報処理を行う方法として、(1)記事の署名に書かれている地名に加えて本文中で言及されている地名から抽出するようにし、また、(2)特定のテーマに関する記事を集めたいときにどのようなキーワードを設定すればよいかがわかるように本文中のキーワードによる選択を随時修正できる仕組みにした。
研究成果の概要: -平成25年度-
 今年度は、主に基礎的なデータを収集し、簡単なデータベースを作成して、データの収集・整理の簡便さとデータベース利用の際の都合の噛み合わせを検討した。
 以下の記事リストを作成し、Myデータベースによりデータベース化した。
・『アカデミカ』(マレーシア国民大学、英語・マレー語、第1巻(1972年)より第82巻第1号(2012年)まで575件分)
・『マレーシア研究』(マレーシア理科大学、英語・マレー語、第1巻第1号(1983年)より第30巻第1号(2012年)まで524件分)
・『ボルネオ研究報』(ボルネオ研究協議会、英語、第1巻第1号(1969年)より第41巻(2010年)まで944件)
・『知識探訪』(日本マレーシア学会、日本語、第1期第1回(2009年)より第2期第37回(2013年)まで63件)
 これらのデータベースを利用することで、(1)記事名や概要が日本語、英語、マレー語の3言語で書かれていることについては、オリジナルのデータが複数言語で提供されている場合はそれを利用し、そうでない場合はさしあたり機械翻訳の結果を与える。(2)マレーシアに関する記事の分類項目は、利用状況とデータ作成の簡便さを天秤にかけて地名、分野、民族の3つとする。(3)マレー語の接頭語・接尾語については、-lah、-kah、-nya、-mu、-kuは落とすが、それ以外のものは落とすべきか残すべきか(たとえばsatuとbersatuを同じ単語として処理するか別の単語として処理するか)については結論が出なかった。テキストの性格によるかもしれないため、アチェ津波モバイル博物館(災害情報)、『カラム』雑誌記事データベース(宗教と社会)、マレーシア映画データベース(映画)のデータと比較して検討を続けることとなった。
-平成26年度-
 今年度は、マレーシアの地域を限定して主要なオンライン情報を収集し、簡単なデータベースを作成して、データの収集・整理の簡便さとデータベース利用の際の都合の噛み合わせを検討した。以下のマレーシア・サバ州で発行されているオンライン情報の毎日の記事リストを作成し、Myデータベースによりデータベース化した。
・『Daily Express』(コタキナバル、英語・マレー語・カダザン語)
・『New Sabah Times』(コタキナバル、英語・マレー語・カダザン語)
・『Borneo Post』(コタキナバル、英語・マレー語・カダザン語)
 これらのデータベースをもとに、キーワードを組み合わせて事前に登録したテーマごとに記事を利用者の携帯端末にメールで自動配信する仕組みを作り、試験運用を開始した。緯度・経度情報を伴った地名一覧を用意し、オンライン情報配信サイトをいくつか指定すれば、関心を持つテーマに関する記事を自動で抽出してメールで配信する仕組みが比較的簡便に形成できることがわかった。
各地域研究者が研究対象地域ごとに情報収集の仕組みを作り、統合することで世界全体を対象にしたオンライン情報としての「地域の知」の収集・蓄積が可能になるのではないかと考えられる。
公表実績: -平成25年度-
山本博之 2014 「マレーシア・インドネシアにおける『時空間の知』」関野樹編『地域の「時空間の知」』、京大地域研。

-平成26年度-
研究成果公表計画
今後の展開等:
-平成25年度-
 引き続き学術誌、エッセイ、口頭発表のデータを収集する。また、次年度は対象をオンライン情報に拡大し、対象地域の主要オンラインメディアを何件か選び、そこから日々の情報を自動で収集し、テキスト内の地名などから記事を分類する仕組みについて、情報技術について知識や経験がほとんどなくても情報を収集・整理できる初歩的な工夫を検討する。さらに、複合ユニットの協力が得られれば、記事の概要から分野を抽出し、それを整理して視覚的に表現する方法についても検討したい。

-平成26年度-
 研究成果はウェブ上のサービスとして得られており、共同研究員の間で試験運用を行い、必要な修正を施した上で関連学会等に対して公開する予定。