1. ホーム
  2. 研究活動
  3. 過去の研究プロジェクト
  4. H25年度~H27年度の研究プロジェクト
  5. 地域情報学プロジェクト
  6. フィールドノートを対象としたテキストマイニングに関する研究(h27)

地域情報学プロジェクト

フィールドノートを対象としたテキストマイニングに関する研究(h27)

個別共同研究ユニット
代表: 山田 太造(東京大学史料編纂所・助教)
共同研究員: 大向 一輝(国立情報学研究所コンテンツ科学研究系・准教授)、小野原 彩香(同志社大学大学院文化情報学研究科・特別研究員)、帯谷 知可(京都大学地域研究統合情報センター・准教授)、後藤 真(国立歴史民俗博物館・准教授)、柴山 守(京都大学国際交流推進機構・研究員/地域研究統合情報センター・特任教授)、清野 陽一(奈良文化財研究所都城発掘調査部・研究員)、関野 樹(総合地球環境学研究所研究高度化支援センター・研究員)永崎 研宣(人文情報学研究所・主席研究員)、原 正一郎(京都大学地域研究統合情報センター・教授)、柳澤 雅之(京都大学地域研究統合情報センター・准教授)、山田 太造(東京大学史料編纂所・助教)
期間: 平成27年4月~平成28年3月(1年間)
目的:  本研究では,地域研究に関する史資料,特にフィールドノートを対象とし,そこに記述されている場面の時空間的特徴を,テキストマイニング手法を用いることで,定性的ではなく定量的に表現・解析する手法の確立を目指す。特に以下の2点に着目する。
1) フィールドノートからの時空間的特徴の抽出と場面の構造化:テキストから各場面を特徴付ける用語とともに地名・日付を抽出する。この結果を用いることで,各場面に対する定量的解析可能なデータ表現モデルの確立を目指す。
2) フィールドノート情報の利用:1) で表現した場面を検索できるフィールドノート検索システムのプロトタイピングを行う。このとき地域研究者が必要とする検索機能を突き止めていく。また,HuTime / HuMapでの利用やセマンティックウェブ(Webページに記述された内容をコンピュータ分析できるように記述する方法)の技術を用いるなど,1)で表現した場面データの2次利用を図る仕組みの実現を目指す。
研究実施状況:  複合共同研究ユニット「「地域の知」の情報学―時間・空間・語彙に注目した地域情報学の展開―」および個別共同研究ユニット「地域研究データにおける時空間情報の実践的活用」との共同で、研究会を5回開催し、人文科学領域における時空間情報処理の可能性について、多様な研究領域の研究者が、考え方や問題点を共有し、研究の方向性を見い出すことを目的とした研究懇談会を3回開催した。また、第20回情報知識学フォーラム(主催:情報知識学会)「地域情報学における知識情報基盤の構築と活用」をテーマとし開催に協力し、日本人口学会関西部会との共催で研究会を開催した。
◯研究会
【第1回研究会】
日時:2015年5月30日
場所:京都大学地域研究統合情報センター
発表:資源共有化システムの現状と将来像,他4件
【第2回研究会】
日時:2015年9月12日
場所:京都大学地域研究統合情報センター
発表:フィールドノートにおける場面分類とwebサービスを用いた地名抽出,他5件
【第20回情報知識学フォーラム「地域情報学における知識情報基盤の構築と活用」(主催:情報知識学会)
場所:同志社大学今出川キャンパス 弘風館
発表:Linked Dataによる分野連携型データベースの枠組み-大規模知能データベース-,他5件
【第3回研究会】
日時:2015年1月29日
場所:東京大学史料編纂所
発表:タイに関する地名辞典についての考察-掲載量と位置-,他3件
【第4回研究会】
日時:2016年2月19-20日
場所:熊本県立大学
発表:時間情報の活用と基盤構築,他7件
【第5回研究会】(日本人口学会関西地域部会との共催)
日時:2016年3月5日
場所:総合地球環境学研究所
発表:昨今のGISデータと人口分析,他8件
◯研究懇談会
2015年6月27日,2015年8月10日,2015年12月21日
研究成果の概要:  「研究の目的」で述べた、フィールドノートに対する時空間的特徴の定量的表現・解析手法の確立のため、以下の問題に取り組んだ。
1) フィールドノートからの時空間的特徴の抽出と場面の構造化:情報リソースとして、高谷好一著「地域研究アーカイブズ フィールドノート集成2」を利用し、前年度までの研究課題「地域研究データにおけるトピックの検出と時空間変化に関する研究」の成果を取り入れ、対象資料からテキストの構造化、テキスト内に潜在する話題検出手法などを行い、テキストの定量的解析を進めた。辞書等の整備がなされていない環境下でテキストから時空間情報の抽出を行った。テキスト内の各場面の構造化を進め、本研究で得られた場面データを時空間解析のための基盤情報として、地名辞書に追加・蓄積していく手法を検討した。
2) フィールドノート情報の利用:1) で表現した場面を検索できる情報システムのプロトタイピングを行った。単なる全文検索ではなく、場面の定量的特徴にもとづいた関連する場面の提示を可能とする情報提示機能を盛り込んだ。RDFで場面を表現することにより2次利用可能なデータ形式を検討した。
公表実績: 【論文】
・山田太造,井上聡「前近代日本史史料に関わる人名情報の収集・蓄積に関する考察」,研究報告人文科学とコンピュータ(CH),Vol.2016-CH-109,No.2,pp.1-4,2016.
・山田太造「フィールドノートに記述された場面を特徴づける−語彙による知識処理−」,特集 第20回情報知識学フォーラム「地域情報学における知識情報基盤の構築と活用」,情報知識学会誌,Vol.25,No.4,pp.315-324,2015.
・山田太造「地域研究史資料を対象とした時空間的特徴の抽出と場面の構造化」, 第14回情報科学技術フォーラム講演論文集,vol.14, no.4, pp.409-410, 2015.[査読無]
・山田太造「東京大学史料編纂所の編纂とその業務にともなうデータベース」,歴博公開シンポジウム「資料がつなぐ大学と博物館―「研究循環アクセスモデル」の構築にむけて―」予稿集,pp.52−55,2016.
・山田太造「テキストデータを使うとどのようにフィールドが分類できるか?」,日本人口学会開催地域部会2015年度研究会,2016年3月5日,総合地球環境学研究所.
・柳澤雅之,高田百合奈,山田太造「地域情報学の読み解き−発見のツールとしての時空間表示とテキスト分析」,地域研究,Vol.16,No.2,pp.267-291,2016.(査読有)
・関野 樹「時間情報基盤の構築と活用 -時間に基づく知識処理-」,情報知識学会誌 25 :303-314, 2015.
・関野 樹「暦に関するLinked Dataとその活用」,情報処理学会シンポジウムシリーズ 2015(2) :191-198,2015.(査読有)
・関野 樹「明治以降の「旧暦」のデータベース化」,情報処理学会研究報告人文科学とコンピュータ(CH) 2015-CH-107(1) :1-4,2015.
・後藤真「人文社会系大規模データベースへのLinked Dataの適用−推論による知識処理−」,情報知識学会誌 Vol.25, No.4,2015.
・後藤真「総合資料学の射程と情報基盤」,歴博公開シンポジウム「資料がつなぐ大学と博物館―「研究循環アクセスモデル」の構築にむけて―」予稿集,pp.10-15,2016.
・後藤真「総合資料学のためのプロトタイプについて」,歴博公開シンポジウム「資料がつなぐ大学と博物館―「研究循環アクセスモデル」の構築にむけて―」予稿集,pp.16-21 ,2016.
・大向一輝「学術資料をひらく、つなぐ」,歴博公開シンポジウム「資料がつなぐ大学と博物館―「研究循環アクセスモデル」の構築にむけて―」予稿集,pp.26-29,2016.
・永崎 研宣,苫米地 等流,A.Charles Muller,下田 正弘「持続可能なデジタルアーカイブに向けて―SAT 大蔵経データベースにおける取り組みを通じて」,じんもんこん2015論文集, pp. 219-224, 2015.
・荒川尚子,太田勝正,石川正敏,松田正巳,原正一郎「タブレット端末を用いた保健・医療活動データエントリシステムの有用性調査」医療情報学35,pp1146-1149, 2015.
・Taizo YAMADA, Satoshi Inoue: Detection of People Relationship Using Topic Model from Diaries in Medieval Period of Japan. Proceedings of DH2015, −, 2015.(査読有)
・Makoto GOTO, Motomu NAITO: Digitalization of Shosoin Monjo and Extraction of Knowledge. Annual international conference of the Alliance of Digital Humanities Organizations (ADHO), 2015.(査読有)
・Mamoru SHIBAYAMA: Medieval East-West Corridor in Mainland Southeast Asia. Advancing Southeast Asian Archaeology 2013, SEAMEO SPAFA Regional Centre for archaeology and Fine Arts 2105, pp.423-431, pp.458-461, 2015.(査読有)
・Sekino Tatsuki: Time Information System on the Web. Proceedings of ANGIS Taipei Meeting 2015, 2015(査読付).
・Taizo YAMADA: Extraction and Management of Spatiotemporal Term from Field Notes and Data Structuring for its Sharing in Area Studies. Proceedings of PNC 2015 Annual Conferenceand Joint Meetings, 2015.
・Sekino Tatsuki: Semantic Web of Changes in Entities and their Causal Relationships. Proceedings of PNC 2015 Annual Conferenceand Joint Meetings, 2015.
・Shoichiro HARA: Construction of Linked Data for the Humanities: To Integrate Heterogeneous and Plural Humanities Databases. Proceedings of PNC 2015 Annual Conferenceand Joint Meetings, 2015.
・Makoto GOTO: Construction of Linked Data for the Humanities: To Integrate Heterogeneous and Plural Humanities Databases. Proceedings of PNC 2015 Annual Conferenceand Joint Meetings, 2015.
・N.Arakawa, K. Ota, M.Ishikawa, L.Piyabaditkul, M.Matsuda, S.Hara:Evaluating a Community health Activity Data-Entry System Using the System Usability Scale. 19th EAFONS 2016, pp.916, 2016.
・Shoichiro HARA:Open Platform for Academic Humanities Data. International Symposium on Grids & Clouds 2016 (ISGC 2016) , 2016.(査読有)
・Kiyonori Nagasaki, Paul Hackett, A. Charles Muller, Toru Tomabechi, Masahiro Shimoda: Significance of Linking between past and present, east and west, and various databases. Digital Humanities 2015, 2015.(査読有)
・永崎研宣「「翻デジ」とNDL」『情報処理学会研究報告.人文科学とコンピュータ研究会報告』 2015-CH-106(12), pp. 1-4,2015.
・永崎研宣「「デジタル・アーカイブ」の利活用可能性を高めるために―仏典画像統合検索APIの構築を通じて」『情報処理学会研究報告.人文科学とコンピュータ研究会報告』, 2015-CH-107(3), pp. 1-4,2015.
【国際会議発表】
・Taizo YAMADA: Analysis of Archaeological Information Using Topic Model Technologies. International Workshop on Application of Science and Technology for Cultural Studies(IWASTCS2015), Venue: 6th Floor, Princess Maha Chakri Sirindhorn Anthropology Centre (SAC), Bangkok, Thailand, 13 Nov 2015.
・Shoichiro HARA:Open Platform for Academic Humanities Data. ISGC 2016 - International Symposium on Grids and Clouds, Tapei, March 13-18 2016.
・Mamoru SHIBAYAMA, San WIN, Hiroshi SUGIYAMA, Yuni SATO: A Preliminary Report on Survey of Kiln Sites. Elizabeth Moore (SOAS; NSC ISEAS), Mon Stat, 6 -10 July 2015, Université Paris Ouest Nanterre la Défense.
・Mamoru SHIBAYAMA: Creating Archaeo-Ontology based on the Inventory of Monuments. International Workshop on Application of Science and Technology for Cultural Studies(IWASTCS2015), Venue: 6th Floor, Princess Maha Chakri Sirindhorn Anthropology Centre (SAC), Bangkok, Thailand, 13 Nov 2015.
【国内学会・研究会等発表】
・後藤真「もう一度持続的なデジタル・アーカイブを考える―総合資料学構築のための整理―」,東洋学へのコンピュータ利用第27回セミナー,京都大学,2016年3月18日.
・山田太造「テキストデータを使うとどのようにフィールドが分類できるか?」,日本人口学会開催地域部会2015年度研究会,2016年3月5日,総合地球環境学研究所.
・山田太造「史料編纂所における人名・地名に関するデータについて」,H-GIS研究会,2015年5月30日,京都大学地域研究統合情報センター.
・山田太造「フィールドノートにおける場面分類とwebサービスを用いた地名抽出」,2015年9月12日,京都大学地域研究統合情報センター.
・山田太造「地域研究史資料に対するテキストマイニング適用の試み」,2016年2月20日,熊本県立大学.
【招待講演】
・Mamoru SHIBAYAMA: Medieval East-West Cultural Corridor in Mainland Southeast Asia. International Workshop on Application of Science and Technology for Cultural Studies(IWASTCS2015), Venue: 6th Floor, Princess Maha Chakri Sirindhorn Anthropology Centre (SAC), Bangkok, Thailand, 13 Nov 2015.
・後藤真「デジタル人文学とデジタル・アーカイブ」,東京大学大学院情報学環 DNP学術電子コンテンツ研究寄附講座 開設記念シンポジウム「これからの学術デジタル・アーカイブ」,東京大学,2016年2月7日.
・後藤真「歴史学の情報part2ー人文科学者が行う情報処理」,イベント企画:IPSJ-ONE,情報処理学会第78回全国大会IPSJ-ONE,慶應義塾大学,2016年3月13日.
・永崎研宣「研究活動としての人文学デジタル化 ―仏教学知識基盤を事例として」,大規模学術フロンティア促進事業「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」 第1回 日本語の歴史的典籍国際研究集会プログラム「可能性としての日本古典籍」, 国文学研究資料館,2015年7月31日.
・永崎研宣「SAT大蔵経データベースをめぐる漢字情報」, シンポジウム 「字体と漢字情報」 ―HNG公開10周年記念―, 於国立国語研究所, 2015年11月22日.
・Kiyonori Nagasaki: The SAT database and the future of digital humanities. WORKSHOP: Nirvana Sutra Workshop, UC Berkeley, Jan 7 2016.
・永崎研宣「テクストマイニングをめぐるデジタル・ヒューマニティーズの課題」, 第4回九州大学異分野融合テキストマイニング研究会シンポジウム ― テキストマイニングとデジタル・ヒューマニティーズ, 九州大学, 2016年1月30日.
・永崎研宣「デジタルヒューマニティーズ:大藏經テキストデータベースプロジェクト」, 東京大学大学院情報学環 DNP学術電子コンテンツ研究寄附講座 開設記念シンポジウム「これからの学術デジタル・アーカイブ」, 於東京大学福武ホール, 2016年2月9日.
・Kiyonori Nagasaki: Crisis of Humanities in Japan. CEAL2016, 於シェラトンホテルシアトル, 31 Mar 2016.
【その他】
・[報道] 柴山守「NHKスペシャル・アジア巨大遺跡・第一集密林に消えた謎の大都市~カンボジア アンコール遺跡郡~」,2015年10月17日放映.
・[会議レポート] 山田太造「じんもんこん2015 開催報告 -議論沸騰の3日間in京都-」,情報処理,Vol.57,No.4,pp.404-405,2016.
研究成果公表計画
今後の展開等:
[研究成果公表計画]
 「地域の知」に関連する研究会・国際会議(人文科学とコンピュータ研究会、PNC Annual Conference and Joint Meetingsなど)において特集セッションを組む予定である。国内研究会の開催や関連学会・研究会での発表を介して公開することを予定している。また地域研究者に対し、研究の成果になりえるデータを積極的に利用していただくなど、フィールドノート自体の価値向上に向けた取り組みも予定している。
[今後の展開]
 本研究における地域研究史資料に対するテキストマイニング手法適用は、地域研究の深化、および、もとのデータたる史資料(フィールドノート)自体の地域研究における研究的価値向上を目的としてきた。さらに関連情報提示手法も組み合わせることにより、地域研究史資料を軸とした「地域の知」としての知識表現・知識獲得、さらには「地域の知」の外在化へ発展し、他の「地域の知」との組み合わせも可能になると考えている。