先日大学アプリレビューvol.10で紹介した「くずし字学習支援アプリKuLA」。このアプリ開発の中心を担っているのが、大阪大学文学研究科の飯倉洋一教授と同じ文学研究科の大学院生、そして京都大学文学研究科所属で大阪大学特任研究員でもある橋本雄太さんだ。
今回はアプリ開発の裏側を伺うため、大阪大学を訪ねた。
くずし字学習支援アプリはこうして生まれた。
取材に訪れた私を迎えてくださったのは、主にアプリの実装を担当された橋本雄太さん、デザインを担当した平井華恵さん(大阪大学)、収録文字の選定や蒐集を行った久田行雄さん(大阪大学)とダニエル・小林ベターさん(大阪大学)の4人。
残念ながら飯倉洋一教授は今回お話を伺うことはできなかったが、開発に関わるさまざまな話を伺うことができた。
そもそも、このアプリを開発しようとしたきっかけは何だったのか。まずはその理由を伺った。
アプリの実装・プログラミングを担当した橋本雄太さん(京都大学大学院文学研究科所属)
「現在国文学研究資料館では、所蔵する30万点もの古文資料をデジタル化し、公開するプロジェクトを行っています。すでにかなりの文献が活用できるようになっていますが、公開されているのはあくまで資料の画像であって、テキスト化されているわけではありません。活用するためにはくずし字を読む力が必要なんです。
せっかくたくさんの資料が公開されているのに、活用するノウハウがない。
私は京都大学理学研究科の古地震研究会にも参加していますが、地震の研究では昔の資料を読み解く必要もある。研究者のなかでも、くずし字で書かれた文献を読める人はごくごく少数です。
くずし字を読める人の力を借りれば文献を調べることはできますが、研究資料として利用するには、研究者自身が直接文献にあたる必要がある。
読みたいと思っている人はいるのに、手軽に学習する方法がないのがネックなんです」
古典文学を研究する国語学や日本文学研究者、日本史研究者にとっては、くずし字学習は必須。しかし、その他の分野となると、読める人の数はやはり多くないのだそう。
「私はこれまでにもスマートフォン向けアプリを開発しているのですが、『くずし字を読みたい人が手軽に学べるアプリ』を作れないかと考え始めていた矢先、たまたま古地震研究会の合宿での講演会に登壇いただいた飯倉先生に『くずし字をスマートフォンで学ぶアプリを作れないか』と相談され、共同で開発することになりました。
今までくずし字に触れてこなかった方や海外の研究者にも活用してほしいと思い、学習しやすいアプリケーションづくりに取りかかりました」
その後すぐに飯倉教授と橋本さんが中心となり、研究者を主な対象にして開発がスタート。
ところが、たまたまくずし字アプリを開発しているとTwitterで発信したところ、思わぬ方向からの反応があったのだという。
「Twitterで『今こういうアプリを作っています』とKuLAのことをつぶやいたら、10代20代の若い女性から大きな反応があったんです。100回くらいリツイートされまして。驚いて調べてみると、今若い女性の間で、日本刀を題材にしたゲームが話題になっていることを知りました。
このゲームのプレイヤーの中に『くずし字を読みたい』という需要が少なからずあることを知り、急遽『新刃銘尽(あらみめいづくし)後集』を収録することにしました」
公開後もダウンロード数などをモニタリングしているそうだが、利用者には18~22歳の女性が多いのだという。また、講義でくずし字を学ぶ大学生と思われる人も少なくない。
30代以上の年代もいるものの、スマートフォンに親しむ若い世代の利用が目立つのだそうだ。
日本刀については伺ったとおりだが、それ以外にも収録資料がある。こちらはどのように選定したのだろうか。
「『新刃銘尽後集』については先ほどの理由ですが、『方丈記』と『しん版なぞなぞ双六』を収録したのは別の理由です」と橋本さん。
「収録資料は2つの軸を定めて選びました。一つは誰でも知っているものであること。もう一つが見た目にも楽しめるものであることです。
『方丈記』は高校で習う代表的な古典で誰でも知っています。また、日本だけでなく、海外でも古典文学学習の教材として使用されているそうで、知名度が高いという理由から収録しました。
『しん版なぞなぞ双六』は絵が入っていて見た目にもおもしろいので」とのこと。
『方丈記』は文字のくずし方やつなぎ方、語句など、くずし字で書かれた資料を読む上で基本となるものが多く使われているそう。
収録されている『方丈記』の画面。「ゆく川の流れは絶えずして」という、有名な序文が収録されている
それにしてもこのアプリ、実際に使ってみると、くずし字学習でつまづくポイントをしっかり抑えて開発されていることがわかる。
例えば各文字の用例の収録などが代表的だ。
この用例画像の選定と収録には久田さんと小林ベターさんが関わったのだという。
くずし字学習の基本をおさえた収録コンテンツができるまで。
文字の選定と収録に関わった久田行雄さん(右・大阪大学博士後期課程)とダニエル・小林ベターさん(左・大阪大学博士後期課程)
「くずし字を読む時ですが、一文字一文字を覚えて読むというよりは、前後の文字や知っている文字を読んで、『この文章ならこの文字はこれかな?』というふうに、推測しながら読んでいくんです。
なので、文字を一つずつ覚えるだけでは不十分。そのため、用例集という形でそれぞれの文字のつながりパターンを学習できるようにしています」と久田さん。
なかでも、適切な用例を探すことに手間がかかったとのこと。
収録されている用例は同じ語句でもパターンの違うものが収録されていたりと、学ぶ側としても嬉しい用例集になっている。
では、具体的にどのように用例を選出していったのだろうか。
「まず漢字と仮名は分けて考えました。仮名については、アプリの容量などもふまえて、前もって収録文字数を決め、よく使われる文字を選んで収録するようにしました。
漢字は岩波文庫の古典文学大系を参照し、この文学大系にある近世文学作品に出てくる文字を機械的にカウント。その中で、まず上位500文字くらいにしぼりこみ、その後市販のくずし字辞典なども参考にしながら選んでいきました」
とくに大変だったのは、用例集で表示するくずし字のパターンの画像を集める作業。
文字のつながりごとにくずし方も変わってくるため、突飛ではないくずし字をなるべく多くのパターン集めるよう心がけたのだという。
これは機械で選ぶことはできないため、一つ一つを人の目で確かめながら選んでいったのだと久田さんは言う。
最終的に収録のための画像の切り出しは、橋本さんが開発した専用ツールを使って、人海戦術で行った。
「ブラウザ上でくずし字の画像データを切り出し、クラウドデータベースにアップロードするプログラムを作成しました。画像は久田さんと小林ベターさん、さらにアルバイトの学生3名がかりで集めたものです」と橋本さん。
ブラウザ上で文献から直接文字画像を編集できるソフト
そうして収録されたのが、280文字以上3000パターンもの用例だという。近世文学に絞ったのは、まずは近世の文献を読めるようにしようという目的があったため。
それにしても、くずし字を学習するアプリとして、実に細かいこだわりを感じる。
このこだわりは収録文字だけでなく、操作部分やデザインにも及んでいる。
次回は操作やデザインのこだわりや、KuLAの未来について伺う。
取材協力:大阪大学21世紀懐徳堂
(後編はこちら)
【2017年1月11日(水)追記】
2017年1月10日から、パソコン・タブレット向けWebアプリケーション「みんなで翻刻」が公開されました。こちらは研究者と市民が協力し、古い地震資料に書かれたくずし字の活字化を進めようというプロジェクトです。
「みんなで翻刻」ではくずし字解読を学ぶことも可能。こちらの内容はKuLAとも連携しているので、KuLAで学んだことを活かして、地震研究に協力することができます。