日本文化の入り口マガジン和樂web
11月29日(月)
この世をば わが世とぞ思ふ 望月の 欠けたることも なしと思へば(藤原道長)
日本文化の入り口マガジン 和樂web
日本文化の入り口マガジン 和樂web
11月25日(木)

この世をば わが世とぞ思ふ 望月の 欠けたることも なしと思へば(藤原道長)

読み物
Culture
2021.10.19

源氏物語も春画の文字も読めちゃう!AIくずし字認識アプリ「みを(miwo)」開発者インタビュー

この記事を書いた人
この記事に合いの手する人

この記事に合いの手する人

「本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ)」と、8月30日、Twitter投稿がありました。おお、待ってました!

私も悦子さんから聞いて、待ってました!今回は開発者インタビューです!

文字が読めれば屏風も春画もさらに楽しい

古い書物や絵画、屏風などに書かれた、くねくねとした文字を見たことがありますか? それらの文字を「くずし字」と呼びます。 編集・ライター業をしていると、難解な古文書や図録を読む機会はあるのですが、人物の背景などにある謎のくねくね文字は読めません。

私は読めないものとして諦めてました

そこへ、「みを」です。スマホやタブレットで撮影したくずし字を解析し、現代人にも読める文字に変換してくれるアプリなんて、便利すぎない? いにしえの書物がスラスラ読める日がくるなんて! とロマンチックな気分になっていたら……、

「春画は絡み部分にしか目がいかなかったのに、背景の文字に夢中」(春画ガチ勢)
「これで皆三成の手紙を読める…!!」(石田三成アカウント)

など、ネットユーザーたちはすでに斜め上を行っていました!

きっかけは、キテレツ大百科のメガネ「神通鏡」?

開発者は国文学研究者で、なんとタイ人の女性。カラーヌワット タリン(Tarin Clanuwat)さんといいます。

リリースの半年前ぐらいから、自身のTwitterで、「アプリを開発中です」「将来的にはiOS版およびAndroid版を公開する予定です」などと情報をたびたび発信しており、わたしもとっても楽しみにしていました。日本文化の入り口マガジンこと、和樂webとしては、タリンさんにインタビューするしかありません。

ですね!どんな開発ストーリーが読めるのか楽しみ

取材はオンラインで行いました。

–タリンさんはタイのご出身だそうですね。どのような経緯で、日本文学に興味を持ち、研究者になったのですか?

タリンさん:子どもの頃から日本と日本文化に魅了され、日本語を勉強しはじめました。特に、漫画『あさきゆめみし』が大好きで何十回も読みました。その後、大学院で勉強しようと思い、早稲田大学大学院博士課程を修了し、国文学研究者になりました。専門は、『源氏物語』です。

今はくずし字の読み書きができますが、やはり、普段の生活の中に取り入れないと身につきません。日本語や英語の勉強と同じで、教科書を読むだけではダメですね。

–「みを」の名づけも、源氏物語からですか?

タリンさん:「みを」は、『源氏物語』第14帖「みをつくし」からつけました。「みをつくし」が人々の水先案内となるように、「みを」アプリがくずし字資料の海を旅する案内となることを目指しています。

–アプリの着想からリリースまで、どれぐらいかかりましたか?

タリンさん:アプリ開発をはじめたのは、リリースのちょうど一年前です。最初は、くずし字認識のサービスをWeb上で公開していましたが、使い勝手があまりよくなく、スマホアプリを考えつきました。着想のきっかけになったのは、漫画『キテレツ大百科』に登場するアイテム「神通鏡」なんです。

漫画の影響で外国の方が日本の国文学者になり、日本のくずし字認識アプリを開発したなんてドラマチック。そうそう、『キテレツ大百科』の主人公は発明好きな小学生で、先祖が書いた『奇天烈大百科』を入手するも解読不能。一緒に伝わった眼鏡「神通鏡(じんつうきょう)」を通さないと、読めないんですよね。あれっ、これは「みを」のコンセプトそのままですね。

日本人の古文・漢文離れとタリンさんの想い

近年、古文・漢文教育の不要論が話題になることがあり、賛否両論が飛び交います。かく言う私も受験後はすっかり忘れていました。が、編集者になり古い資料や図版を読む必要もあり、古文・漢文や古い文字への興味が出てきました。しかし、人によっては一生触れないかもしれません。

–日本人の古典離れを、どのように思いますか?

タリンさん:古文も漢文も日本の財産なのに、日本人が学校で触れなくてどうするのと、残念に思っています。だから、「みを」が古文・漢文に親しむきっかけになればいいなと思っています。

「みを」で春画のキャプションもエロ楽しい

最新ガジェットやアプリを使いこなしてネットの海を泳ぐネットユーザーは、発想が自由。春画の背景を読んだり、代々伝わる謎の掛け軸を読んだりと、思い思いに「みを」を使い、SNS投稿を楽しんでいます。偉大な仕事を成し遂げたタリンさんには、どんな感想が届いているのでしょう?

–リリース後、どのような反響がありますか? また、意外な使い方で盛り上がっているなどあったら教えてください。

タリンさん:身近なところだと浮世絵の企画展ポスターやチラシ、掛け軸などですね。くずし字があれば「みを」のカメラを向け、認識ボタンを押してみてください。ツイッターの反応を見るまで考えたこともなかったのですが、「春画のくずし字がかなりエロい」と盛り上がっていたのはおもしろかったです(笑)。

「みを」を使って浮世絵を読んでみた結果は!?

今は、国立国会図書館デジタルコレクションなどで、古い資料がオンラインでいつでも見られます。検索して、気になる資料を見つけ、パソコンのモニターにスマホをかざしてアプリを試してみると楽しいかも。博物館や資料館もくずし字の宝庫。撮影不可のところもありますが、このアプリが浸透すれば、利用可のスペースが増えるかもしれません(と、希望的観測)。

アプリ、使ってみました。天才・葛飾北斎「蛸と海女(たことあま)」で、女性に濃厚に絡むエロいタコは……、

元画像はwikimedia commons

こんな感じで認識されました。タコ、「あしのからみあんばいはご(ど)うだ」とか言ってる~(笑)。

タリンさんの大好きな源氏物語は……

『源氏物語五十四帖 桐壷』広重 国立国会図書館デジタルコレクションより

たぶん、「いときなき 初元結ひに ながきよを 契るこころは 結びこめつや」ですね。いにしえの和歌が読めて、一気に平安時代にタイムトリップした気分。謎の感動がじわじわと押し寄せます。

確かに読めると嬉しい!子どものころ、字が読めるようになって嬉しかったのを思い出しました

また、アプリには認識結果をリスト化したり、くずし字検索ができたりする機能があります。活用方法や楽しみ方は、あなた次第。

「みを」の学習データは100万文字!ご苦労は?

「みを」の学習データは100万文字があり、よく出てくる漢字とひらがなを読むのは得意ですが、登場頻度の低い漢字は、ちょっと形が変わる(異体字など)と認識できないこともあります。これらをスムーズに認識できるようにすることが今後の課題なのだそうです。

でも、タリンさんなら難なくやってしまいそう。最後に、「今後の展望はありますか?」と聞くと、以下のような答えが返ってきました。

「アプリははじまりに過ぎません。まだ足りない、読めない部分がまだありますが、どんな資料でも高精度で認識できるよう改良したいです。最終的には人が読んで理解するものなので、どうすれば人が読みたくなるのかを追求したいです」。

アプリはツールに過ぎない。書いてあることは過去の財産。古典からわたしは、何を学べるだろう!

みを(miwo) – AIくずし字認識アプリ
http://codh.rois.ac.jp/miwo/

書いた人

出版社勤務後、編プロ「ミトシロ書房」創業。著書に『入りにくいけど素敵な店』『似ている動物「見分け方」事典』など。民謡、盆踊り、俗信、食文化など、人の営みや祈りを感じさせるものが好き。四柱推命・易占を行い、わりと当たる。

この記事に合いの手する人

編集長から「先入観に支配された女」というリングネームをもらうくらい頭がかっちかち。頭だけじゃなく体も硬く、一番欲しいのは柔軟性。音声コンテンツ『日本文化はロックだぜ!ベイベ』『アートラジオ』担当。ポテチと噛みごたえのあるグミが好きです。