2015年7月11日土曜日

<話題> なんと!くずし字が自動で解読できる時代?! ~来年の大河は「真田丸」~

 いよいよ来年の大河ドラマ「真田丸」の出演者陣が決まり始めており、楽しみになってきたところですが、いかがお過ごしでしょうか?

 
2016年大河ドラマ「真田丸」出演者発表

http://www2.nhk.or.jp/pr-movie/detail/index.cgi?id=07_0003#1412


 真田幸村ちゃんこと堺雅人さんはさておき、


 なぜか大泉洋ちゃんが真田信之とか(^^

 個人的には、藤岡弘、の 本多忠勝が気になって仕方ありません(笑)ていうか、藤岡さん大河ドラマ21年ぶりらしいです!


 というわけで、来年の大河は、昨年のように新年より当ブログでも追いかけてゆくつもりなので、よろしくお願いします。


==========

 さて、この夏とっても面白い情報が飛び込んできました。

 それは凸版印刷さんのプレスリリースなのですが、


 凸版印刷 くずし字解読するOCR発表
 http://www.toppan.co.jp/news/2015/07/newsrelease150703_2.html


 とのこと。われら日本文学・日本史専攻者にとっては、


 すっげーーーーーーー!!!


という時代の幕開けのようで(笑)


 くずし字というのは、本来は「変体かな」や「草書体」というものなのですが、なんせ近世以前の人には


 楷書という発想がない


のです。 なので、自筆でも印刷物でも、ぜんぶ「くずし字で書いてある」のが普通!それを読みこなすのは、日本史研究の上でとても重要かつ難解なのでありました。


 ところが、OCRである程度読んでくれれば、解読スピードが大幅にアップすること間違い無しです。 これは楽しみな技術ですね。


 そもそも、人間が読み解く「くずし字解読」も、実は技能の根幹部分はパターン認識です。

 この形のくずし字は、本来この字であるというパターン化された経験則があれば、解読の速度と精度が飛躍的に上がるので、コンピュータ向きかもしれません。

(実際、くずし字辞典はよりたくさんの用例が載っていることに意義があります。つまり、パターンマッチングなのですね)


 ただし、気になるのはリンク先にあるくずし字の実例なのですが・・・・。


 あまりに美しいくずし字の見本なので、


 これやったら誰でもすぐ読めるわーーーー!!!!


と突っ込みたくなるのは私だけでしょうか?(笑)

 ぜひ、もっと難解なやつにも対応できるよう、お願いしますね。


==========

 さて、それはともかく、IT技術と古典を結びつけるといういわば「情報日本文学」「情報国文学」という領域・ジャンルはまだ学問的に確立していません。

 研究段階としてはプロジェクトがいろいろあることと思いますが、これから「古典とテキスト」の問題とか、研究テーマがたくさん生まれてくるように想像します。


 あー、私が研究者として生きていれば、絶対この分野を絡めていただろうなあ。と思いますが、残念ながらそれは空想のお話。このあたりのことは、また別にお話する機会を設けたいと思っています。


 では。今日のところはこれくらいで。





0 件のコメント:

コメントを投稿