夏真っ盛り、みなさんいかがお過ごしでしょうか?
漢字で書けば大塚某こと、大塚とあるです。
勝手に名乗り、勝手に始めた「情報日本文学会」なる”学会?!”なるものの第一弾です。
本人はいたってまじめに取り組んでいますが、そのうちころ良い加減に力が抜けると思うのでよろしく。
まあ、”と学会”のようにゆるーくやりたいと思っております。
☆ と学会 ・・・トンデモ本を批判的に楽しむ某団体。
http://www.togakkai.com/
いいよねー。あのまじめさとユルさの中間ぐらいのノリが好き。
==========
というわけで、今回は、現代ビジネスさんに面白い記事があったのでそのあたりを。
コンピュータに「面白い小説」は書けるか
http://gendai.ismedia.jp/articles/-/44477
今村友紀さん、海猫沢めろんさんという二人の作家の対談なのですが、今村さんという方は、カンタンに言えば、
「売れる小説の設定や要素をパターン化して再構築すれば、半ば自動化された”ヒット小説”が作れるのではないか?」
という考え方で実験をなさっているそうです。
いやあ!面白い。まさに「情報日本文学」にふさわしい発想ですね。
( 実は私も、ちょっと傾向と対策は違うのですが、似たようなことをずっと考えていて、近々それに基づいたネタをひとつ公開する予定なので、こういう話はわくわくします。)
実は上の記事と似たような話はすでに存在していて、アメリカのハリウッド映画の脚本なんかでは、
「スタートして何分でこういうことが起きて、それから何分で主人公にアレが起きて、その後第三者が出てきて・・・」
という魔法のセオリーみたいなものが決まっていて、だいたいそれに沿っていれば面白くて売れる映画になるという話を聞いたことがあります。ほんまかいな。
==========
しかし、そうしてパターン化された創作物は、作家の個性というか心のようなものが入っていないのだとすればどうなの?!という疑義があります。
それを、記事では「作家の魂」と表現していますが、読者はやっぱり魂を求めるのではないか、ということです。
この問いへの答えは、みなさんにもいろいろ意見があろうかと思いますが、大塚某的には、
「案外、人間ってのは魂がなくてもパターンで感動し、面白いと感じちゃうんじゃないの?」
と思ってます(爆笑)
というのも、大塚某は、このブログではほとんど正体を明かしていませんが、別の活動で
「映像作家の真似事」のようなことをしたり、「台本のようなもの」を書く仕事に関わったり、「音楽製作に関するアーチストの真似事」のようなことをしたりしている
ので気づくのですが、映像にしても筋書きにしても
「物語の中の誰かが死んだら、客は泣く」
し、音楽ひとつにとっても
「カノン進行で曲を作ったら、それらしく聴こえる」
というセオリーが存在するので、人が感動したり心が震えるポイントなんて、実は狭いのじゃないか、と思っているわけです。
面白い話があって、私が審査員として携わっていた、とある「青少年の主張」みたいな意見発表の場があったのですが、 若者が次々に登壇しては「感動的な話」をするわけです。
自分の家族がどうとか、親がどうとか、あるいは自分の境遇はこうだけど頑張る、みたいな「お涙頂戴」の話が次々に繰り出されるわけですが、出場していたオトコの子がぽつりと控え室で言ってました。
「・・・いったい、今日何人死んだんやろな」
と。
彼はお父さんが亡くなって辛い思いをしており、その話を壇上でしたのですが、そんな当人が、「この大会では一体何人死ぬんだ」と苦笑するほど、まあ出場者の家族が次々に死んだ話をするというのは、ある種パターン化された
「いい話」「感動する話」
が存在するという証でもあるでしょう。
==========
【情報日本文学会 今日の研究1】
えーっと、後半戦は学術的なお話。
この世に出ているすべての書籍をアーカイブしてデジタル保存しよう、というとんでもない取り組みをしている集団がおりまして。
実現したらすごいことになるだろうなあ、と思っているのですが、そんな世界征服みたいな真似事をしているのはもちろん
グーグルさん
に他なりません。
当ブログでも取り上げているいろんな学術書や貴重書のたぐいがありますが、グーグルさんはすでにデジタル化を済ませており、今日はその実例をご紹介してみましょう。
歴代鎮西要略
https://books.google.co.jp/books?id=QJZHAAAAMAAJ&hl=ja&source=gbs_book_similarbooks
上のリンクには、グーグルブックスにおける「歴代鎮西要略」が収納されていますが、これだけではデジタルテキストとして読むことはできません。
しかし、検索窓がついているので、そこに文字を打ち込めば、その文字が含まれているかどうかの検索はできるようになっています。
たとえば「大塚」と打ち込むと、全6件中3件の回答が上がってきます。
ところがよ!!!
でもでも、この全文検索は不十分で、どうやら全文スキャンはされているものの、OCRの精度が低く文字化けがたくさん存在するので、「大塚」が完全に抽出されるわけではないのです。
なので、現時点ではあまり役に立たないのですが、情報日本文学会的には、こうした資料の全文テキスト化計画はぜひどんどんやってほしいものです。
まあ、権利関係もあるので、すべてを無料公開するわけにはいかないとは思いますが・・・。
例)「歴代鎮西要略」のグーグルブックス版は、2007年にミシガン大学にあった本を全文スキャン&デジタルOCR読み込みをしていると考えられる。
しかし、版元の文献出版(現存する企業さん)が、無料公開を許可していないので、デジタルファイルを閲覧することができない。
また、OCRについても読み込んだのみで原本との照らしあわせができておらず、かなり不完全。
当ブログではこれまでにも、デジタル公開されている資料や検索できるエンジンを発掘してはじゃんじゃん利用していますが、こういうものを探す技術、使いこなす技術がまず大事かな~なんて思いますです。はい。
0 件のコメント:
コメントを投稿