ディープラーニング, 人工知能, 文章生成

ディープラーニングで福沢諭吉を勉強させたら、こうなった。

なんというか、この結果を見たときは衝撃だった。

時は東京都知事選の結果が世を沸かせ、小池百合子氏が圧勝しメディアで話題になっていた時、ディープラーニングで文章を生成するという人工知能システムのテストのために試行錯誤をしていた、私のコンピュータ端末にこれが現れた。

若者もあり、あるいは才智|逞《たくま》しゅうして役人となり商人となりて天下を動かす者もあり、あるいは智恵分別なくして生涯、飴《あめ》やおこし[#「おこし」に傍点]四文の銭も、己《おの》が職分の何ものたるを知らず、子をばよく生めどもその子を教うるの道を知らず、いわゆる恥も法も知らざる馬鹿者にて、その子孫繁盛すれば一国の益はなさずして、かえって害をなす者なきにあらず。かかる馬鹿者を取り扱うにはとても道理をもってすべからず、不本意ながら力をもって威《おど》し、一時の大害を鎮《しず》むるよりほかに方便あることなし。

これすなわち世に暴政府のある所以《ゆえん》なり。ひとりわが旧幕府のみならず、アジヤ諸国古来みな然り。されば一国の暴政は必ずしも広く悪《にく》むるにあらず、この一身の自由を妨げんとする者あらば政府の官吏も憚《はばか》るに足らず。ましてこのごろは四民同等の基本も立ちしことなれば、いずれも安心いたし、ただ天理に従いて存分に事をなすべしとは申しながら、およそ人たる者はそれぞれの身分あれば、またその身分に従い相応の才徳なかるべからず。身に才徳を備えんとするには物事の理を知らざるべからず。物事の理を知らんとするには字を学ばざるべからず。これすなわち学問の急務なるわけなり。

昨今の有様を見るに、農工商の三民はその身分以前に百倍し、やがて士族と肩を並ぶるの勢いに至り、今日にても三民のうちに人物あれば政府の上に採用せらるべき道すでに開けたることなれば、よくその身分を顧み、わが身分を重きものと思い、卑劣の所行あるべからず。およそ世の中に無知文盲の民ほど憐《あわ》れむべくまた悪《にく》むべきものはあらず。智恵なきの極《きわ》みは恥を知らざるに至り、己《おの》が職分の何ものたるを知らず、子をばよく生めどもその子を教うるの道を知らず、いわゆる恥も法も知らざる馬鹿者にて、その子孫繁盛すれば一国の益はなさずして、かえって害をなす者なきにあらず。かかる馬鹿者を取り扱うにはとても道理をもってすべからず、不本意ながら力をもって威《おど》し、一時の大害を鎮《しず》むるよりほかに方便あることなし。

これすなわち世に暴政府のある所以《ゆえん》なり。ひとりわが旧幕府のみならず、アジヤ諸国古来みな然り。されば一国の暴政は必ずしも暴君暴吏の所為のみにあらず、その実は人民の無智をもってみずから招く禍なり

 

なんだ、これは!?。

この文章は福沢諭吉の文章をリカレントニューラルネットワークというディープラーニングの手法を使って学習させた、いわば「福沢諭吉っぽい人工知能?」に新たに文章を書き起こさせたものだ。

学習させたデータ、つまり、この人工知能の教科書は著作権切れの作品データを公開している青空文庫からダウンロードした「学問のすゝめ」の本文だ。

だから明治時代の言葉遣いだ。原文と比較すると短文毎には「学問のすゝめ」と同一の文もある。だが文と文のつながりや構成がちがう。にも関わらず、納得感のある論理性や一貫性があるように見える。新しくなっているのだ。仔細にみていくと原文からクドさが削げ落ち、重要そうな部分がうまく接続され読みやすくなっているように見え、起承転結が構成されているように思える。

選挙で盛り上がっている時に、これだ。ノックアウト。キーボードを打つ手が震えた。いや、そもそもコマンドを打てず、考え込んでしまった。

この文章が出てくるまでは、そもそも、まともな文章が出てくることなど期待してなかったし、実際、ヘンテコな文章のオンパレードだった。せいぜい、ワンセンテンス、まともに読めるようになったらラッキーくらいに思っていた。これまでに福沢諭吉以外の数々の作品や各種文章を学習させて実験をしていく中で、どうやら文章の構成や文体などに論理性やある種の構造化されたような文章の場合、比較的、まともな文章生成マシンに育てやすい可能性があるかも(?)、というくらいにはコツがつかめてきたところだった。

ディープラーニングは変数調整など手当たり次第に「数撃ちゃ当たる」要素と、ただし、ある程度は屁理屈でもいいので理論立てた目星をつけて、調整していく、という職人技のようなものがある。福沢諭吉も数撃ちゃ当たるの1つに過ぎず、入力データや変数調整も目星の多数中の1つだった。そこから、これが出てきた。

今まで当社では、このレベルの情報を公開したことはなかった。だが、この結果を見て、衝撃的すぎてブログを立ち上げることにした。人工知能という言葉には実は正直なところ、何か違うような違和感がある。とはいえ、これだけ世の中では人工知能がバズワード化している中で時代に抗う必要性もない。それに乗っかったビジネスも多数現れてきている。ポエムと呼ばれる「それはさすがに、ちょっと違うんじゃないの」というものもまで玉石混淆だ。

理論や考え方だけでなく、ビジネスとして、この分野に関わってきた知見や見通し、そして現実を書きとめていこうと思う。