2013年6月25日火曜日

ヴォイニッチ手稿と暗号解読

最近、話題になったニュースだそうですが、どうもヴォイニッチ手稿(写本)が、デタラメでなくて意味のある事が書かれているんじゃないか、という話をツイッターで小耳に挟みました。

で、そのヴォイニッチ手稿ってなんぞや? という方のために、困ったときのWikipediaから引用してみましょう。

14世紀から16世紀頃に作られたと考えられている古文書。全230ページからなり、未知の言語で書かれた文章と生物を思わせる様々な彩色された挿絵から構成されている。文章に使用されている言語は、単なるデタラメではなく言語学的解析に照らし合わせ、何らかの言語として成立機能している傍証が得られているため、一種の暗号であると考えられているが内容は不明。

このヴォイニッチ手稿に意味あるらしいよ、というBBC報道があったという話が、ツイッターでRTされてきたのですが、後から気になって元記事その他(下記リンク)を確認したら、「依然としてデタラメの可能性もあるよ」という記事で、意味があると断定した、という訳でもありませんでした。がっくし。

In Deep: 「ヴォイニッチ手稿は真実のメッセージを持つ」という英国 BBC の報道

で、ここから本題。
最近、ツイッターで暗号について呟いたら、少なからぬ反響頂きました。下はその時のツイートのまとめです。ツイッターやられてない方はどうぞ。

戦前・戦中の日本とポーランドの軍事協力と暗号 - Togetter

で、ヴォイニッチ手稿が今日まで論議を読んでいるのは、未知の文字で書かれた手稿が未だに分かっていない、つまり、未だ解明されていない暗号だからです。
今回は、ヴォイニッチ手稿と暗号について、その関係について書いてみたいと思います。



戦争の片手間でヴォイニッチ手稿解読

Wikipediaにも載っていますが、日本海軍のパープル暗号を解読したことでも知られるアメリカの暗号学者のウィリアム・フリードマン。彼がヴォイニッチ手稿の解読に挑んだが、結局解読できなかった、という話があります。

このフリードマン、暗号の歴史の中で必ず出てくる重要人物で、1922年に米国陸軍で採用されたM-94暗号機や、第二次大戦で米国陸海軍と国務省で使われた暗号もフリードマンにより開発されたものです。また、暗号解読の分野においても、彼のチームは1940年に日本の外務相暗号(パープル暗号)を解読するなどの成果をあげ、1952年に設立された国家安全保障局(NSA)でチーフ暗号解読者を務めました。

そんな暗号界で華々しい活躍をしたフリードマンですが、ヴォイニッチ手稿の解読に約30年を費やしています。 
彼は1920年代にヴォイニッチ手稿を発見したヴォイニッチの夫人から、ヴォイニッチ手稿の写しを得て、解読に取り組み始めます。ヴォイニッチ手稿が発見されたのが1912年ですから、かなり早い段階からフリードマンが手稿に興味を抱いていたことが分かります。

このフリードマン、というかアメリカが凄いのは、第二次大戦中にフリードマンを中心とした陸軍の暗号解読者らによって、「ヴォイニッチ手稿研究会」という、勤務時間外での非公式クラブを立ちあげた事です。戦争の真っ最中に、勤務時間内は敵の暗号解読し、定時になったらヴォイニッチ手稿の解読クラブという余裕がいかにもアメリカです。

このクラブは、1944年から1946年まで活発に活動していたことが分かっているそうですが、戦争の終結によって、暗号解読者が復員したために解散し、その記録は所在不明になっているそうです。

このように早くからヴォイニッチ手稿の解読に取り組んできたフリードマンですが、1950年代中盤から健康を害したために暗号解読を辞め、ヴォイニッチ手稿を解読すること無く、1969年に亡くなりました。



国語の使用頻度

このフリードマンの仕事の一つに、一般的な英文1万字中の各文字の使用頻度を調査したものがあります。アルファベットは26文字ですから、1万字の文中に均等に使われていた場合、統計学的には1字につき385±58の範囲での使用に収まるとされます。

ところが、フリードマンの調査では、この範囲に収まった文字は"j"と"l"の2文字だけで、 文字によって使用頻度に偏りがありました。これはどんな英文を選んでも再現性があることが確認されています。

これは現在でも簡単に再現できます。
試しに、本日6月25日のJapan Timesの記事を適当に選んで、その冒頭200文字(アルファベットのみ。数字・記号は除外)から各文字の使用頻度を数えてみました。下が実際に数えてみた記事とその該当文です。

①Qualcomm completes ¥10.89 billion investment in Sharp | The Japan Times
Sharp Corp. on Monday received the second half of Qualcomm Inc.’s ¥10.89 billion investment and completed procedures for forming a capital alliance on developing new display panels, the struggling electronics maker said. The investme turned the U.S.
②Japan, South Korea let more currency swaps expire | The Japan Times
Japan and South Korea agreed to end part of their currency swap contract next month as scheduled, reducing its overall size to $10 billion from $13 billion, the Finance Ministry said Monday.
The two countries “have reached the conclusion that they wil
上記の文にそれぞれ①、②と番号を振り、その使用頻度を集計したグラフがこちら。

①の文の使用頻度

②の文の使用頻度
フリードマンが調べた1万字に遥かに及ばない200文字の集計結果ですが、①と②で使われている文字の傾向がよく似ている事が分かります。

このように言語には、文字それぞれに使用頻度に特徴があり、ヴォイニッチ手稿がデタラメではなく、なんらかの意味を持っているのではないかと考えられている理由の一つも、これではないかと思います(ヴォイニッチ手稿を見たこと無いので当てずっぽうです。間違ってたらすみません)。

言語にこのような特徴があると、字を置き換えるだけの換字式暗号ではすぐに解読が可能ということも分かると思います。暗号は、いかに原文にある偏りを無くすよう変換するかが重要となってくるのです。

ヴォイニッチ手稿は15世紀頃に作られたと推測されていますから、それほど高度な暗号化はなされていないと考えられます。書かれてある文字が、言語学的な統計で意味があるようだと分かっていると言う事も、それを裏付けるものと思います。

逆に言えば、ヴォイニッチ手稿に言語による偏りの存在が残っているくらい暗号としての程度が低いのならば、なぜ著名な暗号学者達が100年近く挑んでも解読できないのか、という疑問が浮かびます。
これこそが、ヴォイニッチ手稿が本当に未知の言語で書かれたものか、あるいは頭の良いヤツが考えぬいたイタズラなのか、未だに議論に決着が着いていない理由なのでしょう。



【参考文献とか面白い本】



「基礎暗号学」は2巻構成の本で、1巻が暗号理論、2巻が暗号解読と暗号強度の話になります。
著者の加藤正隆は、本名を釜賀一夫といい、日本陸軍の暗号将校でした。1944年にパープル暗号の脆弱性に気付き、陸海軍・外務省・大東亜省の暗号担当者の会合の席で、パープル暗号を解読して警告したと言われるほどの暗号のエキスパートで、戦後も自衛隊で暗号解読に従事しました。
その釜賀が退官後に「数理科学」誌に連載したものに、現在でもネットワーク暗号で使われるDESや公開鍵暗号等の解説を加えたもので、暗号理論の概説としては良書であると思います。



「暗号を盗んだ男たち」は、日本陸軍における暗号開発・解読のドキュメンタリーで、「大逆転」シリーズでも知られる作家の檜山氏の読ませ方も上手く、読み物としても優れています。
価格も手頃なので、入門書としては最高だと思います。


Jim Reeds "William F. Friedman’s Transcription of the Voynich Manuscript"

ベル研究所研究員による、フリードマンとヴォイニッチ手稿の話で、今回の元ネタの一つ。
英語読み違えてたらごめんなさい。

以上