1 2つの構造化
文書および文章の構造化は、これから問題になってくると思います。紙にプリントアウトする文書が少なくなり、画面で文章を読むようになりますから、切実になります。構造化されているほうが圧倒的に利用しやすいはずです。
しかし、構造化のお話をしても、簡単には伝わりません。あれこれ話すうちに、樹状の組織図を思い浮かべる方が多いことに気がつきました。文書の構造化と言う場合、樹状の組織図を組織化と考えている方がたくさんいるようです。
もちろん、それ自体、間違ってはいないのです。問題なのは、何のための構造化なのかという点です。樹状の組織化がわかりやすいものであるなら、問題ありません。しかし、ああした枝分かれの多い構造は、わかりにくいものです。
文書を構造化する目的は、必要な項目を見つけやすくするためです。その点、枝分かれの多い構造では、必要項目が見つかりにくくて、好ましくありません。樹状構造とは違った構造を作らないといけません。これが「文書の構造化」の問題です。
構造化にはもう一つの目的があります。文章を理解しやすくするための構造化です。これは領域内の構造化ということになります。画面をぱっと見て、わかりやすく記述するために必要な構造化のことです。これが「文章の構造化」にあたります。
2 文書の構造化:樹状構造の弱点
「文書の構造化」のときに、樹状構造が使われるのには、理由があります。明確な基準を立てて、枝分かれさせていくことは、明確性を確保する点で有利です。個々の項目の位置づけが明確になる点で、樹状組織には利点があります。
AとBに明確な区分がある場合、どちらかを選択することで、きれいに分割できます。この1回の分割で不十分な場合でも、さらに明確な基準を提示して二者択一を繰り返すならば、全体を合理的に細分化することができます。これはデジタル的な発想です。
厳格な区分をする場合、こうした構造化は有益だろうと思います。しかし、文書を使う人間の感性からすると、結果として出来上がった細かい区分に、煩雑な感じがすることも確かです。きれいに分けられたはずの区分でも、それが多数あると、わからなくなります。
たとえて言うと、小さな引き出しがたくさん目の前に現れて、そのどれかに入っていると言われたときの感覚に似ています。引き出しの並び方に法則性があったとしても、その法則を正確に適応させて、自分の目的物を選択できるものなのか…これが問題です。
こうした小さな引き出しを並べる形式になるのが、樹状の組織構造の弱点になっています。私たちは感覚でわからないと、急に緊張します。その緊張がわずらわしいことになります。せっかくの細分化がうまく作用しなくなることが多いのはそのためです。
3 大きな引き出しの効用
小さな引き出しがダメなら、大きな引き出しがよい、と簡単には言えません。大きな引き出しにも弱点があります。引き出しを大きくすると、引き出しの中にモノがたくさん入ることになりますから、見つけにくくなります。これが不利な点です。
一方、大きな引き出しのいいところは、この引き出しの中にあるかないかの判断がしやすくなるという点です。この中に必要なモノがあると思えるなら、その中を探す気になります。該当領域が設定されることによって、無制限のモノ探しから解放されます。
弱点を克服し利点を生かすために、大きな引き出しを作るとき、何を気をつけたらよいのでしょうか。第一に、該当のモノが、この中にあるとわかる引き出しを作る…ということです。誰にでもわかる大きな概念を利用して、項目をまとめます。
もう一つ、なすべきことがあります。引き出しの中に入れるもの粒の大きさをある程度そろえることです。一項目の情報量の上限を決めてしまうのです。情報量の上限を決めることによって、情報量の推測が可能になります。これで粒がそろうことになります。
大きな概念の引き出しの中に、必要項目が入っていると思えるなら、探す気になります。この点、小さな引き出しに較べると有利です。ここかな…と思って、小さな引き出しを何度も出し入れするうちに、探す気が失せてしまいます。
私たちは、同一項目の一覧から、必要項目を見つけるのが得意です。群衆の中から知人をすぐに見つだすように、一覧項目があれば、そこから自分の目的項目は、わりあい簡単に見つかります。これが「文書」の構造化の際に考えるべきポイントになります。