2003年 3月 1日 | データ 値と サブセット | >> 目次 (テーマ ごと) |
● QUESTION | データ の値を判断規準にして サブセット を生成しては駄目か。 | |
▼ ANSWER | だめ。 コード の値を判断するのは アルゴリズム である。 | |
2008年 3月16日 補遺 |
たとえば、以下の品目 entity を例とする。 {品目番号、品目名称}[ R ]
前提: おそらく、以下のような サブセット を生成したとする。
品目 一見、「わかりやすい」 構造であるが──「論理和」 を充足しているので、ひょっとしたら、「クラス」 の観点からは、こういう構造を生成するかもしれないが──、T字形 ER手法では、絶対に認められない構造である。
なぜなら、T字形 ER手法では、かならず、サブセット を生成する判断規準を記述しなければならない。
この例では、モノ の認知番号 (identifier) は 「品目番号」 である。
とすれば、モノ の認知番号のなかで、コード に対して意味が附与してあっても、コード は形式的には全体として 1つの コード であって、コード の値を判断するのは アルゴリズム である。
構造は値には関与しない (!) T字形 ER手法の目的の 1つは、(DOA が 「データ の独自性」 を主張する割には、データ と アルゴリズム の境界線が曖昧にされてきていたので) 「データ と アルゴリズム の境界線を明晰に判断して、データ 構造を明晰に記述する」 という点にある。コード 体系のなかに実存しない コード を恣意的に使うことを禁止して、サブセット を生成する判断規準を用意した点を再考してほしい。 |
[ 補遺 ] (2008年 3月16日)
モデル は、以下の 2つから構成されます。
(1) 妥当な構造 (形式的構造) (1) が構文論の領域であり、(2) が意味論の領域です。 TM (T字形 ER手法) も、この 2つを切り離していて、(1) のなかで使われる 「認知番号」 は、形式的体系では、あくまで、「個体指示子」 として扱います。「認知番号」 に対して、どのような値が代入されるか という点は、「アトリビュート・リスト」 で記述します。 したがって、モデル (データ 構造) を記述するには、TMD (TM Diagram、T字形 ER図) と 「アトリビュート・リスト」 は 「両輪 (相互補完の関係)」 なのですが、「アトリビュート・リスト」 を軽視するひとが、TMD のなかに、「値」 を記述したり、注意書きを記入したりしていて、本 エッセー で示した例のような思い違いが起こるのでしょう。 ちなみに、「社内消費」 品かどうか という点は、「性質 (機能)」 あるいは 「関係 (用途)」 で示されるべき事態でしょうね。 |
<< もどる | HOME | すすむ >> | |
データ解析に関するFAQ |