はじめに

last modified 08th/Nov. 2003

本稿では、 HTML で記述された文書、HTML文書について説明します。

インターネット上で提供される最も大きなサービスは、 WWW です。 WWW では、画像、音楽、動画など、多くの情報が提供されていますが、これらをリンクと云う仕組みで有機的に結び付けているのが、 HTML 文書です。

そして、この HTML 文書と画像、音声などの集合をウェブ・サイトと呼びます。俗に云う「ホームページ」は、ウェブ・サイトを指すのに使われていますが、本来は別の意味に使われるものです。ここでは、ウェブ・サイトを構成する個々の文書をウェブ・ページと呼ぶことにします。

因みに、「ウェブ・サイト」とは、「ウェブ上のコンテンツが物理的に存在しているマシンのこと」であるとする主張も有りますが、現在では英米圏における "Web sites" と云う語も、ウェブ上のコンテンツの集合を意味しますので、本稿でもそれに従います。一方、「ウェブ・ページ」は、文書に限らず、ウェブ上のリソース全てを指す場合もあります。

HTML 文書とはなんだろうか

インターネット上の文書「ウェブ・ページ」は、或る決まった法則で書かれています。その法則を規定する言葉が HTML - HyperText Markup Language です。 HTML で書かれた文書を HTML 文書(HTML Document)と呼びます。ウェブ・ページの殆ど全てが HTML 文書です。

HTML の最も単純なものを例として挙げます;

<html>
<title>初めてのHTML文書</title>
 Hello, World!
</html>

これが HTML です。テキスト・エディタと呼ばれる種類のソフトでこのように記述されたファイルは、ブラウザと呼ばれる種類のソフトでは、 "Hello, World!" と表示されます。

この例文は単純化するために、大事な部分の多くを省略しています。もう少し書き加えてみましょう;

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
        "http://www.w3.org/TR/html4/loose.dtd">
<html>
 <head>
  <title>初めてのHTML文書</title>
 </head>
 <body>
 Hello, World!
 </body>
</html>

ずいぶんと複雑になりました。一行目から見て行きましょう;

一行目、二行目は、HTMLの種類を明示しています。

HTML には複数のバージョンあります。ここでは、 HTML 4.01 と云うバージョンの Transitional と呼ばれる種類の HTML を採用しました。これは 2000 年末現在の標準です。短くとも、 2001 年一杯は標準で有り続けるでしょう。

<html>...</html>

<html>は、 HTML 要素の開始タグと呼ばれるものです。 HTML 要素は開始タグ <html> から始まって、終了タグ </html> で終わります。開始タグと終了タグの間が内容です。

<head>...</head> と <body>...</body>

HTML 要素の内容に HEAD 要素と BODY 要素が現れています。一般に、要素には内容に現れても良い要素が決められており、これを内容モデルと呼びます。 HTML 要素の内容モデルには HEAD 要素と BOYD 要素が順番に一回ずつ現れるものと定義されています。こう云うルールは、全ての HTML 文書に共通します。

<title>...</title>

HEAD 要素の内容に TITLE 要素が現れています。これらの要素の関係を親子関係と呼び、 HEAD 要素にとっては TITLE 要素は子供要素であり、 TITLE 要素にとっては、 HEAD 要素は親要素です。また、 HTML 要素にとって TITLE 要素は孫要素です。この、孫要素や子供要素などの概念を総称して子孫要素と呼びます。子供要素は子孫要素の特殊なものです。

TITLE 要素の内容モデルは、普通の文字と定義されています。この文字列が、この HTML 文書のタイトル(表題)になります。

<body>...</body>

BODY 要素は HTML 要素の子供要素です。この内容がこの HTML 文書の本文になります。

内容モデルは多くの要素が許されており、段落、表、箇条書き、画像など、多彩な文書構造を HTML で表現することが可能です。

HTML を如何にしてまなぶか

以上、見てきた通り、 HTML には幾つかの決まりが在ります。一見すると複雑なようですが、その実非常に単純で簡単なものです。 HTML を学ぶとは、次のことを確認する作業です;

HTML の種類
通常は HTML 4.01 の Transitional を利用することになるでしょう。ですから、 HTML 4.01 の定義だけを学習すれば良いことになります。
要素タイプ
内容モデル
属性

以上の四つの点を憶えることが HTML を学ぶと云うことです。全てを憶えることは大変な労力でしょうが、無駄なことです。実際に使う幾つかの要素タイプについて、内容モデルと属性を憶えれば良いと云うのが実情です。

これは非常に単純なことで、二回も週末を潰せば完璧にマスターできる程度のことです。是非、トライしてみてください。


次は、テキスト・エディタ、ブラウザ、 FTP ツールなど、ウェブ・ページ作りに必要な道具を紹介します。