第1回 PDFってなに?
はじめに
これから10回に分けてPDFの仕組みと活用方法をできるだけわかりやすく解説していきたいと思います。普段何気なく見たり作ったりしているPDFですが、その仕組みをすこしだけ深堀すると、PDFの活用の幅がグンと広がります。仕事はもちろんプライベートや様々なシーンでPDFを上手に活用してみはいかがでしょうか。
ということで、第1回は「PDFとはどういうデータなのか」というお話をしてみたいと思います。
PDFとは何か
皆さんはプリンターを使ったことがありますか。最近のノートPCは昔と比べて軽く小さく高画質になってきていますし、スマホやタブレットが普及して、画面だけ見て事が終わることも多くなってきています。パソコンからプリンターを使って紙に印刷することも最近は少なくなってきているかもしれませんね。
ところで、パソコンからプリンターへ送られるデータってどういうものか、考えたことがありますか?
プリンターで印刷する場合、まずパソコンから印刷のための情報がプリンターに送信されます。そのデータをプリンターが解釈して印刷のためのイメージを作ります。そして、インクやトナーをコントロールしてイメージを紙に転写します。今では写真や商業印刷と変わらないような品質の印刷物をだれでも手軽に手に入れることができるようになりました。
これからお話するPDFファイルは、実はこのプリンターへ送る印刷のためのデータをどうするかってところから始まった技術です。
今ではPDFは世界中の商業用印刷物の元データの世界標準規格として欠かせないものになっています。PDFは印刷物を完全に電子化するための技術といってよいでしょう。
「印刷物の完全電子化を実現させたPDF」なんていわれると、なかなか手ごわそうですね。でも大丈夫。小手調べに、まずその素性を知ることから始めてみたいと思います。
ページの情報を持ったイメージファイル
PDFは冊子を再現するために、各ページの用紙サイズやページの様々な情報を持っています。JPEGのような画像ファイルには画像の大きさの情報をもっているものもありますが、特殊なものを除いてページの情報をもっているものはありません。
例えばスキャナーでスキャンした10ページ分のJPEG画像を扱うにはファイルが10個必要になりますが、PDFはひとつのファイルで10ページを扱うことができ、さらに文書としての様々な情報を持たせることができます。
PDF上の3大ビジュアル
1ページのPDF上に含まれているイメージは基本的に下記の3つに分類できます。
1:ビットマップ画像(写真のような色の点の集まりで表現するイメージ)
2:ベクトル画像(線画ともいいますが、直線・曲線で表現するイメージ)
3:フォント(文字の形を表現するイメージ)
これらを組み合わせると次のようなページのイメージが出来上がるという仕組みです。
先ほどPDFにはページの用紙サイズが指定されていると書きました。PDFは1ページごとに、左下を原点としてページのサイズが指定されています。さらに、左下を原点とした数値で指定された位置に3種類のビジュアル要素が配置されています。PDF内では画像が自在に配置され、文字や図形が重なり合い、複雑なレイアウトが表現されています。JPEGなどはそれ自体が画像ファイル(図1)でしかありませんが、PDFの中身は、それらを組み合わせたモザイク(図2)ということもできるでしょう。
PDFにできること、ツールにできること
PDFを活用する際に気を付けたい点がいくつかありますが、一番の課題は、PDFファイル自体の機能なのか、あるいはPDFを扱うツール側の機能や制限なのかといった、仕組みの使い分け、切り分けができるかどうかでしょう。
例えば、PDFファイルに動画や音声ファイルを張り付けることができますが、PDFを表示するツールで動画や音声を再生できないものがあります。「注釈」データといったPDFでよく使う機能もPDFを表示するツールによっては「注釈」データを表示できないものがあります。
本連載では、そうしたPDFファイルの機能について詳しく解説すると同時に、PDF製品でPDFを扱う際の留意点について詳しくご紹介していきます。