XPで作成したWord2003文書をVistaのWord2007でPDF化したら部分的に文字が消える

XPで作成したWord2003文書で、結構罫表が込み入っているため、時にWord2000で開くとレイアウトが崩れたり、文字のセンタリングや両端揃えが違って表示される、という一連の文書があり、開いて一見しただけではわかりにくいため、とても気をつかっています。
気をつけて作成Ver.のWordで開くようにしているそれらのWord文書は、PDF化もしてWebへ公開しているもので、さらにPDF化の際にもまた別のレイアウト崩れがあったりしています。
下位Ver.でレイアウト崩れは仕方ないとして、ではVista+Word2007ではどうだろうと、開いてみました。
Word2007で開いた限りでは特にレイアウト崩れは見られません。
そこでPDF化。どちらも、Acrobat 8 Professionalが入っているので、双方でPDF化してみました。
箇条書きを使っている部分で一部、文字色が消えている部分がありました。消えているのは、ひらがなだったり、括弧記号だったり、漢字だったり、規則性は見えませんが、PDFのテキスト編集機能で消えている部分をコピーして、どこかにペーストしてみると、ちゃんと存在しているので、その文字が現れます。
化け部分で使われていたのはMS明朝。特に、字形変更に関わる文字を使ってはいないし、文字詰め等も使っていないので、詰めが関与しているわけでもなさそうで。

試したこと(1から順番) PDF後の結果
MS明朝で箇条書き 箇条書きマークなし、文字消えあり
1 箇条書きを解除 文字消えあり
2 箇条書きを戻してMSP明朝に変更 箇条書きマークは表示されないが、本文文字は消えない
3 MSP明朝で箇条書き解除 Wordの表示どおり
4 MSP明朝で改めて箇条書き設定 箇条書きマーク表示、本文文字は消えない(Wordの表示どおり)
5 箇条書きのまま再びMS明朝に 箇条書きマークなし、文字消えあり
6 MS明朝で箇条書き解除 箇条書きマークなし、文字消えあり
7 MSP明朝に変更 4と同じ

原因は、MS明朝のVer.が何かに影響しているらしいな、というところまではわかりました。
同じ文書内の、表組みの中で使われているMS明朝は、表示されているところと消えているところとありました。
Adobe Acrobat 8 : Office 2007対応について Adobeは検証中。Excelも似たようなことがありそうです。都度確認しながら作業です。

ちなみに、同じ文書を、XPのWord2007でPDF化した際には、文字消えはありませんでした。

Flex

Flexについて調べようと思いAdobeのサイトを見に行ったら、サイトリニューアルされていました。リニューアルに気をとられて、本日のFlex調べは全然進みませんでした。
以前はこんなかんじでしたが、ここも近日リニューアルされるんでしょうね。
Yahoo!(次期)同様、Adobeも横長レイアウト採用。トップのFlashが大きくてびっくりしました。

とりあえず、リンク。

富士通のJIS2004対応

ログに富士通さんのアクセスが沢山(ここの割合からすると)入っていたので、何があったかと検索してみたら、

「Interstage 帳票ソリューション」を構成するなかの文字管理を扱うソフトウェア「Interstage Charset Manager」のV9で、Vista採用のJIS2004対応をした

ということだそうです。
ITproさんのニュースにも出ていました(メルマガも来てました)。
以前の日記パソコンメーカーのVista導入・JIS2004対応で既にリンク済みだったので、このせいかな?。

どう対応したのかを、あらためて富士通HPの記事で眺めたところ

  1. JIS2004の追加文字で4バイト(サロゲートペア)がシステムに流れないようにブロックする(色々、プログラムやアプリケーションに影響があるので)
  2. 従来の代替文字に置き換えてシステムへ送る

という、JIS2004の防波堤の役割が大きいと読み取れました。使われるのは仕方がないから受取るほうでの制御でした。
JIS2004対応ではなくて、JIS2004非対応のようにも思えたので(すみません)、たぶん以前はリンクだけでスルー。
でも、ITproのニュースを読むと、4バイト文字だけではなく、字形変化があった文字については、通常はJIS2004字形で表示して、ただしJIS90字形を使いたい場合は(Ajaxコンポーネントで)、ブラウザ表示する際に画像ファイル等で置き換えて・・・とあるので、JIS2004の目的を否定しているわけではないんですね。(まぁ、JIS2004サロゲートペア問題を半分迷惑と思っている関係者や団体は少なくないでしょうし、それも商売になるし)

一般ユーザーが既に疑問ももたずJIS2004を使うのを止(と)めることはできないし、JIS90の字形を使っている固有名詞もあるし、文字コード的にもあるものを根絶することはできませんから、こういう<文字管理>は過渡期として必要で、また、字形変更にそれほど意味がないシステムであれば、JIS2004部分を切り落としたままある程度の年月を動かし続けることになるんだろうなと思います。

そんなこと言ってるうちに、2バイトで十分な欧米アルファベット系の方たちも考え直して(?)UTF-16でなく、UTF-32で扱える文字数も増やして、全部4バイトでさすがにコードもかぶらない、という風に流れていくこともありえなくはないですし?。

余談です。富士通さんのHPのトップから上記の記事までリンクで行こうと思ったら、なっかなか行けませんでした。検索エンジンや、富士通サイト内検索で出たページが、最終結果(出たページ)のパンくずを参考にリンクで飛んでもなかなか出てこないのは、意図的でしょうか…。(私がしっかりページを見ていないだけ?)

モリサワ主催クロスメディアパブリッシングセミナー

参加賞

…に参加しました。
モリサワ主催でしたが、実際の開催名は「Adobe Creative Suite 3 + Mac OS X Leopard クロスメディアパブリッシングセミナー」。内容は下記。

  • MORISAWA PASSPORTの説明
  • Adobe-Japan1-6のMacフォント、Pr6N=JIS2004、Pr6=JIS90 フォント名と見分け方概要
  • AppleによるLeopardプレゼン。多々ある新機能のうち、メイン4つ+アルファについて
    1. Time Machine -- バックアップ機能について
    2. Boot Camp -- Boot CampとParallelで、WindowsをそのままMac上で動かせる件の実演
    3. Spaces -- 仮想マルチモニタ。つまりはデスクトップを複数用意して切り替えて使えます、について
    4. New Fonts -- Leopardは、従来のJIS90フォントと、JIS2004フォントヒラギノ6種類やモリサワが上記で出したNつき名称の両方を持てるから、(例えばAdobeのアプリの)書体パレットで簡単に字形が変えられます、Vistaでは同じフォント名での上書きになるので置換えが起こって大問題ですが、Macは両方を同時に使い分けられます、という説明(そういう片付け方で済んでしまった)
    5. LeopardVista(もしくはXP)のマシンを別々に買うより、馬力あるMacProで、VistaもしくはXPをもインストールして、切り替えながら使う方が購入費用的にお徳、というおすすめ
  • Adobeによる、CS3の各アプリを縦横に貫いて、素材とワークフローを共通化したコンテンツ制作環境をつくること(デザイナーから開発へ向かう作業工程の可能な限りの内製化)をめざしているというプレゼン。共通素材のデータ互換について実例で説明。
    1. IDDw
      IDのスタイルをDwのCSSへexport利用や、スマートオブジェクト機能でPsにAiのデータを内包させたり。
      (WordとExcelみたいなノリにますますなってきましたか)
    2. Ai and/or PsFl レイヤーごと互換の展開
    3. Ai and/or PsFwMXMLFx 展開
      ここに来るまで、Fwの名前も出てこなかったので、AdobeはFwを淘汰するのか?と思いましたが、モバイルコンテンツ側に機能をくっつけたのか、という感じでした(間違っているかもしれないが)
    4. Fl or Fx → swf 展開
    5. まとめれば、Native DataとWorkflowの効率、がキーワードと。

私は現在CS3はWinのみで使っているので、Macの画面でのCS3は懐かしいような新鮮さでした。DTP畑をターゲットにしたのか、Web畑をターゲットにしたのか、クロスメディアパブリッシング、というセミナータイトルの中で、モリサワの立ち位置がいまいちピンと来ない感じはありましたが…AppleAdobeのプレゼンとして、セミナーとして訴えたい内容は、よく伝わりました。ので、レポがてら、ノートの自分の字が読めるうちに、ここに転記しておきます。Appleの方、話も進行もとても流暢でした。

モリサワに勝手に期待していた、フォントメーカーとしてのJIS2004の印刷標準字体変更等の運用アドバイスとかリーダー意見というのはあえて言わないかというくらいに出てきませんでしたけども。

AdobeCS3関連の略称
ID = Indesign
Dw = Dreamweaver
Ai = Illustrator
Ps = Photoshop
Fw = Fireworks
Fl = Flash
Fx = Flex
swf = Flash Movieの拡張子(形式)

写真は、本日の参加賞(?)モリサワ缶のサクマドロップと、CS3柄ルービックキューブ(とその箱)、モリサワAdobeのパンフ類です。キューブの6面揃えられるのはちょい自慢。

[rakuten:dtc:10007150:image:small] [rakuten:dtc:10007150:title]
[rakuten:shop-satt:10000163:image:small] [rakuten:shop-satt:10000163:title]

Office 2008 for mac 2008/1/16発売

mactopiaニュースレターより
詳細はこちら
mactopiaではなくmicrosoftの方でのプレスリリースはこちら。内容はほぼ同じ。

上記のサイトより、Macpeople等のほうがもろもろ詳しく載ってました。

モリサワニュースより

本日のメールニュースによれば、

Windows VistaTrueTypeフォント正規版 2007/11/30(金)発売

和文書体 メイリオ書体準拠 7書体】
リュウミン L-KL/R-KL/M-KL、新ゴ L/M/B、ゴシックMB101 R

だそうです。詳しくはこちら
Vistaのみにインストール可能。
さらに、

OpenTypeフォント(AdobeJapan1-5)改訂プログラムに関するご案内お知らせPDF

OpenTypeフォントAdobe-Japan1-5(Pr5)仕様フォント内部の文字置換えテーブル(GSUB)改訂に関する注意事項の配布で、OpenTypeも全28書体で字形変更できてしまうわけですね。
使われているフォントの見分け方は、作成日かバージョンで、とおっしゃる。

フォント置換えが、どこでどう混ざってくるかわかったもんじゃありません。

WindowsMacクロスプラットフォームや、XPとVista双方で作業をしなければならないようなIndesign組版Illustratorにはさらに注意が必要に。Office文書も同様。

実際は、TrueTypeの残りの中ゴシック・見出ゴMB31・見出ミンMA31・新ゴR/H/U、太ミン、じゅん等が出揃ったら…本当に確認が必要な日々がやってくるのだろうと思いますが、OpenTypeからの広がりのほうが早いかもしれず。

モリサワフォントの中だけでも、字によってメイリオ準拠7書体とそれ以外のフォント、改訂OpenTypeにしたかしていないかで字形が違うわけで・・・業界の方々、お互い、メイリオや、上記の新しいフォントを使った時、Vista環境での作業が入る時は、その旨の「ほうれんそう」を心がけていきましょう(ため息)。

はてなスターをいただいた(ありがとうございます)11/11にもリンクを追記してあります。

12/06モリサワ主催のセミナーの話を書いています。

文字の符号化

一定の順序で並べた文字に、一定のしくみで番号を与えて、コンピュータで扱えるデジタルのデータにする(=符号)こと。

JIS漢字コードはそのひとつ。
日本語の図形文字で、画数や部首で一覧の表にされた漢字の一つ一つに規則性のある固有のコードをつけて規格とし、その番号でコンピュータに扱えるようにしたもの。
JISについては別項も参照。

句読点、記号・符号活用辞典。 「句読点、記号・符号活用辞典」
下記とは違う意味の「符号」ですが、眼から鱗。
テキストファイルとは何か?―知らぬでは済まぬ電脳社会の常識 「テキストファイルとは何か」
第4章が非常に参考になりました。*1
図解雑学 文字コード (図解雑学シリーズ) 「図解雑学 文字コード
まさに図解。雑学を超えて理解できます。*2

符号

=コード、code

符号化

エンコード、encode
(何らかの)番号つけをした(する)ことを、エンコード

*1:さらにこの切り口で、JIS2004について、続きを書いてください。

*2:きっとこちらも、その後情報を知りたい読者が多いはず。その前に、ナツメ社さん、品切れ状態解消しないのでしょうか。