2013年に読まれた記事トップ10

流行っているみたいなので、自分のところでも見てみました。Jetpack のサイト統計情報の1年分です。

2012-12-31 to 今日

  1. gdm でのシャットダウンの禁止 (2007年10月)
  2. GNOME でのシャットダウンの禁止—最近の流儀 (2011年6月)
  3. 2台所有する自動車の1台を手放すとき、保険は等級の高いほうを残すことができる (2013年2月)
  4. WordPress 3.6 日本語版 (2013年8月)
  5. WordPress: フィルターより前にショートコードを実行させる (2013年3月)
  6. wp-login.php への攻撃に対処する (2013年9月)
  7. 公開 Jabber/XMPP サーバー (2011年7月)
  8. 日本語スタイルガイド項目別比較一覧表 (2012年3月)
  9. ja.po のコメント欄に見る WordPress 日本語版の歴史 (2013年5月)
  10. Jabber と WordPress (前編) (2010年11月)
  11. Firefox に新しいプロトコルを教える (2012年2月)

1位の記事はとても古くて、そこから誘導している改訂版みたいな内容が2位なので、これらは実質同じもの。この情報は公式に近いところに見られないのでこちらに来ているのでしょうか。こういうちょっとした設定をしたいのにとてもわかりにくい GNOME の傾向はなんとか変わってくれないものかと思います。

3位の自動車保険の話も、意外と他所では見つけにくい情報なのでしょう。

4位の WordPress 日本語版リリースリーダーの話は、twitter や facebook で広めてもらった(自分の記事としては)ようです。

5位は、いまこのリストを見て自分でも意外でした。これも他所にはあまりない情報なのかなあ。

7位と10位は古い記事ですが、Jabber/XMPP の情報は日本語ではとても少ないので、ここにたどり着くのでしょう。公開サーバー STEP.im をよろしくお願いします。

9位は、WordPress 10周年に寄せて書いたものです。

1位と2位が実質ひとつなので、11位まで掲載しました。

このブログを継続的に見ている人はたぶんほとんどなく、検索でその記事だけ単発にたどり着くのが大部分だと思っています。あたりまえのことですが、他所にない情報がよく見られているということですね。来年もそんな記事をいくつか書ければと思います。

テーマ Tewnty Fourteen の日本語化(非公式)

WordPress のバージョンが 3.7 になりました。インストールしてみたところ、次期デフォルトテーマの Twenty Fourteen が含まれていました。ただしバージョンは 0.1 なので、まだ完成形ではないのでしょう。

(追記)すみません。RCまでは含まれていたのですが、正式な3.7には含まれなくなっていました。重ねてインストールしていたので混乱していました。まあ、いいや。そのうちどこかで役立ててください。(追記終わり)

翻訳の作業は、公式には GlotPress で行われるのですが、バージョンが若すぎて、まだここに登場していません。当然、日本語パッケージにも翻訳は含まれていません。

そこで非公式の日本語リソースを個人的に作成しましたので、公開します。

中身は twentyfourteen-ja.po と twentyfourteen-ja.mo だけです。適当な場所 (wp-content/languages/themes/ の下とか)に 置いてください。

大部分は Twenty Thirteen のリソースを取り込み、それから変更されたり追加された分を訳しました。自分でもまだちゃんと使っていないので、どこに表示されるものかも確認しないままやったものもあり、おかしなところがあるかもしれません。

とにかくまだ Twenty Fourteen 自体が発展途上で固まっていないこと、今回公開するものは WordPress 3.7 パッケージに含まれる 0.1 に対応するものであること、元の文もどんどん変更されるかもしれませんし、あくまで非公式な作業なので訳語も変わりうること、やっつけでやったのでまだおかしな訳があるかもしれないこと(“Featured Content” の訳語ってどうしましょうね)、などをご了承の上、ご自由にお使いください。

ja.po のコメント欄に見る WordPress 日本語版の歴史

WordPress 生誕10周年だそうです。WWW が生誕20周年らしい(諸説ありますが)ので、その歴史の半分くらいのところで WordPress がもうあったんですね。

さて、東京の WordPress 10周年イベントで、Nao さんが WordPress 日本語版の歴史的なお話をされるとのことで、日本語チームの一人である私にもコメントを求められました。記憶とたぐってお返事したのですが、そのあとちょっと調べてみたら意外と面白かったので、ここに書いてみます。

WordPress 日本語版

私が WordPress を使い始めたのは 2006年の初めでした。それは日本語化されたもので WordPress ME と呼ばれていました。配布サイトがあってフォーラムがあって、日本語での WordPress 情報が集まっていました。

一方、その頃にはもうひとつの日本語版が存在していました。2005年頭には WordPress 1.5 の日本語リソースが出されています。

WordPress ME は 2008年に開発が終了してサイトは閉じられ、いまでは記録が残っていないのでここでは詳しく書けません。その後は、そのもう一方の日本語版が現在の WordPress 日本語版につながっていきます。

私が翻訳チームに加わるまで

日本語リソースは 1.5 以降、svn.automattic.com/wordpress-i18n/ja/tags/ にあります。

このリポジトリは最初、tai さんがたぶんひとりで、WordPress の開発元 automattic に交渉して開設されたのだと思います。まだ私が関わる前なので詳しいことは知りません。

さて、そのなかの ja.po のコメントにその歴史が見えます。ここで一番古い 1.5 の ja.po のコメントでは tai さんひとりのクレジットで、作成日は 2005年3月4日です。2005年末の、次のバージョン 2.0 の ja.po では tai さんのほかに 2人の協力者のお名前が見えます。

2006年7月の 2.0.3 の ja.po のコメントには

#  誤字脱字誤訳、あるいはよりよい訳などありましたら以下までぜひお知らせください。
#  また、翻訳、校正、コミットをお手伝いしていただける方も随時募集中です。
#  連絡先: ....(個人のメールアドレス)

という文言が見えます。「連絡先」は個人のメールアドレスだったのが、2.1.1 の ja.po から翻訳チームのメールアドレスになっています。徐々に態勢が整えられていったようです。

はじめ WordPress ME を使っていた私は、いくつか日本語訳のおかしな所に気づいたのですが、開発者の連絡先というか、どのように要望を伝えればいいのかが(フォーラムなど充実していたにも関わらず)とてもわかりにくかったと記憶しています。またこの頃にこのもう一方の日本語版の存在に気づいて試してみていましたが、こちらにもやはり日本語訳の気になるところがありました。そこで日本語リソースを見てみて、上記の案内を見つけました。どうやらこちらの日本語版のほうが「風通し」がよさそうなので、連絡してみることにしました。ところが、翻訳チームのメーリングリストのアーカイブも公開されていたのでそれを覗いてみたら、私の報告について「そんな細かいこと、どうでもいいじゃんね。ぷ」みたいな話になっていて、がっかりしたことを覚えています。

しばらくは自分で自分のところだけ対処していたのですが、上記の案内に「お手伝いしていただける方も随時募集中」とあるし、外から報告や提案してやきもきしているよりは気が楽かなくらいの気持ちで、今度はチームに参加したいと連絡してみました。2007年3月のことでした。2.1.3 の ja.po には私の名前 Mako が見えます[1]

日本語作成チーム

ここからは手元にいくらか記録も残っていますので、少し詳しく書くことができるでしょう。

その頃は、ja.po のほかにも翻訳文を直接埋め込まなければならないファイルがいくつもあって、svn を使って各人がリポジトリにアクセスし、メーリングリストで「私がこのファイルの翻訳を担当します」と宣言して作業し、また「校正おねがいします」とあると別の人がチェックする、というような態勢でした。

私は、どうにも気になる質のようで、用字用語や点丸括弧ばかりチェックしていました。ひらがなで書くのか漢字なのか、括弧やコロンは全角なのか半角なのか、全角と半角のあいだにスペースは入れるのか……。調べているうちに「日本語スタイルガイド」のひな型を見つけたので自分のブログにそのことを書きました。このひな型を元に、翻訳チームの日本語スタイルを決めていくことになりました。このようにして、2.2, 2.3 の日本語リソースやパッケージが作られていきました。

2007年9月ころ、チーム編成に変化がありました。このころまで、アナウンスや広範な議論は(現在では存在しない)WordPress Japan のフォーラムで行われていました。その記録は残っていないので記憶に頼りますが、開設の経緯からこれまでリポジトリにコミットできたのは tai さん一人のみだったのを、このあとチーム体制にしていきたい、というような議論がたしかそのフォーラムでありました。そこで現在も活躍している有名な方々も加わり、ほぼ現在と同じチームができました。チームの連絡も現在の Google グループに移りました。こうして現在も続く、リリースごとに担当者を決めていく体制ができていきました。

2.3.1 の ja.po までは冒頭のコメントに翻訳チームとして個人の名前が列挙されていましたが、2.3.2 の ja.po からは「WordPress 日本語版作成チーム」と、すっきりした表記になりました。

WordPress.org のローカルサイト ja.WordPress.org が立ち上がったのもこのころだったかと思います。WordPress 2.3 リリースのアナウンスはこちらで行われています。その後フォーラムも立ち上がり、もうひとつの日本語版である WordPress ME に代わってこちらのほうが普及していくことになります。そして 2008年3月、WordPress ME は配布を停止してサイトは閉じられました

作業環境の変化

WordPress は世界的にも普及し、本家のほうでも国際化の環境の整備が進みました。翻訳に関わる議論は以前はメーリングリストでしたが、現在は WordPress Polyglots というサイトで行われています。私が日本語版リリースの担当だった 3.0 のころ、GlotPress という仕組みが導入されました。これまで svn リポジトリを中心とした翻訳作業が、ウェブ・インターフェースの作業になりました。これで、限られた人しか関われなかった作業が、誰でも、たった一行だけでも気軽に参加できるものになりました。2010年のことです。

gettext (ja.po など)でカバーできず、翻訳文を直接埋め込まなければならないファイルは減り続け、ほとんどの翻訳は GlotPress でできるようになりました。2013年5月現在、直接翻訳するのは wp-config-sample.php のコメント文と readme.html だけです。

ja.po のコメントを見てきましたが、2012年の 3.4 の ja.po からは、とうとう日本語作成チームの案内も消えました。GlotPress の出力をそのまま利用するようになったからです。

これから

今年また日本語版リリースを担当しています。もうすぐ出るであろう 3.6 です。

私が日本語版に関わるようになってから6年になります。英語が得意なわけでもないので、もっぱら日本語に力点を置いて、それに翻訳そのものより周辺のこと(スタイルのこととか作業手順のこととか)を微力ながらやってきました。これからチームに参加される方のためにも、もう少しきちんと形にして残したいと思っているところです。

  1. 私の名前の横にある URL は当時のものです。その後これを手放して、現存するこの URL で見えるものはまったく別の人です。

Automattic製テーマ Coraline と Pilcrow の日本語化

Automattic は言わずと知れた WordPress の開発元、そしてブログサービス WordPress.com の運営元です。WordPress 公式テーマディレクトリで、その Automattic 製のテーマが公開されています。

Coraline は、TwentyTen の双子のようなテーマで、むしろこちらのほうが柔軟性があると私は勝手に思っています。Pilcrow は2012年になって登場し、Coraline の後継じゃないかとこれまた勝手に思っていますが、配布版 WordPress のデフォルトとなってもおかしくないと思える作りのテーマです。

たぶん WordPress.com のサービスでは、これらのテーマが様々な言語に対応して提供されているのでしょうが、この公式ディレクトリで配布されているものには言語リソースが(日本語に限らずどの言語のものも)同梱されていません。

「非公式」日本語リソース

そこでこの Coraline と Pilcrow の日本語リソースを作成したので公開します。と言っても、デフォルトのテーマ TwentyEleven とほとんど同じメッセージですのでそれを取り込んで、独自に訳す必要があったのはほんの数個です。

中身はそれぞれの ja.po と ja.mo だけです。テーマをインストールしたディレクトリの languages/ 以下に ja.mo を置いてください。

「公式」日本語リソース

Twitter でひょんなことからこの Automattic 製テーマの日本語リソースの話になったところ、Nao さんから

Naoko McCracken
@mako0901 @urepko こちらもよかったらどうぞー。http://t.co/SqfNQ51P WP.com アカウントでログインすればページの下の方からエクスポートできますが。。。 このやり方どっかに書いたほうが良いですね。
2012年3月20日 – 22:02

というリプライがありました。「公式」リソースが、普通には気付けないこんなところに隠れていました。「このやり方」をここに書いてみます。この短縮されているけれど本当は長い URL には、次のようにしてたどりつけます。

まず、http://translate.wordpress.com/にアクセスします。Projects の WordPress.com に進みます。さらに日本語の Japanese に進みます。ここで、右上の Log in で、WordPress.com のアカウントを使ってログインしておきます。

左端にある Filter↓ をクリックします。Term: に、絞り込みたい語を入力します。ここでは、coraline と入力します。その右側の選択肢は、Either と Current/waiting/fuzzy のままでかまいません。そして「Filter」ボタンをクリックすると、テーマ coraline に関するメッセージだけが抽出されます。

画面の一番下に行き、only matching the filter を po として、Export すれば、目的のものが手に入ります。テーマ pilcrow のものだったら、検索語を pilcrow にするだけです。

これで po が手に入りますので、ja.mo に変換して、適切な場所に配置します。


【追記】 Nao さんのところに、より詳しい解説が出ました。「GlotPress から WordPress.com の無料テーマの翻訳をエクスポートする

日本語スタイルガイド項目別比較一覧表

JTF日本語標準スタイルガイド」というのを見つけました。

2012年1月30日1.0版です。簡潔にまとめられていてわかりやすいです。迷うようなところは両論併記であとは使う方に任せるとなっているところもあるため、これだけで、というよりこれをベースにしてローカルルールを補うというものになるのかもしれません。「商業目的を含む翻訳作業時の日本語表記ガイドラインとして自由に配布、複製、使用できます。」と明記されているので安心です。

基本ルールの 原則として記号類は全角で表記する。 を「半角」とすればそれだけで、いま私が関わっている翻訳作業のルールにほぼ合致しそうです。ただし具体例があまり多くないので、その点は以前に見つけた日本語スタイルガイド」(PDF)のほうが参考になります。

さて、そのあとも検索を続けていたら、このJTF日本語標準スタイルガイド作成する過程にまとめられたと思われる、「日本語スタイルガイド項目別比較一覧表」を見つけました。これはすごい。とても個人でできる作業ではありません。標準ガイドの付録としてでも公表しないのはもったいないくらいに思います。ぜひ参考にしたいと思います。

カタカナ表記について—マイクロソフト スタイルガイド

参考資料として。マイクロソフトスタイルガイド

手軽に参照しにくいので、ここに要点のみをメモ。

次の場合の「か」はひらがな書きとする。カタカナは使わない。
例:「3 か月」 (「3 ケ月」「3 ヶ月」「3 カ月」「3 ヵ月」としない)
次の場合の「こ」は漢字とする。カタカナは使わない。
例:「5個」 (「5 ケ」「5 コ」としない)

長音符号

まず規準は、平成3年6月28日 内閣告示第2号「外来語の表記」
英語の末尾が -er, -or, -ar のとき、長音符号を付ける
英語の末尾が上記以外(すなわち、-y も)の場合、
カタカナが4字より短い場合(促音「ッ」は1と数える。拗音は数えない)、長音符号を付ける
  • 例:「キー」「メニュー」は付ける。「メモリ」「プロシージャ」は付けない
  • 英語が接頭語+語幹の場合、語幹で考える。例:「プレ+ビュー」「サブ+ツリー」「インター+フェイス」
  • 上記の例外は一覧表を参照

どうしよう日本語入力システム (その2)

昔の話をするようになったら歳をとった証拠だ。が、いきがかり上、しばらく昔の話を書いてみよう。

日本語入力システム自分史

UNIX 期

Wnn を使い始めたのは学生だった 1991年頃だ。その前には NEC の PC98 で少しのあいだ ATOK を使っていた。確か「一太郎 Ver.3」だったから、いま調べてみると ATOK6 か ATOK7 だったことになる。

そこに Sun SPARCstation 2 というワークステーションが研究室にやってきて、X Window system で日本語を入力するのに Wnn を使い始めた。確か X11R4 や R5 だったので、これもいま調べてみると、それらに標準添付されていた Wnn 4.1 や Wnn 4.2 を使っていたことになる。その頃にあった別の日本語入力システムの Canna や Sj3 は使ったというより試してみた程度だった。

その後使った HP のワークステーションの HP-UX に VJE だか ATOK だかが付属していたと思うが、このワークステーションはほとんどリモートで使っていたので、日本語入力システムに触れることは滅多になかった (もう当時のバージョンがいくつだかも忘れてしまった)。

Wnn 4.2 の頃はいろいろと情報が出回っていて、辞書を追加したりパラメータを調整することで、標準の状態よりかなり変換精度を上げることができた。

世間で Windows 3.1 や Windows 95 が大流行している頃、私は Sun SPARCclassic を独占してデスクトップで使えるという環境にあったため、その時期を Windows と無縁で過ごした。その後ノート型を含め、いわゆる PC/AT 互換機も使うようになった頃には既に Linux が入手できたため、そこでも Windows を使わずにすんだ。そんな職場を離れたあとも今日に至るまで、トータルで 20 年以上もコンピュータを毎日使っていながら Windows も Mac も常用したことがないという、たぶんかなり珍しい部類の人となった。

Linux-Wnn 期

1997 年、Wnn 6 for Linux/BSD が発売されるとすぐに購入した。UNIX 版はその前に出ていたが普通に買える価格ではなかったし、その頃には Sun SPARCclassic は既にサーバーとして裏にまわり、Debian をインストールした PC をデスクトップで使っていた。

Wnn 6 は、それまでのバージョンがフリーソフトだったのに対し、商用ソフトであった。「Wnnについての基礎知識」のページの中ほど、「*Wnn6 で強化された機能とは」の項にあるように、20万語のシステム辞書、「フレキシブル・インテリジェンス(Flexible Intelligence)機能」により、変換精度は格段によくなった。

2001年、Wnn 7 for Linux/BSD が発売になり、これもすぐに購入した。

ATOK 期

2005年に Wnn 8 が発売になった際には、Wnn 7 で十分満足していたので購入を見送った。UTF-8 への対応というのが大きな変化だったが、その頃はまだ EUC-JP で使い続けていたので、その必要性も感じなかったのだ。その後 2009年に、別の会社から、その時点の ubuntu に対応したという Wnn8 for ubuntu というものが発売されたが、ほぼ1年で販売を止めてしまったようだ。

これらを購入しなかったことを後悔する時がやってきた。2010年頃には、(1) OS のライブラリが新しくなり、依存関係を改変しないとインストールもできなくなってきた。いつか本当に起動しなくなるかもしれない。(2) 最近は UTF-8 でしか動かないアプリケーションがいくつか出てきたが、Wnn 7 (xwnmo) は locale を EUC-JP にしなければならないため、日本語を入力できない。(3) 開発元の情報を見ても、この先、新しいバージョンが出る気配がない。という状況になってしまった。

OSS の Anthy を試してみたものの、あまりの使い勝手の悪さに 1週間ほどで嫌になってしまった。

そこで思い切って ATOK X3 を購入することにした。ATOK X3 は 2007年の製品で、既に時代遅れぎみだが、こちらも次がいつ出るのか(そもそも次はあるのか)見えないので、思い切ることにした。

ATOK X3 が悪いとは言わないが、何しろこちらが Wnn に慣れきっているため、不満に思ってしまう点はいくつかあった。

変換精度が思ったほど高くないと感じるのは、長いあいだ学習させてきた Wnn7 と比較しているからだろうか。それを割り引いても 2001年の製品である Wnn7 のほうが「賢い」ように感じられた。

それに、異体字(いわゆる旧字)を簡単に出せない。Windows 用の新しい ATOK には異体字変換があるようだが、Linux 版 の ATOK X3 にはその機能がない。Wnn7 には標準で「異形字変換辞書」を持っており、いったん仮名から漢字に変換したあと(たとえば「けいざい」→「経済」)、漢字から異形字(「経」→「經」、「済」→「濟」)に変換する、単漢字変換の一種ともいえる機能があった。とりあえず「正字正假名辭書」を追加してしのぐことにしたが、これは単語レベルの辞書なので、登録されていない単語(人名など)で旧字を出したいときにはやはり苦労する。

発売直後から指摘されている不具合が未だ放置されているなど、開発元のやる気のなさも心配だったのだが、前の記事にも書いたように、たった1年ほどで終わりの時が近づいてきたようだ。


結局、20年ほどの日本語入力システム自分史を振り返ってみると、最近1年の ATOK X3 を除いて、なんと19年が Wnn (そのうち10年ほどが Wnn7) というものであった。

この項さらに続く(たぶん)。