====== UTF-8 エンコーディング ====== [[:ja:dokuwiki|DokuWiki]] は現在、すべてのデータを UTF-8 で保存しています。データファイルのファイル名自体については、問題を避けるため保存時に [[phpfn>urlencode|URL エンコード]]しています。リリース 2005-02-06 以前のバージョンの DokuWiki では他のエンコード方式を使用していたため、DokuWiki のバージョンアップの際にデータファイルの[[:ja:tips:utf8update|再エンコード]]が必要となります。利用するエンコード方式を UTF-8 以外へ切り替えることは、**サポートされていません**。 ===== UTF-8 用の Web ブラウザの設定 ===== すべてのモダンな Web ブラウザは UTF-8 エンコードされた Web ページを取り扱うことができます。これは、ほとんどの Web ブラウザで実際に期待通り動作する数少ない機能のひとつです。もし Web ブラウザでいくつかの文字が正しく表示されない場合は、おそらく Unicode にきちんと対応したフォントが足りないものと考えられます。 Windows ユーザはマイクロソフトによる ''Arialuni.TTF'' フォントをインストールすべきです。このフォントは Microsoft Office スイートに含まれています。 [[http://debian.org|Debian]] ユーザが Unicode フォントを正しくインストールする方法としては、私の[[notes>debianfonts|フォントに関するページ]]が参考になります。 * [[wp>Unicode and HTML|Unicode と HTML]] * [[http://tlt.its.psu.edu/suggestions/international/web/unicode.html|Unicode 用の Web ブラウザの設定]] ===== ファイルの編集 ===== {{ wiki:np2-bom.png|Notepad 2 で BOM 無しで保存}} データファイルを直接編集する意向がある場合、もしくは[[:ja:localization|翻訳]]を作成したい場合は、UTF-8 を認識できるエディタを使用する必要があります。世の中には対応したエディタがたくさんありますが、もしあなたがまだエディタを決めていないのであれば、私は以下に挙げる通り、小さく、シンプルで、無料のエディタを 2 つお勧めしたいと思います((これを Unicode 対応エディタの完全なリストにするつもりはありませんし、利用可能なベストの選択肢を示すつもりもありません。これらは単純に私が気に入ったというだけの 2 つの小さなエディタとなります。ここに他のエディタを**追加しないようにしてください**。))。 * [[http://tea.linux.kiev.ua/|TEA]] -- GTK2 ベースのエディタ (GNU/Linux 向け) * [[http://www.flos-freeware.ch/notepad2.html|Notepad2]] -- メモ帳の非常に良い置き換えソフト (Windows 向け) 注意: DokuWiki は[[wp>Byte Order Mark|バイトオーダーマーク (BOM)]] を__使用しません__ので、エディタでも絶対に BOM を付けないようにしてください (特に PHP スクリプトと設定ファイルの編集時)。 ===== バッチ処理によるファイルのエンコード ===== * Unix では、iconv (http://www.gnu.org/software/libiconv/) を使用してください。 * Windows では、recode (iconv の移植版、http://recode.progiciels-bpi.ca/archives) を使用してください。 * フランス語圏のローカルマシン上での簡単な変換例は、以下のようになります。recode lat1..u8 test.txt ここで、''lat1'' は変換前の文字コード、''u8'' は変換後の文字コード (UTF-8) となります。 * Windows 上でバッチ処理変換を行うには、サブディレクトリ内のファイルをすべて変換する以下のコードを利用してください。FOR /F "tokens=*" %%G IN ('dir/b/S/X ^"C:\yourpath\*.txt^"') DO recode -v lat1..u8 %%~sG * 更なる情報は、[[http://jeanmarcmassou.free.fr/dokuwiki/doku.php?id=blogw:batch_on_win_for_utf_conversion|このリンク]]を参照してください。 ===== 例 ===== Web ブラウザでのチェック用として、以下に UTF-8 で記述された文字の例を示します((http://www.eleves.ens.fr:8080/home/madore/misc/unitest/ からコピーしました。))。 星座記号: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓ チェス盤: ^ ^ A ^ B ^ C ^ D ^ E ^ F ^ G ^ H ^ ^ 8 | ♜ | ♞ | ♝ | ♛ | ♚ | ♝ | ♞ | ♜ | ^ 7 | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ^ 6 | | | | | | | | | ^ 5 | | | | | | | | | ^ 4 | | | | | | | | | ^ 3 | | | | | | | | | ^ 2 | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ^ 1 | ♖ | ♘ | ♗ | ♕ | ♔ | ♗ | ♘ | ♖ | ロシア語: По оживлённым берегам Громады стройные теснятся Дворцов и башен; корабли Толпой со всех концов земли К богатым пристаням стремятся; 古代ギリシア語: Αρχαίο Πνεύμα Αθάνατον! Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ. Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν, ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών. 現代ギリシア語: Η σύγχρονη Ελλάδα, έχει να παρουσιάσει δυναμικό έργο στον τομέα του πολιτισμού, των τεχνών και των γραμμάτων. Αντίστοιχα δυναμική είναι η παρουσία των Ελλήνων επιχειρηματιών στην διεθνή οικονομική και βιομηχανική σκηνή. サンスクリット語: पशुपतिरपि तान्यहानि कृच्छ्राद् अगमयदद्रिसुतासमागमोत्कः । कमपरमवशं न विप्रकुर्युर् विभुमपि तं यदमी स्पृशन्ति भावाः ॥ ヒンディー語: गूगल समाचार हिन्दी में 韓国語: 한글은 아름다운 우리글입니다. 곱고 아름답게 사용하는 것이 우리의 의무입니다. 中国語 (繁体字): 子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎? 人不知而不慍,不亦君子乎?」 有子曰:「其為人也孝弟,而好犯上者,鮮矣; 不好犯上,而好作亂者,未之有也。君子務本,本立而道生。 孝弟也者,其為仁之本與!」 日本語: 「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇 「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇 「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 ラトビア語: Iedomu jaukie ideāli, Vecākie principi, tikla, mīla - Dienas allažības priekšā Šķīst kā graudi akmeņstarpā. Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. 中国語 (簡体字): 这是简体字汉语。 zhè shì jiǎn t zì hàn yǔ アルメニア語: Հարգանքներիս հավաստիքը Հայ Ժողովրդին: Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն: ヘブライ語: המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך