利用者:MihailJP/ソート順に関するメモ
記事名のソート順に関するメモ
編集注意:このページには私論が含まれています。
基本
編集基本的にUnicode順なのだが、特殊なソート順が必要な言語もある。
- 基本的には{{DEFAULTSORT:アクセントなし アクセントあり}}で全部小文字で入れることになっているらしい。
困るのは、通常文字と特殊文字を別の文字として、しかもその順番がUnicode順になっていないような場合。
ラテン文字
編集- エスペラントでは、現在一般的な並べ方ではĉĝĥĵŝŭはそれぞれcghjsuのあとに来ることになっているのだが、ガイドラインに従うとstela→ŝteli→steloの順になる。ただ、これはUniversala Vortaro (Fundamento de Esperantoの中にある)で使われていた方法なので問題なかろう。
- スペイン語の場合はñの扱いが困る。
- チェコ語ではchがhのあとに来ることになっているのだが技術的に無理。
- タガログ語のアバカダはどうしよう…(KがCの位置に来る)
キリル文字
編集- ガイドラインどおりやって特に問題なく並ぶのはロシア語とブルガリア語ぐらい。(Unicodeの)歴史的な事情でそれ以外の言語はうまくいかない。
アラビア文字
編集- ガイドラインどおりでうまくいくのはアラビア語のみ。ペルシア語ですらうまく並びません。
- ペルシア語とアラビア語ではهとوの順番が逆。
- シンド語ではペルシア語やウルドゥー語と違ってپはثのあとに来る(ペルシア語ではبのあとに来る)。
デーヴァナーガリー
編集- ガイドラインどおりで基本的に大丈夫ですが、サンスクリットだけ一部正しくソートされません(が、めったに使われない文字なので大した問題にはならないでしょう)。
- 下に点の付いた文字は点のない文字に変えましょう。(たとえばड़はडと同一視することになっている)
アッサム文字
編集グルムキー文字
編集タミル文字
編集タイ文字
編集- 文字列がほかのインド系文字と違って視覚順なのでเなどで問題を生じます。
ラオ文字
編集- タイ文字と同様の問題があります。
チベット文字
編集- チベット語の辞書は基字を基準に並ぶので前置字や有冠字などで工夫が必要です。
ハングル
編集- 何もしなくても正しくソート・表示されるような仕様になっています(ただし大韓民国の辞書順)。
結論(には全然なっていない)
編集- MediaWikiにカテゴリページごとに並べ替えのロケールを設定できる機能が欲しいところです。