カテゴリ・トーク:カテゴリ

最新のコメント:17 年前 | トピック:カテゴリソートキー | 投稿者:っ

see Category:意見募集中

カテゴリのふりがな(ソートキー)

編集

未だはっきりと決まっていなかったと思うので(決まってたらすみません)、 カテゴリにふりがなを打つときの決まりを。

問題点としては、

  1. (日本語)長音、拗音、濁音の類をどうするか。
  2. (英語など)大文字や小文字の別はどうするか。

が考えられます。

日本語の案としては

  1. 長音のみ直前の母音に直す。
  2. 拗音のみ清音に直す。
  3. 濁音のみ清音に直す。
  4. 長音と拗音のみ直す。
  5. 長音と濁音のみ直す。
  6. 拗音と濁音のみ直す。
  7. 全て直す。
  8. 最初の文字だけ濁音は清音に戻し、2文字目以降はそのまま打つ。
  9. 8に加え、長音は直前の母音の小文字にする。

こんなところかなと。1-5はあまりないと思うのですが。8や9は並ぶときにできるだけきれいに並ぶように考えてみました。確かふりがなのUnicode順に並ぶので。6や7だとふりがなが重なったときの順番がランダムになってるような気がします、Category:かなCategory:ラテン文字などを見ると。

英語などの大文字小文字のある語は、個人的には全て「元の」文字である大文字に直すのがいいかと思います。(今まで散々小文字で打ってきたけど)カズ 2005年8月14日 (日) 04:30 (UTC)返信

ちょっと比較のために対抗馬別のパターンを出しつつ、まとめてみます。長音、促音・拗音、濁音・半濁音に関してはこのようになるかと思います
  1. 長音(ー)の扱い(例文:「ケーキ」
    1. 直前の母音に直す……「けえき」
    2. 直前の母音で、かつ小文字にする……「けぇき」
    3. 取り除く(母音に直さず、ただ消すだけ)……「けき」
    4. そのまま……「けーき」
  2. 拗音(促音も含む?)の扱い(例文:「ティッシュ」)
    1. 清音に直す……「ていつしゆ」
    2. そのまま……「てぃっしゅ」
  3. 濁音・半濁音の扱い(例文:「かばん」)
    1. 清音に直す……「かはん」
    2. そのまま……「かばん」
主だったところだけはこうなるかと思います。ただ、例えば「さる」と「ざる」のように、カテゴリの振り仮名が同じになる可能性のあるものもあるので、そこを何とかする必要もあるかもしれません。--Ninomy 2005年8月14日 (日) 09:58 (UTC)返信

とりあえず一言だけ。カテゴリの引数に渡すのはソートのためのキーであって振り仮名である必要はありません。--Lainex 2005年8月15日 (月) 00:29 (UTC)返信

Lainexさんのおっしゃるとおり、本質的にはカテゴリのページでどのような順序で排列するかが論点なのだと思います。で、辞書の排列は通常振り仮名によっているので、ソートキーとして振り仮名(のようなもの)が使われると。
では、どのような排列が適切かとなると、一般に利用されている辞書の排列順に従うのがよいと思います。ただ、MediaWikiを使っているための技術的な困難がある場合には、当面の回避策として多少異なる排列でも構わないと思います。そうすると、濁音、半濁音、拗音、促音は直音の直後であるべきですから、直音になおしたもの、すなわち歴史的仮名遣いと似た表記をソートキーとすべきでしょう。なお、音引きは省略する方式と、対応するあ行音に変換する方式がありますが、あ行音にする方がよいのではないかと思います。
この場合、問題点が4つ残ります。
  1. 清音の後に濁音が来てほしいが、必ずしも濁音が後になるとは限らないこと
  2. ひらがな書き、カタカナ書き、漢字書きの順に並んでほしいが、そのようにはならないこと
  3. 「ヴァ」のような表記はひらがなで表記できないこと
  4. IBMのように、日本語で通常ラテン文字で表記される単語であって、アルファベットで表記される言語の単語でもあるもの
1点目については、以前に日本語版ウィキペディアで提案されたことのある、「濁点(半濁点を含む)をのぞいた読みの後に、空白を空けてから、濁点を付けた読みを付ける」という方法はどうでしょうか。ウィキペディアでは「徹底し得ないだろう」ということで賛成が得られなかったのですが、徹底できなくとも大きな不都合が出ないことがこの方法の利点ですし、ウィクショナリーの項目数はまだ多くないため、実現性があると思います。
2点目についてはあきらめてよいと思います。
3点目については、
  1. 「うあ」にする方法と、
  2. 「バ」と読んで「は」とする方法
があり得ます。「うあ」とした場合、1点目の「元の読みをつける」ところが困難なのですが、これもあきらめるしかないと思います。
4点目については、日本語カテゴリのサブカテゴリは日本語のルールで、英語等のサブカテゴリについては、その言語のルールで、と使い分ければよいかと思います。以上をまとめると、NJT案は以下のようになります。
  1. 長音(ー)の扱い(例:「ケーキ」
    直前の母音に直し、半角空白で区切ってそのままを続ける……「けえき けーき」
  2. 拗音(促音も含む)の扱い(例:「ティッシュ」)
    清音に直し、半角空白で区切ってそのままを続ける……「ていつしゆ てぃっしゅ」
  3. 濁音・半濁音の扱い(例:「かばん」)
    清音に直し、半角空白で区切ってそのままを続ける……「かはん かばん」
  4. ローマ字表記される単語の扱い(例:「IBM」)
    日本語の単語と扱う場合については、上記ルールに従う……「あいひいえむ あいびーえむ」
なお、JIS X 4061 日本語文字列照合順番については、日本工業標準調査会(JISC)のサイトのデータベース検索から検索することで閲覧することができます。--NJT 2005年8月16日 (火) 04:31 (UTC)返信
なるほど、個人的に考えていた(直音は0、濁音は1・・・「シューズ」→「しゆうす0341」)よりよほど分かりやすいです。
2点目に付いて全ての文字がひらがなの項目はあいまい回避になっていることもあるでしょうから、最後にさらに「!」を加えるといいと思います。「けいせい」→「けいせい けいせい!」「形声」→「けいせい けいせい」それ以外の並び方はあきらめましょう。
3点目、いちおう「ゔ」(U3094)がありますが、日本語では「ぢ」と「じ」を間違えると小学校の国語の先生に×をもらいますが(笑)「ブ」と「ヴ」を間違え(?)ても何も言われないので「ヴ」のつく項目は全て「ブ」へのリダイレクトという形にしてしまっていいんじゃないでしょうか。その方が原語が「b」なのか「v」なのか分からない時に便利です。
4点目に付いて、ラテン語の読みの標準を決めないといけませんね。「エイチ」と「エッチ」では項目が増えてくると大分違いますから。
一応日本語読みとしては
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
エー ビー シー ディー イー エフ ジー エッチ アイ ジェー ケー エル エム エヌ オー ピー キュー アール エス ティー ユー ブイ ダブリュー エックス ワイ ゼット
が多いかなと思います。 カズ 2005年8月18日 (木) 02:46 (UTC)返信

英字に読みを付けるならA→エイ、H→エイチ、J→ジェイ、K→ケイ、Z→ゼッド、が良いかなと考えますが如何に。あとw:ギリシア文字は何うなるでしょうか。--kahusi - (會話) 2005年8月18日 (木) 11:15 (UTC)返信

2点目の清音と濁音の排列について、「!」をつけてしまうと、ついていないものよりも後に排列されてしまうのではないでしょうか。
4点目のローマ字の読みについて、会社名であれば、正規のカナ表記が決まっていることが多い(ローマ字が商号として認められる以前に日本国内で登記を行っている会社すべて)ので、それに従うべきと思います。例:NTTDoCoMo→「エヌ・ティ・ティ・ドコモ」
その他については適当に統一するしかないのだろうと思いますが、商号の場合をざっと眺めてみたところでは、H,J, Kはそれぞれエイチ、ジェイ、ケイの方が一般的なのかなと思います。何か基準にできるものをご存じの方はご教示ください。--NJT 2005年8月18日 (木) 11:41 (UTC)返信
>2点目
しまった、そうですね。考え直してみます。
>ローマ字
あくまで日本語の話なので日本語であまり使われていない「ゼッド」はだめだと思います。(まあ「ぜっと」と「ぜっど」の間に入るような言葉が日本語になさそうだけど)
会社名については正規のものを使うことでいいと思います。
KとJは確かにイのほうが多いです(検索サイトで調べてみた)。Aは魚のエイが混じってるかもしれませんがこれもエイのほうが多かったです。Hについては(調べなくても分かってましたが)エッチと読む大多数が「HentaiのH」ですので、これもエイチでいいと思います。カズ 2005年8月18日 (木) 13:19 (UTC)返信
その後。
  • 自分の中では「ふりがな1 ふりがな2 {{PAGENAME}}」という結論になりました。
  • 一応、ギリシア表。
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
アルファ ベータ ガンマ デルタ エプシロン
イプシロン
ゼータ エータ
イータ
シータ イオタ カッパ ラムダ ミュー ニュー クシー
クサイ
オミクロン パイ ロー シグマ タウ ウプシロン
ユープシロン
ファイ カイ プサイ オメガ
カズ 2005年9月2日 (金) 13:06 (UTC)返信
例えばかばんをカテゴリーに記入するときに、「category:かはん かばん」と入力すると、後々似た言葉(画板など)が出てきても、きれいに並びますよ。左に清音、右に通常読みを書くわけです。って上に書いてるか。長音、拗音はそのまま書くか抜かすほうが直感的にできるのでいいかと思います。Zは「ズィー」ではだめですかね。草薙 2005年10月27日 (木) 03:33 (UTC)返信

日本語wikiは何処までも英語偏重(=POV)なんだな。あと「イプシロン」はΥの現代語読み。

カテゴリソートキー

編集

カテゴリソートキーですが、template:-it-をみると{{uc:{{{1|{{PAGENAME}}}}}}}のようになっていて、ページ名の大文字をカテゴリソートキーとするようになっているようです。そのようにそろえているのでしょうか?-- 2007年1月27日 (土) 12:36 (UTC)返信

そのようなことはないはずです。ページ名そのままを利用することが多いように思います。そもそも、{{-xx-}}系は(慣例的に)非推奨です。--Ninomy - chat 2007年1月27日 (土) 12:50 (UTC)返信
ページ名そのままですか? 実際の利用を考えたら、大文字か小文字に合わせた方が辞書順になるようには思うのですが。-- 2007年1月28日 (日) 10:23 (UTC)返信
辞書順には確かにその通りなのですが、大文字と小文字は区別しておくべきという方もいらっしゃるかもしれません。もし直すのであればもう少し広くコメントを募ってからのほうがいいでしょう。個人的には、今から直すのも手間なのでページ名のままでも良いかなと思っております。--Ninomy - chat 2007年1月28日 (日) 13:43 (UTC)返信
たしかに、それだけのために編集することも不合理ですね。ソートキーは{{DEFAULTSORT:}}ができてだいぶ書きやすくはなりましたが。-- 2007年1月29日 (月) 00:13 (UTC)返信
ページ「カテゴリ」に戻る。