Naggy Nagumo | ||||||||
---|---|---|---|---|---|---|---|---|
|
自己紹介
2017年8月ごろから活動しています。私は日本語に詳しいので世界で日本語が上手な人上位5%に入っていると思います。
資格・検定
- 日本漢字能力検定準1級
- 実用英語技能検定2級
- 汉语水平考试HSK4級
- 応用情報技術者試験
- ウェブデザイン技能検定2級
- 情報セキュリティマネジメント試験
- 普通自動車第一種免許 AT限定
- 危険物取扱者乙種第4類
- 環境社会検定(eco検定)
考えていること
- 日本語として独立性が低い言葉でも、他言語からの訳語としてよく使われるものがある。英語"weakness"に対する「弱さ」など。こういった言葉も訳語の集約先として有用だと思う。 --Naggy Nagumo (トーク) 2018年11月2日 (金) 02:32 (UTC)
- 順序があるもののカテゴリを作る際には、カテゴリのソートキーを操作して順序通りにするのではなく、あくまでカテゴリは通常のソートとして付録やナビゲーションを作るのがよいと思う。 --Naggy Nagumo (トーク) 2018年12月12日 (水) 02:55 (UTC)
- 読み上げソフトのことを考えると「すなわち」の意味で括弧は使わない方がいいのかもしれない。 --Naggy Nagumo (トーク) 2018年12月14日 (金) 01:00 (UTC)
- 言語間リンクが減ったことを検知する機能がほしい。 --Naggy Nagumo (トーク) 2019年1月26日 (土) 03:19 (UTC)
- 同じものを表しているけど発音に違いがある語(例えば「プリンタ」と「プリンター」、「ティンパニー」と「チンパニー」)は異表記?それとも類義語? --Naggy Nagumo (トーク) 2020年8月26日 (水) 02:03 (UTC)
覚え書き
- 音読みが和語と結びついて熟語を成したり連濁を起こしたりして、あたかも和語のように扱われる漢語がある。立項の際には注意が必要。
- 逆に音読みっぽい訓読みも一応注意。
- 英語版から語源を輸入する際、
{{der|sv|ine-pro|*wer-}}
のようなテンプレートは日本語版では{{etyl|ine-pro|swe}} {{recons|lang=ine-pro|wer-}}
などとすることで表現できる。引数lang
は言語テンプレートを呼び出しているため、lang=ine
としてもよい。 --Naggy Nagumo (トーク) 2018年3月28日 (水) 14:41 (UTC) - HTML5で廃止されたタグを置き換える。
廃止されたタグ | 使用例 | 代替例 |
---|---|---|
big | <big>text</big> | <span style="font-size: 120%;">text</span> |
center | <center>text</center> | <div style="text-align: center;">text</div> |
<center>block</center> | <div style="margin: auto;">block</div> | |
font | <font lang="ja">いろは</font> | <span lang="ja" xml:lang="ja">いろは</span> |
<font size="8">text</font> | <span style="font-size: 350%;">text</span> | |
<font color="blue">text</font> | <span style="color: blue;">text</span> | |
strike | <strike>text</strike> | <del>text</del> |
<span style="text-decoration: line-through">text</span> | ||
<s>text</s> | ||
tt | /<tt>maɪ</tt>/ | /<span style="font-family: monospace, monospace;">maɪ</span>/ |
<tt style="background-color: #f8f9fa; border: 1px solid #eaecf0;"><nowiki>{{head|jpn|noun}}</nowiki></tt> | <code><nowiki>{{head|jpn|noun}}</nowiki></code> |
- ソートキーは自動的にページ名が付加される。ソートキーをページ内で指定した場合、指定したソートキーの後ろにラインフィードおよびページ名が付加される。ソートキーの区切り文字に使っている半角スペース(U+0020)はラインフィード(U+000a)よりも後に並ぶため清音のみのソートキーを二回書いても順序は崩れないが、ソートキーが同一であるページ同士でそのようなものが入り混じっていると順序が変わってしまう。
- ページ名「はなれる」、ソートキー指定なし → ソートキー: はなれる
- ページ名「はなれる」、ソートキー指定「はなれる」 → ソートキー: はなれる\nはなれる
- ページ名「離れる」、ソートキー指定「はなれる」 → ソートキー: はなれる\n離れる
- ページ名「離れる」、ソートキー指定「はなれる はなれる」 → ソートキー: はなれる[space]はなれる\n離れる
- ページ名「ばなれる」、ソートキー指定「はなれる ばなれる」 → ソートキー: はなれる[space]ばなれる\nばなれる
- 読み上げソフトのためには
display: none
のみでは不十分な場合があり、speak: none
も指定するとよい。- 対応していないソフトも多いらしい。
- TemplateStylesはテンプレート内だけに適用されるわけではなく、読み込んだページ全体にかかるらしい。よくあるクラス名や要素での定義は避けた方がよさそう。
- sort → jsort → (デフォルトソート) の優先度でソートキーを適用するためのコード:
{{#if:{{{sort|}}}|{{!}}{{{sort}}}|{{#if:{{{jsort|}}}|{{!}}{{#invoke:ja|jsort|{{{jsort}}}}}}}}}
- ソートキーは最大230バイトの可変長バイト列としてDBに格納している(mw:Manual:Categorylinks_table)。はみ出した分は切り捨てられて230バイト分だけ格納される。マルチバイト文字の途中でも問答無用で切り捨てられるため、UTF-8として読み取れないコードになる場合があり、解析者を困らせる可能性がある。UTF-8で3バイトの文字を使って第二ソートキーまで用いる場合、読みが25文字を超えたら注意が必要。例えば一富士二鷹三茄子四扇五煙草六座頭(漢字表記16文字, かな表記25文字)。
- 漢字にマッチする正規表現
[⺀-々〇〻㐀-䶿一-鿿豈-𠀀-]
自戒
よく使うリンク
資料
息抜き
メンテナンス
やること
すぐやる
- モジュール:ja-headwordでページ名に「・」が含まれていても動作するようにする。find_kanaで「・」をかなのパターンに含めていないため見つけられない。detect_kana_scriptを使って判定できないか?
- テンプレート:no-infl-nounに不具合がある。修正するだけの忍耐力もないので、en:Template:no-noun-inflを再移植する。テンプレートの使い方が変わっているかどうかは調査していないが、変わっていたとしても使用数が少ないため、手作業でテンプレート呼び出しを修正する。
近いうちにやる
- いくつかのテンプレートで、ソートキーを自動で生成するようにする。ページ名からソートキーを決定できるものは手入力すべきでない。
{{context}}
,{{タグ}}
,{{etyl}}
,{{head}}
などが対象。 - 品詞コードから品詞名を返すテンプレート
{{sv-proper noun}}
をモジュールで実装する。属格は機械的に決められる。- ソートキーのベースとなる文字列を入力する引数を追加したい。いくつかのテンプレートで
jsort=
を追加したが、日本語だけでなくあらゆる言語に対応したい。 - 文法テンプレートの整理
- 性テンプレートの整理
- 翻訳並べ替えをEdge, Firefoxにも対応させる。
- テンプレート:gを使用しているページを改める。
- テンプレート:stubを廃止したい。デメリットの方が目立つ。
- 追加カテゴリを与えるテンプレートを作りたい。テンプレート:catlangnameがまさにそれだと思うけど、名前が分かりにくい気がする。
- Wiktionary:編集室/2020年Q3#NavFrameがモバイルビューで機能しない
{{Latn}}
,{{Cyrl}}
などのテンプレート群は酷過ぎる。作り直した方がいい。- カテゴリ名をわかりやすい名前にする。説明がないと表しているものがわからないような名称はだめだ。
ゆっくりやる
- 項目を増やす。項目の質を上げる。
- 言うまでもない。特に日本語に於いては現状(2018年3月)基本的な語彙も赤リンクが多数ある。専門用語が充実するのもよいのだが、一般的な語彙の強化が望まれる。
- 翻訳の追加。
- 多機能辞典であるウィクショナリーの強み。英語版ウィクショナリーが充実しているため、そこから移植するだけでも有用性は上がるはず。
- 項目のカテゴリ付けの整理。同音異義→日本語 同音異義、法律→日本語 法律など。
- 言語節や訳語の五十音順並べ替え。
- 言語間リンクの除去。
- テンプレート:ja-pronは京阪式アクセントに対応できないだろうか?
- 翻訳で「漢文」というラベルで書かれているものがある。適切な言語名に変えなければならない。
- テンプレート:Pathnavで「日本語 名詞|disp4=名詞」のように表示する文字列を別途指定するのが面倒くさい。テンプレートに組み込めないだろうか?
スウェーデン語の人称代名詞
主格 | 対格・与格 | 所有代名詞 | 再帰代名詞 | 再帰的所有代名詞 | ||||||
---|---|---|---|---|---|---|---|---|---|---|
通性 | 中性 | 複数 | 通性 | 中性 | 複数 | |||||
単数 | 一人称 | jag | mig | min | mitt | mina | mig | min | mitt | mina |
二人称 | du | dig | din | ditt | dina | dig | din | ditt | dina | |
三人称 男性 | han | honom | hans | sig | sin | sitt | sina | |||
三人称 女性 | hon | henne | hennes | |||||||
三人称 中性的用法 | hen | hen, henom | hens | |||||||
三人称 通性 | den | den | dess | |||||||
三人称 中性 | det | det | dess | |||||||
複数 | 一人称 | vi | oss | vår | vårt | våra | oss | vår | vårt | våra |
二人称 | ni | er | er | ert | era | er | er | ert | era | |
三人称 | de | dem | deras | sig | sin | sitt | sina |
項目数
言語名 | 言語名(ローカル) | 実質項目数 | 全項目数 |
---|---|---|---|
日本語 | 日本語 | 95444 | 107003 |
中国語 | 中文 | 40680 | 45288 |
英語 | English | 34892 | 52263 |
スウェーデン語 | svenska | 1942 | 8573 |
50000項目以上: 日本語 (107,003)、英語 (52,263)
20000項目以上: 中国語 (45,288)、ラテン語 (30,403)、朝鮮語 (31,034)、フランス語 (22,085)、イタリア語 (20,674)
10000項目以上: ドイツ語 (14,327)、スペイン語 (14,475)、ポルトガル語 (11,716)、ベトナム語 (12,252)、エスペラント (11,057)
5000項目以上: ロシア語 (10,834)、スウェーデン語 (8,573)、閩南語 (7,841)、カタルーニャ語 (6,520)、ハンガリー語 (9,880)、オランダ語 (5,857)、ノルウェー語(ブークモール) (5,306)
調査が必要なページ
項目
テンプレート
- テンプレート:grc-decl-3rd-prx-con-ειςや類似のテンプレート: {{grc-cell}}を二重に読み込んでいることによりレイアウトが崩れている。読み込み元を見てもgrc-cellの引数として定義されていないものを渡していたりして、意図に齟齬があるような印象。
サブページ一覧
- /ISO 639-1コード一覧: ISO 639-1について、パーサー関数とウィクショナリーにおける言語名の差のリスト。
- /砂場:
- /他言語版にあって日本語版にない項目: その名の通り。
- /統計: ウィクショナリーの統計の試作
- /統計/見出し語数: 見出し語(lemmas)の数をカウントするテンプレート試作。高負荷。
- /見出し語数: 見出し語(lemmas)の数をカウントするテンプレート。