母語

編集
ja この利用者は日本語母語としています。

年齢

編集

1991年生まれです。

地域

編集

東京都で出生しました。

長野県にかつて住んでいました。

兵庫県にかつて住んでいました。

東京都にかつて住んでいました。

埼玉県にかつて住んでいました。

現在、京都府に住んでいます。

教育

編集

私立男子高校に在籍していました。

主に理科系の高等教育を受けています。

中学校から

編集
en-3 This user is able to contribute with an advanced level of English.

大学から

編集
de-1 Dieser Benutzer hat grundlegende Deutschkenntnisse.
zh-1 該用戶能以簡單中文進行交流。
该用户能以简单中文进行交流。

コンピュータ言語とか

編集

Scheme/Lisp/Perl/Javascriptとかが好きです。

C/C++/Haskell/Ruby/Python/HTML/XML/RDF/SQL/Java/x86 asm/Bashなども、扱えるはずです。

アカウント名(insanity)について
こんなアカウント名で失礼します...。悪い意図は無く、ことばのような仮想現実に囚われて生きるものはみな気違いさ、というほどの意味。多分。
ボット用アカウント
User:BotSanity(そのうち動かします)
コード
github(ボットのソースコードとかも上げるかも)
他のwiki
w:User:Insanity, b:User:Insanity (書きかけの放置は良くないですね) - en:w:User:RollingFrenzy(英語版wpではRollingFrenzyです。)

考えていること/考えていたこと

編集
この辞書には「凡例」がないけど、どう書けばいいのだろうか。
特定分野での語義は(分野)を使っている場合が多いが、状況の注釈などとかぶる。普通の辞書では特別の記号が用意されている。Wiktionaryではカテゴリ分けを使うことで「数学用語集」「俗語集」などが簡単にできることがメリットだが、語義ごとに使うことができないものか。(特に漢字の項目とかだと探すのが面倒)
Wikitionary日本語版であって、国語版ではない。
というのはおもしろいところなのだが、現状ではアクセントは標準語のものがついている。検証が難しく、文法と語彙を切り離すのも難しい分野ではあるが、何か書けないものかな。
方言の言語地図などの資料があるらしい。この地図は文法書より雄弁に語るものがあるように思える...
語義の構成
おおざっぱな概念で示す場合と、細かい用例についていちいちあげる場合が考えられる。コロケーションを解説するとき、前者では、単なる選好ということになる。後者では、用例に限定して意味が派生しているということになる。両方のやり方を折衷するとわかりやすい。(一般的には・・・。特に、何々について使うときには・・・の意味。)「意味の派生」にある程度のハードルをつけないと、長々しくて読みにくい。(細かいことは使用者に考えさせればよい。)一応の基準として、非日本語話者にも想像がつけば載せない、よりもうちょっと載せるぐらいの感じにしているつもり。
用例が示されていて解釈が分かれる場合などは編集が衝突するかもしれない。Urban dictionaryでは投票によるモデレートである意味成功しているようだが、Wiktionaryではどうなるのだか...
別名リンクを偽リンク(false link (en))にならないようにする
wiktionaryでは別名リンクはなるべく避けたい。一般論として、リンクがどこを指しているのかクリックするまで分からないというのではユーザビリティの観点からして良くない。また、辞書は項目が意味ごとではなく語句ごとに立てているため、語句がリンクになっていたら当然その語句の項目に対するリンクであるとユーザは想定するからである。一方、例外を挙げてみると...
  1. 踊り字。「々、ゝ」を使った別表記のために、リダイレクト以外の項目を立てない。
  2. 仮名遣いの相違。これは別名リンクにせず、そのままリンクすべき例のようにも思える。
  3. 立項されていない「かばん語」。中学生
  4. 動詞の活用、……形、……分詞。名詞の複数形、……格など。
  5. 動詞の振り仮名(動詞の項目にリンク)。
振り仮名リンクについて。
ふりがな→動詞の解説、という対応はちょっと予期しがたい。とくに、複合動詞や熟語訓の動詞で困っている。たとえば、える(ふりがなは両方「とりかえる」へのリンク)とすべきだろうか。「り」を送らない場合は取替とりかえるでいいのか。なにより、リンクがどこを指しているのか、利用者が予期できる、またはヘルプなどで簡単に理解できることが大切。
これを解決するため、送り仮名も含めてひらがな部分はみな動詞へのリンクにする方法が考えられる。たとえば、「ない」「える」とする。この場合の利点は、漢字のアンカー→単漢字項目、それ以外の部分→動詞、ということがはっきりする点、不利な点として、特に将来rubyタグに対応させた場合、同じ単語のひらがなの部分のアンカーと漢字の部分のアンカーが異なった項目へリンクしていることが分かりにくい(かもしれない)点があげられる。
いまは振り仮名を振らずに放置したり、複合動詞を無視して二つの動詞に分解している。このままでは振り仮名をふることもままならないと感じている。
用例のつけかた(仮)
en:Wiktionary:Quotationも参照。
用例は重要である。文脈か意味を示す、使われている文脈の広さを示す、どのような言葉がつながりやすいかを示す、言葉の使われている時間的広がり、地域の広がり、話者の社会的区分の広がり、などを説明したり、検証したりする。
用例には、語句を定義する時に考えて作文する方法と、実際に使われている文章からの引用する方法の二通りがある。
引用する時に書くべきこと。
  1. 文章の適切な引用。(著者名、タイトル、改変しない)
  2. 執筆年、発行年を示す。年代は重要。初版の発行日を間違えないように確認する。
  3. ISBN, URL (近代デジタルライブラリー/青空文庫/google books/wikisource/project gutenburgなど)を書く。(インターネット辞書なので、利点を生かす)
  4. 著作権に注意。個人的には「正当な引用(正しい表示・必然的な引用・引用が従)」ならばCC-BY-SAライセンスで配布すること、またその条件下で再利用することのどちらも問題ではないと考えるが、とりあえずは「必然的な引用・引用が従」でなくとも使える用例をあつめる。具体的には、すべての著作者が死後50年経過の書籍や法令などのパブリックドメイン、CC-BYもしくはCC-BY-SA下の文章、特別の許可のあるもの。(たとえばRFCは「ほかの資料と同じように」クレジットすれば、一部分のコピーも可とのこと。)もちろん、これらのものでも、著作者を正しく表示しないと著作権法違反になる。
例。

用例

  1. (語句などの)実際に使われている例
    用例を示す(1923 著者『タイトル』出版社 ISBN)
英語版のように、年代をあたまにおいて、強調字体で示すのはよさそうだ。
一方で、文学作品からの引用では不要な情報が多く、辞書の用例、とくに初学者向けの説明としては不適当なこともある。そんな時に、どう用例をつけるか。
「難しい」語句の場合:青空文庫を検索する。稀にしか使われない語句の場合は、それを引き写す。一人の作家によってしか使われていない場合(他の誰からも使われていない造語の場合)、辞書に載せるのは多分妥当ではない。
よく使う語句の場合:青空文庫を検索する。ついでにWebも検索する。青空文庫で、修飾する語(何々に、何々を)との意味のつながりを特に注意して観察し、作文する。最後に、意味が通るかどうか、文脈により他の意味にとれる虞がないかどうか、同内容でより自然な文がないかどうか点検する。
決まった言い回しがある場合:言い回しを書き溜めて、それぞれの言い回しが語句のどの意味に属するものかよく考え、取捨選択する。
口語、俗語の場合:地の文を入れるなどして、話す状況が推察できる文にする。
今更言うことでもないが、青空文庫の収録内容は(夏目漱石とか芥川龍之介とかならばいいんですけど)、あまり多くない入力者の関心のある作家が選ばれているためにそれなりに偏っている。その辺もちょっと考えないとうまく使えない。
技術的問題
近代の文章は(きちんと調査しないと|よくよく調べてみても)没年不詳が多くて、100年前の文章ならなんでもパブリックドメイン、というわけには行かない。
近代デジタルライブラリーはスキャン画像をhuman-aided OCRでテキスト化する本格的なプロジェクトを始めているようですが、いつどれだけの文書がテキスト検索ができるようになるのかはまだ分からない。
DEFAULTSORTとかCategoryとか同音異義語とかはそのうちbotにまかせたい... autowikibrowserという手もあるけれど。特に、和語の動詞がある程度揃ったら漢字表記をbotで大量作成!してみようかと思っている。主たる目的はinter-lang linkを効率よく使いたいというところにある。まあとにかく定義を書くのが先決ですね。
閲覧環境の悪さは、最悪外部サイトをつくって、データだけ読み出せば何とかなる。辞書を快適に閲覧するレベルのインタフェースをmedia wiki上で構築できるかという点については悲観的に考えている。ちょっとした改善なら無限にできるのだけどね。
glyphwikiとの連携
Unicodeの壁、フォント環境の壁を越える。Unicodeでは包摂されている漢字も区別できる。Commonsへボット投稿以外の方法は無いのか。

作業リスト

編集

Wiktionary:日本語の基本語彙1000

利用者:Insanity/vector.css

高等学校で学習する程度、もしくは学習していた程度、およびそれと同じ程度基礎的な概念。

物質 - 純物質 - 混合物 - 精製 - IUPAC - 化学式 - 有機 - 無機 - 金属 - 反応 - 触媒 - 回路 (カルボン酸回路など)- 生成 - 分解 - 化合 - 酸化 - 付加 - 脱離 - 原子 - 分子 - 単体 - 結合 - 状態 - 水和 - 溶液 - 分散 - コロイド - 飽和 - イオン - カチオン - アニオン - - 塩基 - アルカリ - 中和 - 周期表 - 周期 - - 典型元素 - 遷移元素 - アルカリ金属 - アルカリ土類金属 - 希土類 - ハロゲン元素 - 希ガス - 水素 - ヘリウム - (以下省略)

自分のこと

編集

バベルに自分の住んでいる(た)地域や年齢などを書いた。(日本語の)語彙学、言語学について疎い人間なので、せめて誰が定義しているのか素性を明らかにしておこうと思ったまでです。