利用者:Electric goat/sandbOx
日本語版ウィクショナリーについての私論です。自分の考えをまとめたくて書いています。ゆくゆくは説得力と魅力のある建設的でソリッドなロジックを構築したいと思っていますが、今は素材集めの段階です。考えも文章もまとまっていません。
こころいき:具体かつ徹底的に掘り下げつつ、簡潔に素朴にいく。
ウィクショナリーについて
編集ウィクショナリーは、辞書として収録すべきあらゆる言語のあらゆる語彙を網羅する、オープンコンテントな多言語多機能辞典です(定義の説明はのちほど)。世の中には辞書・辞典がたくさんありますが、本格的に作られているオープンコンテントな辞書はありませんし、多言語を対象として多機能に使える辞書もありません(あったら教えてください)。日本語版ウィクショナリーは、現代日本語で書かれた最大最高の信頼性のある辞書を編纂し、知の基盤を広く共有してゆくことを目指しています。日本語を通してことばを理解しようとする人たちを、辞書としてあらゆる手段で手助けするのが日本語版ウィクショナリーの役目です。
背景
編集ウィキペディアは多くの人が知っていると思います。ウィキメディア財団の運営するオープンコンテントな百科事典です。ウィキメディア財団は、知の共有をその使命として掲げています(foundation:Mission statement, foundation:ビジョン)。ウィクショナリーは辞書的役割を担う姉妹プロジェクトで、同じくウィキメディア財団により運営されています。現在、170の言語版があります(m:Wiktionary)。姉妹プロジェクトの中では最も古く、2002年に開設されました。日本語版の開始は2004年からです。
辞書とは:その意義
編集わたしたちはいろいろなことを知りたがります。何かを知ろうとして、誰かに尋ねたり、Googleで検索したり、ウィキペディアを見たり、本で調べたり、あるいは自分で研究したりします。それらの知識のほとんどはことばによって記述されています。口頭会話も、書籍も、手話も、点字も、数式もことばを使っています。そして、それらの「ことば自体」を扱うのが辞書なのです。ですから、辞書は知の土台になるもの、あるいは知を構成する原子や分子のようなものと言えるでしょう。
辞書を使う状況としては、書き物中の調べもの、学習の一環、教養、あるいは楽しみなどがあるでしょう。わたしたちは何を知ろうとして辞書を引くのでしょうか?
- 知っている言葉の意味をあらためて確認する。
- 言葉の使い方・成り立ちを調べる。活用、発音、用例、語源など。
- 関連する言葉を調べる。類義語、対義語、訳語など。
- 知らない言葉を調べる。
執筆、翻訳などでは正確性を保持するために、辞書を引き確認します。言葉には多面性があり、知っているつもりでも新たな発見があるかもしれません。辞書が敢えて基本語彙から収録する理由の一つです。基本語彙の載っていない辞書はありません。基本語彙はより高度の語彙の説明にも参照されます。
また、より深く、より広く、その言葉を知るために辞書を引きます。語源、類義語、対義語、複合語、連語など、ことばのネットワークは、そのことば自体の理解を深めます。ウィクショナリーではハイパーリンクにより隣接する語彙へのアクセスが容易ですし、多言語を収録していますので、由来の他言語語彙へも簡単です。
最初からたくさんのことばを知っている人はいません。例えば小学生のころは学習辞書を引いて語彙を増やします。また、言葉は新たに誕生してきますので、『現代用語の基礎知識』や『イミダス』などのように、新語についての需要に応えるものもあります。ウィキペディアもその一角を担っていると言えるでしょう。
ウィクショナリーはそういった要求に応えようとして、作成されています。
日本語版多言語多機能辞典とは:このユニークなスタイル
編集日本語版の多言語辞典とはどんなものでしょうか。一般に外語辞典は外語と日本語の一対一関係です。英和、独和、中日、仏日……逆に和英、独和、日中、日仏……のように辞書が作られています。ウィクショナリーはこれらを一つにまとめてしまいます。市販の紙の辞書にも多言語ものはありますが、分量の問題から本格的で網羅的なものはありません。また、オンラインサービスでは英、中などメジャーな言語については辞書がありますが、少しマイナーになると皆無です。Google翻訳は多言語に対応していますが、辞書として機能するとは言えません。このように言語的ロングテールはウィクショナリーの特徴の一つです。
多言語をどのように収録するかというと、同じ文字、同じスペルの語彙は、何語であれ、同じページに記述します。これにより、言語横断的にその語彙について知ることができます。また、借用語や外来語などの語源となった他言語の語彙にも簡単にアクセスすることができます。
これは一般の英和辞典などでもそうですが、日本語版ということは、日本語でない言語の語彙を日本語で説明することになります。他の言語と日本語は完全な対応関係ができるわけではありません。ギャップが存在します。そこで、例文や比較・文化的背景などの注釈も盛り込んでいくことになります。
辞書の種類は、国語、訳語、類語、語源、発音、用例、各種専門などがあります。ウィクショナリーはこれらをまとめて扱う多機能辞典です。大辞典で見られる形式をとります。一般辞典は相応の書式があり、専門辞典もまたそれぞれの書式があります。単機能ならシンプルですが、これらを合わせると、多言語多機能辞典では、書式が複雑で1ページが膨大な量になり、複雑になるなってしまいます。電子辞典では紙の辞典にあるページ数の制限はないと言って良いですが、可読性の点で課題が残っています。
オープンコンテント:誰もが辞書を編纂することについて
編集これまで辞書は、言語学者などの専門家が編纂してきました。一見簡単に書いたように見えるとても短い文章でも、専門家が検証を重ねた末に書き上げているものです(それでも間違いはありますが)。ウィクショナリーはボランティアによって編纂されます。ボランティアは専門家とは限りません。むしろアマチュアが多くを占めるでしょう。そうすると当然、品質についての疑問が生じます。「素人がつくったもので大丈夫なの?」
オープンコンテントに対する指摘は、すでにウィキペディアに対して多くなされています。なぜウィキペディアは素晴らしくないのかで、たくさんのサンプルを見ることができます。ウィクショナリーとしては、素人が百科事典を作るウィキペディアが(問題はありつつも)受け入れられている、と答えることができます。ウィキペディアのよくある批判への回答がおおむね流用できるでしょう。
楽観的に考えれば、複数の辞書をあたり用例を検索するなどの検証をしっかり行えば、素人が作っても、大きく外したもにはならないでしょう。個人がネットで少し調べもののとっかかりとして使うような、学術的あるいは法的な正確性を求められない場合であれば、100点ではなくとも、70点以上を取り続けていれば、及第点と言えるでしょう。ただ、言葉を比較的少ない字数で定義する辞書は、より正確さが求められると考えた方がよいでしょう。
品質を高く保つためには、根本的には、参加者の意識を高くする必要があります。そのためにはガイドラインの充実や適切なコミュニケーションを行っていきます。参加者が増えてくればそれでも対処しきれないことが増えてくるでしょうから、検証システム(RfV)を活用することが重要になります。また、日々のRCパトロールもかかせません(メモ:Autopatrollerの導入)。能力のある参加者であれば、加えられた変更を見て、その後の投稿に修正を加えていくでしょう。RCをチェックしていることで、いつまでも行動が修正されない参加者を見つけ出すこともできます。
品質とは別に、著作権侵害を防ぐことも重要な課題です。オンライン辞書は数多くあるので、これらからコピーが投稿されることは散見されます。この点についても、参加初期に十分理解してもらう必要があるでしょう。わかりやすいガイドラインを用意しなければなりません。
中核となる基本語彙の作成はもちろん重要ですが、各人が自分でウィクショナリーを使用しながら、欠けていたところを埋めていくこともできます。これはオープンコンテントならではの、一つの現実的で健全な発展様式です。ウィクショナリーも少しずつでも成長していますから、活動が続いている限り、徐々に実用的なものになっていくでしょう。個人的にはわりと楽観的に考えています。
収録語数と編集方針
編集どれくらい収録すると使い物になる辞書として認めてもらえるでしょうか。市販の国語辞典を見ると、ポケット辞書が3万、小型(明鏡、新明解など)が6-9万、中型(広辞苑、大辞林など)が20-25万、大型(日国)が50万。英語最大の辞典であるオックスフォード英語辞典が収録語数約29万語、小見出しその他も含めると61万5千語。単純な比較はできませんが、英辞郎の英和データ (v.130 20110721) の見出しが184万です。ひとつの言語あたり、基本語彙で3万、全体で6万あれば、辞書を標榜できるでしょうか。
中型の辞書である広辞苑と新英和大辞典(研究社)をあわせると50万くらいになります。重複のない日本語と英語をあわせただけでも50万です。言語の数は開設されているウィクショナリーの言語版だけでも170、世界全体では5,000とも8,000とも言われます。仮に10万語を100の言語で収録したとすると、見出しは1,000万になります。もう一度数字を出しておきますと、広辞苑第5版の総項目数は24万です。ウィクショナリーの項目数の上限は計り知れません。まあ、今現在はまだ405,144項目なんですけど。
ウィクショナリーはあらゆる語彙を収録する。簡単に言うと、そういうことですが、現実的には「辞書として」という前提が隠れていて、制限は必然として存在します。「紙の辞書ではない」という文言がウィクショナリーは何でないかにあります。でも、これは制約の完全撤廃を意味するものではありません。紙でないので、分量について気にしなくて良い、ということです。上で書いたように、1,000万を収録するとなると、紙の辞書では対応できませんが、ウィクショナリーでは気にする必要はないのです。
制約はどのようなものでしょうか。わかりやすいものとしては固有名詞についてです。例えば、個々のテレビ番組について、辞書に収録する必要はありません。ただし、現在、制約の対象になっている領域でも、その境界にはある程度の幅があり、いずれ収録しても良いものもあるでしょう。また、アクセス性を考えると、表記の揺れ、複合語、連語などは、積極的に収録するのが良いでしょう。しかし、その前に基本項目を網羅して、辞書としての基盤を確立することは重要です。なぜなら、辞書は、言い換えによる言葉のネットワークの一部を切り出して語彙の説明を行っているからです。そしてその根本を支えるのが基本語彙なのです。ウィキペディア的な路線もありましたが、基礎をおろそかにして、砂上の楼閣になることを避けるというのが、現在の日本語版ウィクショナリーの方針です。
ある言語について中型辞典以上になってきたら(実項目(空見出しを除いたもの)が20万を越えたら)百科的項目や新語・俗語・複合語等の柔軟な追加が可能ではないかと思います。知りたい言葉が辞書になかったとき、がっかりするものです。時代の流れに追いつけるのがウィキの特徴です。それはできるだけ活かすのが Wiki Way でしょう。
想定閲覧者:利用してもらうために
編集せっせと作っても、使ってもらい、役立たなければ意義を失ってしまいます。どうすればよいでしょうか。
辞書(国語、英和、和英)はオンラインサービスの多い分野です。競合サービスが多いのは、百科事典であるウィキペディアと異なる点です。ウィキペディアはGoogle検索で上位にくることもあり、日常的に使われています。ウィクショナリーはGoogle検索で上位にならない場合も多いですし、統合辞書検索サイトであるWeblioにも含まれていません(英語版は含まれている)。このようにウィクショナリーの知名度は、まだウィキペディアほどにはありません。
想定する対象利用者は、広く設定すれば初歩以上の日本語を解する人すべてです。ネイティブと非ネイティブでは解説に使用できる語彙の制限に差があります。また、教育を受けている生徒が必要な学習辞典と、社会に出た人が必要とする実用辞典では、求められるものがちがいます。まずは、非ネイティブや小中学生にも理解できるように配慮することは大事です。漢字にはふりがなによるサポートが重要です。意味区分の解釈ができない初学者のばあい、連語や複合語、活用型による項目立てが役立ちます。解説は平易で簡潔にし、例文・用例などで理解を補うのがよいでしょう。
さらに、年少者や非ネイティブの初学者などには、実用的で豊富な基本語彙の用例が有用です。古典からの用例や、国会答弁や法令は著作権や正確性については安心できるものではありますが、現代に生きる者がコミュニケーションとして用いるには、古すぎたり複雑すぎたりします。著作権を考えると長い文章を複製することはできませんので、クリエイティブコモンズでリリースされている編集校正を経た文章や、作文とその検証システムも取り入れるべきではないでしょうか。このように、全方位をカバーするように編纂していきます。ただ、高度な内容については、全てが理解されなければならないわけではありません。
実際のところウィクショナリーはどのような人が使うケースがおおいでしょうか。最初はオンライン辞書検索を使う人たちでしょう。項目によっては Google 検索で上位にくるものも散見されます。使用例を探してみると、ウィクショナリーを引いているブログやツイートも多少あります。それらはしばしば単漢字項目、ことわざ、故事成語などでした。興味本位的な使い方(悪い意味ではない)としては納得できます。故事成語の由来や字源を知ることは面白いものです。特に Commons の古代中国文字プロジェクトの画像は sexy だと思います。
辞書という性格から、ウィキペディアほど爆発的な成長は期待できないかもしれませんが、成長してくればいずれ知名度はあがっていくと思います。より促進するためには、リンクを(適切に)増やしていくのがよいでしょう。Googleは検索のスコアに被リンク数を組み込んでいますし、ウィキペディアからリンクをしておけば、ウィキペディアの項目を見た人がウィクショナリーを訪れることもあるでしょう。また、基本を押さえつつも、ウィクショナリーは特徴を打ち出していくことになります。ネットをサーベイしていると、漢和辞典が狙い目のニッチだと思いました。
検索性を高めることも重要。
- 網羅性の重要性。ぐぐって、ウィキペディア見ればわかるだろう、的な、ここで調べればあるだろう、という信頼性みたいなもの。選択と集中は必要か、あるいは可能か。
ウィクショナリーでできること:ウィクショナリーからの提案
編集言語の保存
編集言語の保存を目的とする。自然言語については、たいていの場合収録が可能です。例えばアイヌ語のように話者が減少し、その存続が危ぶまれる言語を保存することを目的として参加することもできます(Wiktionary:ウィキプロジェクト アイヌ語)。なお人工言語については、安定的な話者コミュニティの存在が必要です。
ことばの進捗を捉える
編集辞書は旧態依然としていて古くさいもの、というイメージがあるかもしれません。たしかに「正しい」ことばを示すことは辞書の重要な役割で、おいそれと流行に流されてはいけません。しかし辞書が進捗しないのかというと、それは誤りで、電子化はもちろんのこと、コンテンツ面でも、コーパスを収録するなどいろいろな工夫や試みがなされてきています。ただし、それでも更新速度は相対的に遅く、ことばの変化にはなかなか追いつけません。ウィクショナリーはウィキですから、自前の検証方式を確立できれば、類を見ない実用辞典になるでしょう。
コミュニティについて
編集個々の編集者の総体として、コミュニティがあり、それは単なる合計よりも大きかったり小さかったりする。
すぐれた辞書コンテンツを作り、公開するのがウィクショナリーの第一義であるが、それに携わるのはボランティアの人々であるため、コミュニティについて配慮することは重要である。辞書編纂にあたって言語学や専門分野の知識が有用なのは言うまでもない。オンラインサービスであるため、加えて、ウェブ関連技術のサポートも大きな役割をもつ。また、ウィクショナリーは著作物を扱う上に、コピーレフトであるため、著作権に関する判断が求められる場合もある。オーソドックスな法的知識に加えて、コピーレフトに関するサポートも重要である。そういった知識・能力のある人を巻き込んで成長していく。
想定編集者
編集誰でも編集できるとはいえ、そのための能力・知識・努力は必要である。年齢による線引きではない。調べ、理解し、書き出すという作業を真摯にできるかどうかだ。しかしあまりハードルを上げすぎるのも現実的でない。
ウィキペディアにも語学、語彙に興味のある人はいるだろう。MediaWikiでのウィキ編集に慣れた人の方が何かと都合が良い。一方、ウィキペディアにとらわれたままだとウィクショナリーの意義が理解できない。
仮に外部から専門家に参加していただけるとして、いきなりウィクショナリーに触れるとなると、運営方針の理解やテクニカル面で心もとない。
いずれもガイドラインとサポート体制は用意すべきだろう。まったく放置してうまく行くとは思えない。過干渉もゆがみを生む。適切な土と水と光。環境を整えて、ときどき雑草をひき、剪定する。
百科と辞書では、編集者のパイの大きさがちがうか。編集者(作るのに興味のある人)は百科>辞書であるのに対して、利用者(必要としている人)は百科<辞書。たとえばウィキペディアがサブカルチャー大百科として発展していることはわかりやすい例示だ。ウィキペディアとのアナロジーで考えると、ウィクショナリーはメインカルチャーの編集者のみで構成される。だが、ウィキペディアとのアナロジーにとらわれるのは止めた方が良さそうだ。ウィクショナリーも別の視点から見れば十分ロングテール事業である。
人材の獲得
編集スヌーピーも言っているように、今現在の手札をもとにゲームをプレイしなければならない。多様な人材の定着と獲得を試みる。どうすればそれができるか?
ウィキメディアプロジェクトは無償ボランティアである。したがって、報酬は、楽しさや、やりがい、自身の成長・向上の実感ということになる。ゆえに、楽しんでもらう、達成感を感じてもらう、成長を味わってもらうようにすれば、定着していく、、かもしれない。行動は自発的でなければ続かない。適切なコミュニケーション・協力は大事。強制されれば急速に腐っていく。得意なことを楽しんでやってもらうのが良いと思う。自分は楽しいからやっている。楽しいっていうのは、表面的なものだけじゃなくて、英語で enjoy! って声をかけるような、苦労を含めての楽しさ。(ほんとにそれだけか?やらずにいられない何かがある気もする)
能力のある人が重宝されるのは当然だが、オープンコンテントであるからには、人材は多様であるのが健全。特に欲しいのは、言語関連の専門知識がある人、学術専門分野を持っている人、翻訳実務家、作家、出版に詳しい人、スクリプト書ける人、自前サーバ立てててボット動かせる人、HTML/CSSに詳しい人、PHP/MediaWikiに詳しい人、データベースに詳しい人、(ウェブ)デザインのセンスがある人、法律(特に著作権)に詳しい人、日本語を母語としない人、多言語版の事情に明るい人、ウィキメディアプロジェクトに精通している人、細々した作業の好きな人、コミュニケーション能力の高い人、調停のうまい人、建設的に議論のできる人、批判・質問の上手な人、プレゼンのうまい人、向上心のある人、行動力のある人、初学者、元気な人、素直な人、影響力のある人のことばもちゃんと疑ってかかれる人、そういうダブルバインドに惑わされない人、ニワトリの鳴きまねがうまい人 etc..
過干渉もいけないし、無関心もしかり。この辺のバランスは個人によって違うが、レンジに入っていて欲しいと願うのは、日本人的感覚か。上手にやれる人は良い。バランス感覚に優れた人も良い。たまに引っ掻き回すひとも、まあ良い。やりすぎてもやり直しは、たいていの場合できるだろう。
メリットと動機
編集参加のモチベーションは楽しさや、やりがい・達成感、自身の成長・向上の実感。あとは所属欲求や承認欲求の充足か。後者を否定する必要もないが、しかしそれをメインにしてしまうと、その人は不健全な状態に陥るだろう。
辞書を作る過程(調べて、理解し、まとめる)で、自分の知識が広がり深まることは確かだ。議論をすれば、自分の意見を通すためのロジックやレトリックの作り方、議論力も身に付く。コミュニティのコーディネートやオーガナイズはいろいろな場面で応用がきく。普段は接点のない種類の人間とふれあうこともできる。
利用者の活動サイクル考察
編集利用者の揺籃から墓場までを分析してみる。
- 成長期:なんでも目新しく、おもしろい。目標設定があり、それに向けて動いている。苦労は、むしろやりがい。
- 安定期:やりたいことをやって、ふっと一息。周りが見えて、新しいことを探したりする。探し当てたらまた成長モードへ。あるいは管理作業をしたり、他者に干渉したり。
- 倦怠期:安定から変化がなければ自然と倦怠する。それは慣れのため。また他人との摩擦によるストレスでここへの移行は促進される。ダークサイドに落ちやすい。
- 休止期:また戻ってくれば休止だったし、そのまま出て行けば exit。梅雨明け判断みたいなもの。興味の変化、失望の度合いなどでさまざまなケースがあるだろう。去る者は追わず。
自己管理として最も有効なのは「倦怠期」にいる時間を短くすること。つまり疲れを感じたら、すぐにリフレッシュする。ちょっと休んだり、気分転換をする。これを妨げるのはいわゆるウィキ中毒で、手を出したくないのに、RCやWLを見たりしてしまう。そういうのはさくっと止めるのが吉。強制的にでも他のこと、本業や日常のことに、フォーカスしてすごすべし。あとはこまめに目標設定をして成長モードにいる時間を長くする。成長モードではストレスがあっても疲れない。自分も成長する。
自立・協同・干渉
編集コミュニティのなかで、個人の資質としていちばん大事なのは、自立していること。自分の考えをもっていること。
他人に振り回されないこと、他人に依存しないこと。根気強さも大事だが、思い詰めたり、抱え込みすぎたりしないこと。自立した上で、自発的に協力するのが理想。過干渉、依存、迎合、なれ合い、過度の期待は疲労と倦怠をまねく。あとは楽観性。
全体を活性化するには、動的コンテンツをうまく更新したり、優れた編集をしたりして刺激を入れる、間接的に。他方でコミュニケーションも大事。無反応はゆっくりと行動を減衰させる(荒らしに対しては有効)。ただ、人によって使える時間資源が異なるので、ラグは寛容に。
新規参入時にもっとも大きなハードルがある。そこのフォローをする。コストダウンのためには、ようこそページとウェルカムメッセージ、FAQの充実。あとは、なにかチュートリアルを作るといいかな。ガイドラインがなくても調査読解力があれば自分でなんとかするものだが、そうもいかない。しかし手取り足取りまではしない。文書を読んでもらい、ある程度の理解力を要求するの妥当だろう。
どうすれば自立を促せるか?
強制介入
編集他人の行動を抑制しなくてはならない場合がある。それが起きにくいように、ルールが理解されやすいよう準備する必要はある。しかし、それでも強制介入のケースは起こる、必ず。それがウィキであり、ネットである。いな、世界であり、人生である :D~
直接他人に負の干渉をする場合は、叩きつぶそうと思わないこと。どんなに小さく見えても、つぶそうとすれば反発する。理解と敬意をもって接する。特に、にがくても理解したことを示さなければ、こちらの言うことを聞き入れてはもらえない。
想像すると良い、自分の言うことを聞かない人に言いたいことがあったら、自分ならどうするか。同じことを言い方をかえて繰り返し言うのではないだろうか?干渉するのであれば、あなたの言うことは、これこれですよね?と相手の言っていることを理解していると示すことはとても大事。理解することと受け入れることは別のフェイズ。言いたいことはわかったが、こういう理由でダメ、ということははっきり言って良い。あるいは、言ってることがわからなければ、確認する。斜に向かって揶揄したり面子をつぶすような言動は逆効果になりうる。ファーストコンタクトで失敗すると、ややこしくこじれかねない。常にまっすぐ言う。ピンポンダッシュみたいなのはだめ。
明らかな荒らしでも理論派の場合は同じだと思う。余計なことは言わない。あらゆる反応がエサになる。少し時間がかかっても、こちらからボロは出さず、手順通りに結論しつつ進めていくのが最短。無理なショートカットを試みるべからず。コミュニティが健全であるうちは決着に持ち込める。感情に任せて動くべからず。flameは書いてから一晩寝かせる。flameは自身の信頼を損ねる。議論を見ているのは自分と相手だけではない。あと、荒らしも承認欲求で動いているばあいは、理解されればあるていど満足するケースもある、ような気がする(ようしゅってん。
なお、以上は相容れず両立できない意見の場合である。通常のケースでは、まずは両立できないか、妥協点を探すのが最初にすること。だめだからだめ、のようなことは言ってはだめ。なぜならだめだから。ただし、逐一説明せずとも、文書を整備しておくことで、参照して理解することを要求するのは良いと思う。説明できる能力のある人が疲れきることは避けたい。多様さと寛容さも大事だが、能力のある人の情熱こそプライスレス。
リーダーは必要か
編集不要。不可能。
議論ごとにオーガナイザー・ファシリテーターは必要。
辞書編纂のロジスティクス
編集著作権切れ辞書からの転写。
コーパスを実装できないだろうか。
ボットでして欲しいこと
編集コンテンツとは異なり、ボットなどのテクニカルなことはユニバーサルである。したがって、ウィキペディアのボットプロジェクトにお願いすれば、協力を得られるかもしれない。
- 特別:存在しないページへのリンクの代替ページを定期更新。
- 各種統計データの記録。まあ、おおざっぱにはザクテ統計があるが、ローカルならではの savvy で slick なやつを。
- アクセス統計。
- ウィキペディアとウィクショナリーの項目の比較。言語の項目、曖昧さ回避など。で、リンクがどういう状況かを把握したい。可能なら自動投稿。
- 単字項目の自動投稿。繁体字とかハングルとか、結構残っている。
- あとは書式が決まったら、整形を。
- コモンズに文字画像があがっていて、こちらで読み出していない単字項目のリスト作成。できれば自動投稿。
- ひらがなで和語項目ができているものについて、漢字混じり表記項目のリスト作成。できれば項目も自動作成。
- 他言語版で項目があるが、日本語版ではリダイレクトになっている項目の一覧。interlang linkのためにソフトリダイレクトを作りたい。
- 単漢字項目へリンクしている項目から、その漢字を含む熟語をピックアップし、当該漢字項目の熟字セクションに追加する。ソートはソートキーで。
ボット使用にみる日本文化論
編集注意:このセクションはとりわけ妄言かもしれない。
他言語版に比べると、日本語版プロジェクトはボット投稿への依存が低い。ウィキペディアについては、どこかのレポートに日本語版がボットに頼らずに項目数を増やしてきたことに触れていた(ref見つからず。英文だったか?)。ウィクショナリーについても項目数増加のグラフでは、他言語版では急激な増加、つまりボット投稿、が見られるが、日本語版のグラフの傾きは一定である(WT:発表のデータをプロットしたもの@Twitpic, ザクテ統計)。ということで、これは日本語版の特徴なのである。
なぜ日本語版はボット投稿をあまりしないのか。日本語版のユーザーのほとんどは日本人であると言って良いだろう (Wikipedia Japanese Editor survey p.4)。日本の技術が劣っているということでは、おそらくないだろう。となれば、日本人のメンタリティーと関係があるのではないか。欧米、中国、たぶん韓国も、自分で手を動かすよりも、他人にやらせる方が高尚、という考え方がある。たとえば店を出して成功したら、自分は経営に専念して使用人を雇い、事業を拡大していくのを良しとする。もちろん、日本にそういう考え方がないわけではないが、日本では職人を尊ぶ。自分で手を動かす方が好ましいという考え方だ。この考え方により、ボット投稿を嫌う傾向があるのではないか。
たしかに、そこかしこのwiktで見られるempty entryには反発を覚える。ボットでは気の行き届いたエントリはむずかしい。しかし、以前のja.wiktでの単漢字のポストはどうだったろう?すばらしかったと私は思う。あれがなかったらどれだけの時間を割かなければならなかっただろう。ボット投稿は不完全なものであるにしても、それで人間が消費しなくてはならない時間を節約できるのであれば、ボットでできることはボットですべきだ。逆に、ボットでできることを逐一人間がすべきではない。もちろん、ボットのチューニングは大事だが。ゆえに、それができる優秀なボット使いは宝だ。職人技はボットが用意した台の上に生かせばよいのではないかと考える。
Bot activity@Wiktionary Statistics
他プロジェクトとの関係
編集交流は大事。日本語版のなかで、多言語間で、m:, mw:, foundation: とも。
日本語版のなかは、まあ、交流する人材はいる。en, de, fr, ko あたりはなんとかなりそう。
jawiktのイメージ
編集姉妹プロジェクトとウィクショナリーの関係と差異について
jawpが現代アートだとすると、jawiktは枯山水。個人的イメージ。
jawpは拡散、拡張するのに対して、jawikt は圧縮、鋭い穿孔。
プロモーション・広報
編集受け入れ態勢はおいとくとして、知ってもらうことは重要。どれくらい知られているのか?オープンソース界隈での知名度は低いらしい。言語学系では多少しられているか?ブログやツイートでたまに見かける。
ウィクショナリーの認知度についてアンケートをとりたい。どこで?
執筆依頼やコメントを集める場
助成金
編集言語学分野。例えば言語の保存で申請する。人を雇えるお金がいいな。民間とかで。
情報工学。
各種専門。ライフサイエンス辞書プロジェクトのばあい [1]
電子出版 or アプリとしてのウィクショナリー
編集ウィクショナリーで食う
編集プロウィキペディアンもまだいないわけだが。ウィクショナリーに限定するともっと難しいだろう。日本語版全体で考えた方がいい。考えやすいのは、まずライター。あと講演。
Construction
編集山盛り。いろいろあるけど、地に足つけて、着実に。
Ref
編集- 利用者:Electric goat/Sandbox - ns:Project 一覧
- 利用者:Electric_goat/sAndbox - ns:Help 一覧。Helpは技術系に特化。
- Category:ウィクショナリー: Category:公式な基本方針, Category:草案。整ってきたらプロジェクト文書のカテゴリも整備。
Axes
編集(=) は基軸、(-*) は各種文書への接続
- (2011-07-17) はじめて:MP=WC-*
- (2011-07-17) 日常活動:*-RC=CP-*
- (2011-07-17) 辞書コンテンツ:EP=MOS-*
- (2011-07-17) 議論:*-CP=VP
- (2011-07-17) パトロール:RC=AN
A
編集- Keep it simple. ルールをシンプルに保つ。できれば徹底的に、最小限に。屋上屋を積み上げる前に、その建物自体を見直せ。運営ルールの肥大はデメリットの方が大きい。ウィキペディアを教訓とせよ。
- Communication is key.
- ブロック中の会話ページの編集許可。
- Wiktionary:著作権: CC対応。
- ウィキプロジェクト引水:ウィキペディアの○○語からはカテゴリ:○○語へリンクつける。曖昧さ回避からもこっちにリンクする。
- Wiktionary:発表、Wiktionary:コミュニティ・ポータル/ニュース、Wiktionary:編集室/告知。住み分け。収集すべき統計データのアイテムは?
- オートパトローラーの導入:mw:Help:Patrolled_edit, m:Meta:Autopatrollers: en:Wiktionary:Votes/pl-2008-09/Whitelisted users autopatrol, en:Wiktionary:Beer_parlour_archive/2008/August#patrollers, en:Wiktionary:Grease_pit_archive/2007/October#new_auto-patrol
- インポート対応を増やす。enwikt. Transwiki: 名前空間。
- Wiktionary:中立的な観点: 重要と言えば重要だが、ウィキペディアと違って、ここではあまり問題にならない。あまり前面に出さなくても良いのでは?……と思ったが、現状は幸運にも問題が起きていないだけ、と捉えておいた方がよい。
- メインページをns:4へ。
- MediaWiki:Sp-contributions-footer
- CU導入:まずは参加者を増やす。
- en:Wiktionary:Feedback:まだだろうな。
- 文中での姉妹プロジェクトへのリンクを明示するアイコン、テンプレート。ようこそ用。{{sisters|w|ja|ウィクショナリー}}みたいにすると、リンクとアイコンがつくようにする。mw:, m:, foundation:なども用意。ようこそにしかつかわないなら、いらないか。
- カテゴリ未導入:特別:カテゴリ未導入のカテゴリ, 特別:カテゴリ未導入のファイル, 特別:カテゴリ未導入のページ, 特別:カテゴリ未導入のテンプレート
- 運営・管理関連のハブがあると良いか?CPで十分?とりあえずCP。あるいはAN。
- 管理者信任投票を3/9月にするとか。サブページを使うとか。
- m:Standard_archival_system - 導入?
- ウィキプロジェクト:常設以外にも、期限付きプロジェクトがあってよいかも。例えば発音を追加していくプロジェクトなど。そしたら プロジェクト 名前空間が欲しい。
- MediaWiki:Titleblacklist (mw), Spam-blacklist (mw), 作成禁止
- enwiktのadditional ns
- Thread Thread talk
- Summary Summary talk
- Appendix:付録
- Concordance Concordance talk
- Index:索引
- Rhymes Rhymes talk
- Transwiki Transwiki talk
- Wikisaurus:シソーラス
- Citations Citations talk
- Sign gloss Sign gloss talk
- w:内部統制もどき。
C
編集利用しやすさは、制作者の論理ではなく、使用者の論理で見直さなければならない。見つけやすさと読みやすさに配慮する。前者は検索性、カテゴリ、リンク(文中および(ソフト)リダイレクト)によって実現する。長い場合は言語節ごとにTOCが必要かもしれない。後者は書式・レイアウト・デザインの洗練、ふりがなやピンインなどの補助を要する。まずは凡例を整備。将来的には書式を統一して専用ビューアで解決だ。(その点、OmegaWikiにアドバンテージがある)
- Wiktionary:見本項目: ようするにこれが凡例だ。雛形はあった方がいいと思うけど、Wiktionary:新規記事作成よりも、見本を出した方がいいんじゃないかと思っている。見本へのリンクのみにするか、見本の解説もつけるか。後者は読者フレンドリーだが、メンテコストが発生する。MOSは2段階で考える。一つは最小限の、もう一つは完全なもの。前者は比較的むずかしくない。後者は難しい。たとえば語源が複数ある、非常に多言語、複数の品詞、訳語の対応が複雑、など。いくつかピックアップして完全な項目を目指してみる。
- リンクの仕方マニュアル。リンクはウィキ・ウェブの根本であり、その様式は重要。
- Wiktionary:編集方針 (EP):【定義】語彙収録についての中心。結構まとまっている。【作業】各論の議論をつめていく。
- Wiktionary:出典を明記する: まだ手を付けてないんだ。
- CCライセンスの論文から例文として引用するには?
- 漢字リンク用テンプレート
- 分野も管理した方がよいか。紙でいう略語表みたいな。しかし、汎用辞典であり専門辞典でもあるので、どこまで細分するのが適切か。あとカテゴリ付きテンプレートも用意するとよい(以前あったと思うけど、なくなった)。
- シソーラスの書式。選択、重複、漏れをどうするか。独立名前空間を使うか。個々の項目で関連語を追加すると重複が大きく、メンテナンスも大変。
- 熟語逆引き機能:単漢字からのリンク。
- 方言の収録。
- 古語の扱い、分類:上古語、中古語、近古語、近代語と現代語の示し方。言語節、カテゴリどうする。なんか議論があったような。
- 連語でも項目を作る。
- 例文:コーパスは技術的サポートがないと厳しいが、コロケーション(ありがちな名詞と動詞のくみあわせ)については、短い句の作例を複数載せるのはどうか。著作権に触れないほど短く切り出せば、たとえば新聞からでも可能ではないか。用例は短くても有効である(e.g. 『言海』)。ふねで試してみよう。コーパスについては検索結果へのリンクを表示する手は有効そうに思える。
- 日本語の発音、アクセント:NHK日本語発音アクセント辞典、方言辞典の類い。
- 表現句の収録:例えば、よろこぶにうきうきなどのオノマトペ。
- Wiktionary:Templateの一覧: 特に辞書コンテンツに関するもの。すでに把握できなくなっている。少なくともカテゴリ付けはしないといけない。Templateを使う意義について根本的に考えなければない。書式統一によるセマンティックの基礎であり、作業効率の向上に寄与するものである。
- Wiktionary:新規記事作成: テンプレート直さないと。これは最低限のフォーマットしか用意できない上に、冗長のように思う。帯に短し、たすきに長し。
- 日本語を母語としない人向けには、動詞などの活用ごとの項目が必要ではないか。あと表記の揺れ。少なくともリダイレクトかソフトリダイレクトは必要だろう。
- 訳語の言語順は50音がよい。ボットでソートするか、enwiktのような追加形式を導入するか。
- セクションの順番と階層:語源が複数あるときの階層の深さ。英語:発音->解説。日本語:解説->発音。多言語なので、それぞれの慣例で異なるが、統一は可能か?
- 関連語の位置づけ。類義語/対義語や派生語の上位なのか、独立の「関連した語彙」なのか。
- Wiktionary:著作権切れ辞書の一覧: 取り込んで整形してボット投稿してほしい。例文に使えるリンクも追加したい。
- 基本語彙の基準、分類、リスト: 基本項目の充実。そもそも基本語彙を3万くらいまじめにリスト化すべきではないか、プロジェクトあたりで。例えば漱石の作品を形態素解析して語彙をリストし、回数の多いものからピックアップするとか。Wiktionary:日本語の基本語彙1000
- 執筆依頼/ja: 作成、整理。
- 整理:特別:使われていないファイル
- 名前空間新設: 索引・発音・基本語彙などのコンテンツそのものは、付録名前空間がふさわしい。あと transwiki:
- 日本語を母語としない初学者向けの配慮。
- 発音:en:Template:ja-accent-common NHK方式を実装。
- 漢字混じり表記は日本語_漢字混じり表記にすべきか。
- 同音異義を同音異義語へ移動。語の有無は何か議論があったような気もするな、はて。
- 英英辞書を考えてみると、ネイティブ用とノンネイティブ用は方針が異なる。jawiktはどうするか。
T
編集- ヘルプ:目次
- 【定義】ヘルプのハブ。
- 【作業】シンプルにまとまってはいるが、位置づけがあいまいなので、再定義が必要。いまのままならCP、WC、またはテンプレート:Welcomeで十分。技術系文書に特化。
M
編集メインページ
- 【作業】解説はようこそへ。検索性の向上。WOTD復活とか。
- テンプレート:ようこそ
- 【定義】新規アカウントに対して必要な情報を提示する。
- 【作業】あれもこれも、ではなく、リンクを厳選すべき。CP/RC, MOS/EP。あとは、習得した言語とか、興味のある分野とか、持っている辞書辞典についてのアンケートをつけておくと、参考になるかもしれない。他にも、例えば100項目編集したら「テンプレート:ありがとう or おめでとう」みたいなのをもう一回なげるとかいうアイデアもあるが、それはやめ。テンプレートですべきことでもない。
- 【関連】Wiktionary:バベル
- Wiktionary:基本方針とガイドライン (POL)
- 【定義】?
- 【作業】シンプルにまとまってはいるが、古いので見直しが必要だし、位置づけがあいまいなので、再定義が必要。方針・ガイドラインのエッセンシャル版にするか?ここにいろいろ集積して巨大文書にしてしまってもいいのでは?en:Help:Contentsみたいな形式はどうか。
- Wiktionary:連絡先
- 【定義】プレス・外部メディア向け。
- 【作業】未定。まだその覚悟も体力もない。と思う。ある人はどうぞ。
- Wiktionary:FAQ
- 【定義】FAQを集積する。
- 【作業】編集室での議論のまとめとか?
- 一覧が不要である理由。
- 【関連】Wiktionary:案内文
External
編集以下はメモであり、使用を推奨するものではない。
Online dict
編集App
編集- Wikipanion: iPod, iPhone, iPad 用のアプリ。ウィキペディア、ウィクショナリーを閲覧。
よみもの
編集- 国立国語研究所 編 『辞書を知る (新「ことば」シリーズ22)』 ぎょうせい (2009/4/1) ISBN 4324086490
- 倉島長正 著『国語辞書一〇〇年―日本語をつかまえようと苦闘した人々の物語』おうふう (2010/05) ISBN 4273036053
- 木村哲也 著『辞書という本を「読む」技術 (研究社ブックスget it)』研究社出版 (2001/02) ISBN 4327279161
- 田畑孝一 著『ディジタル図書館 (図書館・情報メディア双書)』勉誠出版 (1999/10) ISBN 978-4585002130