利用者:Electric goat/wt
ウィクショナリーについて
編集まえがき
編集以下は日本語版ウィクショナリーについての私論です。自分の考えをまとめたくて書いています。ゆくゆくは説得力と魅力のある建設的で堅牢な論理を構築したいと思っていますが、長らく素材集めの段階です。未だに考えも文章もまとまっていません。
こころいき:志を高く、発想を自由に、課題を具体かつ徹底的に掘り下げつつ、ストーリーを簡潔かつ素朴に表現する。
はじめに
編集ウィクショナリーは、オープンコンテントな多言語多機能辞典です。つまり、辞書として収録すべきあらゆる言語のあらゆる語彙を収録しており、誰もが自由に使える辞書です。日本語版ウィクショナリーは、日本語を通してことばを理解しようとする人たちにとって、最高の手助けとなることを目指しています。世の中にはたくさんの辞書・辞典がありますが、本格的に作られているオープンコンテントな辞書はありませんし、多言語を対象として多機能に使える辞書もありません。現代日本語で書かれた信頼性のある辞書を編纂することが、日本語版ウィクショナリーの役目です。そしてウィクショナリーは参加者によって作り続けられています。
背景
編集ウィキペディアはインターネットアクセス数の上位にあるウェブサイトで、その存在が広く知られていることは、改めて例を挙げるまでもないでしょう。ウィキペディアはウィキメディア財団の運営するオープンコンテントな百科事典です。ウィキメディア財団は、知の共有をその使命として掲げています(Mission statement, ビジョン)。
ウィクショナリーは辞書的役割を担う姉妹プロジェクトとして作製され、同じくウィキメディア財団により運営されています。ウィキペディアの姉妹プロジェクトの中では最も古く、2002年に開設されました。日本語版の開始は2004年からです。現在、171の言語版があります(m:Wiktionary)。
辞書とは:その意義
編集ウィクショナリーが辞書であることは疑う余地がありません。そこで、まずは辞書というものについて考えてみます。
わたしたちはいろいろなことを知りたがります。何かを知ろうとして、誰かに尋ねたり、Googleで検索したり、ウィキペディアを見たり、本で調べたり、あるいは自分で研究したりします。それらの知識のほとんどは、ことばによって記述されています。本になるような知識はもちろんことばを使いますし、感性・感覚的なものである音楽や絵画を解説・批評するのも、ソムリエがワインを表現するのも、ことばによってです。口頭会話も、書籍も、手話も、点字もことばです。もう少し広げてみると、楽譜や数式もことばを使っていると言えます。
このように、ことばにすること、つまり言語化することが、思考や情報を伝達する上での基本であり、非常に重要なプロセスであることがわかります。ことばは知を構成する原子や分子のようなものです。そして、それらの「ことば自体」を扱うのが辞書です。ですから、辞書は知の土台になるものと言えるでしょう。
さて、それでは誰が、いつ、何のために、どのように辞書を引くでしょうか?
文章のプロ、学習者、一般人。辞書を使うケースは誰にでもあります。文章を執筆、翻訳するときには正確性を保持するために、既に知っていることばであっても、辞書を引いて確認します。ことばには多面性があり、新たな発見があるかもしれません。
また、より深く、より広く、そのことばを知るために辞書を引きます。語源、類義語、対義語、複合語、連語など、ことばのネットワークは、そのことば自体の理解を深めます。ウィクショナリーではハイパーリンクにより隣接する語彙へのアクセスが容易ですし、多言語を収録していますので、由来の他言語語彙へも簡単です。最初からたくさんのことばを知っている人はいません。例えば小学生のころは学習辞書を引いて語彙を増やします。また、ことばは新たに誕生してきますので、『現代用語の基礎知識』や『イミダス』などのように、新語についての需要に応えるものもあります。
ウィクショナリーはそういった要求に応えようとして、作成されています。
日本語版多言語多機能辞典とは:このユニークなスタイル
編集ウィクショナリーは日本語版の多言語辞典です。それは一体どのようなものでしょうか。普通の辞書とどう違うのでしょうか。
一般に外(国)語辞典は、外語と日本語の一対一関係です。一つの外語について、日本語で説明します。英和、独和、中日、仏日……、逆に和英、独和、日中、日仏……のように辞書が作られています。ウィクショナリーは、これらが一つにまとめられた辞書であり、これを多言語辞典と呼んでいます。
市販の紙の辞書にも多言語ものはありますが、分量の問題から本格的で網羅的なものはありません。また、オンラインサービスでは英、中などメジャーな言語については辞書がありますが、少しマイナーになると皆無です。Google翻訳は多言語に対応していますが、辞書として機能するとは言えません。
ウィクショナリーはあらゆる自然言語を収録対象としており、このような言語的ロングテールはウィクショナリーの大きな特徴の一つです。
多言語をどのように収録するかというと、同じ文字、同じスペルの語彙は、何語であれ、同じページに記述します。これにより、言語横断的にその語彙について知ることができます。また、借用語や外来語などの語源となった他言語の語彙にも簡単にアクセスすることができます。
これは一般の英和辞典などでもそうですが、日本語版ということは、日本語でない言語の語彙を日本語で説明することになります。他の言語と日本語は完全な一対一の対応関係ができるわけではありませんので、ギャップが存在します。そこで、例文や比較・文化的背景などの注釈も盛り込んでいくことになります。
次に多機能辞典について説明します。
辞書の種類には、国語、訳語、類語、語源、発音、用例、各種専門などがあります。ウィクショナリーはこれらをまとめて扱います。大辞典で見られる形式をとります。
一般辞典は相応の書式があり、専門辞典もまたそれぞれの書式があります。単機能ならシンプルですが、これらを合わせると、多言語多機能辞典では、書式が複雑で1ページが膨大な量になり、複雑になってしまいます。電子辞典では紙の辞典にあるページ数の制限はないと言って良いですが、可読性の点で課題があります。セマンティック化して専用の閲覧ソフトができるなどすれば、解決できるかも知れません。
コピーレフト・オープンコンテント:自由な配布が可能であること
編集ウィキメディアプロジェクトは知の共有を掲げています。ですから、そのコンテンツをできるだけ広く共有することを目指しています。それがオープンコンテントという状態であり、そのための仕組みがコピーレフトです(w:コピーレフト)。
コピーレフトとは、著作権を保持したまま、利用・再配布・改変を可能にするという考え方です。現在、ウィクショナリーはクリエイティブ・コモンズ3.0 BY-SAというライセンスを採用しており、このライセンスに従えば、誰でも無料で、自由にコンテンツを利用することができます(w:クリエイティブ・コモンズ)。営利目的についても禁止されていません。
Wikiというスタイル:誰もが辞書を編纂すること
編集ウィキペディアやウィクショナリーをはじめとするウィキメディアプロジェクトは、その名前に Wik(i) がついている通り、コンテンツの作成にはウィキを用います。ウィキはウェブ上で文書を編集できる技術・システムです。
基本的には、誰でもウィクショナリーを編集することができます。無理解が続いたり、破壊行為を行った場合は、編集の権利を失うことがあります。
これまで辞書は、言語学者などの専門家が編纂してきました。一見簡単に書いたように見えるとても短い文章でも、専門家が検証を重ねた末に書き上げているものです。ウィクショナリーはボランティアによって編纂されます。ボランティアは専門家とは限りません。むしろアマチュアが多くを占めるでしょう。そうすると当然、品質についての疑問が生じます。「素人がつくったもので大丈夫なの?」
オープンコンテントに対する指摘は、すでにウィキペディアに対して多くなされています。「なぜウィキペディアは素晴らしくないのか」で、たくさんのサンプルを見ることができます。ウィクショナリーとしては、素人が百科事典を作るウィキペディアが(問題はありつつも)受け入れられている、と答えることができます。ウィキペディアの「よくある批判への回答」がおおむね流用できるでしょう。
楽観的に考えれば、複数の辞書をあたり用例を検索するなどの検証をしっかり行えば、素人が作っても、大きく外したもにはならないでしょう。個人がネットで少し調べもののとっかかりとして使うような、学術的あるいは法的な正確性を求められない場合であれば、100点ではなくとも、70点以上を取り続けていれば、及第点と言えるでしょう。ただ、ことばを比較的少ない字数で定義する辞書は、より正確さが求められると考えた方がよいかもしれません。
品質を高く保つためには、根本的には、参加者の意識を高くする必要があります。そのためにはガイドラインの充実や適切なコミュニケーションを行っていきます。参加者が増えてくればそれでも対処しきれないことが増えてくるでしょうから、検証システムを活用することが重要になります。また、日々の最近の更新 (RC) のパトロールもかかせません。能力のある参加者であれば、加えられた変更を見て、その後の投稿に修正を加えていくでしょう。RCをチェックしていることで、いつまでも行動が修正されない参加者を見つけ出すこともできます(関連:Wiktionary:巡回)。
品質とは別に、著作権侵害を防ぐことも重要な課題です。先述の通り、ウィクショナリーはコピーレフトですから、著作権的に自由な再配布が禁じられたコンテンツを含むことができません。オンライン辞書は数多くあるので、これらからコピーが投稿されることは散見されます。この点についても、参加初期に十分理解してもらう必要があるでしょう。わかりやすいガイドラインを用意しなければなりません(メモ:Wiktionary:著作権をはじめとして著作権の記述が GFDL のままなので、アップデートが必要)。
中核となる基本語彙の作成はもちろん重要ですが、各人が自分でウィクショナリーを使用しながら、欠けていたところを埋めていくこともできます。これはオープンコンテントならではの、一つの現実的で健全な発展様式です。ウィクショナリーも少しずつでも成長していますから、活動が続いている限り、徐々に実用的なものになっていくでしょう。個人的にはわりと楽観的に考えています。
収録語数と編集方針
編集どれくらい収録すると使い物になる辞書として認めてもらえるでしょうか。市販の国語辞典を見ると、ポケット辞書が3万、小型(明鏡、新明解など)が6-9万、中型(広辞苑、大辞林など)が20-25万、大型(日国)が50万。英語最大の辞典であるオックスフォード英語辞典が収録語数約29万語、小見出しその他も含めると61万5千語。単純な比較はできませんが、英辞郎の英和データ (v.130 20110721) の見出しが184万です。ひとつの言語あたり、基本語彙で3万、全体で6万あれば、辞書を標榜できるでしょうか。
中型の辞書である広辞苑と新英和大辞典(研究社)をあわせると50万くらいになります。重複のない日本語と英語をあわせただけでも50万です。言語の数は開設されているウィクショナリーの言語版だけでも170、世界全体では5,000とも8,000とも言われます。仮に10万語を100の言語で収録したとすると、見出しは1,000万になります。もう一度数字を出しておきますと、広辞苑第5版の総項目数は24万です。ウィクショナリーの項目数の上限は計り知れません。現在は411,243項目が収録されています。
ウィクショナリーはあらゆる語彙を収録する。簡単に言うと、そういうことですが、現実的には「辞書として」という前提が隠れていて、制限は必然として存在します。「紙の辞書ではない」という文言が「ウィクショナリーは何でないか」にあります。でも、これは制約の完全撤廃を意味するものではありません。紙でないので、分量について気にしなくて良い、ということです。上で書いたように、1,000万を収録するとなると、紙の辞書では対応できませんが、ウィクショナリーでは気にする必要はないのです。
制約はどのようなものでしょうか。わかりやすいものとしては固有名詞についてです。例えば、個々のテレビ番組について、辞書に収録する必要はありません。ただし、現在、制約の対象になっている領域でも、その境界にはある程度の幅があり、いずれ収録しても良いものもあるでしょう。また、アクセス性を考えると、表記の揺れ、複合語、連語などは、積極的に収録するのが良いでしょう。しかし、その前に基本項目を網羅して、辞書としての基盤を確立することは重要です。なぜなら、辞書は、言い換えによることばのネットワークの一部を切り出して語彙の説明を行っているからです。そしてその根本を支えるのが基本語彙なのです。ウィキペディア的な路線もありましたが、基礎をおろそかにして、砂上の楼閣になることを避けるというのが、現在の日本語版ウィクショナリーの方針です。
ある言語について中型辞典以上になってきたら(実項目(空見出しを除いたもの)が20万を越えたら)百科的項目や新語・俗語・複合語等の柔軟な追加が可能ではないかと思います。知りたいことばが辞書になかったとき、がっかりするものです。時代の流れに追いつけるのがウィキの特徴です。それはできるだけ活かすのが Wiki Way でしょう(#ことばの進捗を捉えるも参照)。
想定利用者
編集せっせと作っても、使ってもらい、役立たなければ意義を失ってしまいます。どうすればよいでしょうか。
辞書のうち、国語、英和、和英はオンラインサービスの特に多い分野です。競合サービスが多いのは、百科事典であるウィキペディアと異なる点です。ウィキペディアはGoogle検索で上位にくることもあり、日常的に使われています。ウィクショナリーはGoogle検索で上位にならない場合も多いですし、ウィクショナリーの知名度は、まだウィキペディアほどにはありません。しかし、最近は統合辞書検索サイトであるWeblioに採用されており、徐々に知られるようになってきていると思います。
想定する対象利用者は、広く設定すれば初歩以上の日本語を解する人すべてです。ネイティブと非ネイティブでは解説に使用できる語彙の制限に差があります。また、教育を受けている生徒が必要な学習辞典と、社会に出た人が必要とする実用辞典では、求められるものがちがいます。まずは、非ネイティブや小中学生にも理解できるように配慮することは大事です。漢字にはふりがなによるサポートが重要です。意味区分の解釈ができない初学者のばあい、連語や複合語、活用型による項目立てが役立ちます。解説は平易で簡潔にし、例文・用例などで理解を補うのがよいでしょう。
さらに、年少者や非ネイティブの初学者などには、実用的で豊富な基本語彙の用例が有用です。古典からの用例や、国会答弁や法令は著作権や正確性については安心できるものではありますが、現代に生きる者がコミュニケーションとして用いるには、古すぎたり複雑すぎたりします。著作権を考えると長い文章を複製することはできませんので、クリエイティブコモンズでリリースされている編集校正を経た文章や、作文とその検証システムも取り入れるべきではないでしょうか。このように、全方位をカバーするように編纂していきます。ただ、高度な内容については、全てが理解されなければならないわけではありません。
実際のところウィクショナリーはどのような人が使うケースがおおいのでしょうか。まずはオンライン辞書検索を使う人たちでしょう。項目によっては Google 検索で上位にくるものも散見されます。使用例を探してみると、ウィクショナリーを引いているブログやツイートも多少あります。それらはしばしば単漢字項目、ことわざ、故事成語などでした。興味本位的な使い方(悪い意味ではない)としては納得できます。故事成語の由来や字源を知ることは面白いものです。特に Commons の古代中国文字プロジェクトの画像は sexy だと思います。
辞書という性格から、ウィキペディアほど爆発的な成長は期待できないかもしれませんが、成長してくればいずれ知名度はあがっていくと思います。より促進するためには、リンクを(適切に)増やしていくのがよいでしょう。Googleは検索のスコアに被リンク数を組み込んでいますし、ウィキペディアからリンクをしておけば、ウィキペディアの項目を見た人がウィクショナリーを訪れることもあるでしょう。また、基本を押さえつつも、ウィクショナリーは特徴を打ち出していくことになります。漢和辞典が狙い目のニッチだと思いました。
ウィクショナリーだからできること:ウィクショナリー(から|へ)の提案
編集言語の保存
編集言語の保存を目的とする。自然言語については、たいていの場合収録が可能です。例えばアイヌ語のように話者が減少し、その存続が危ぶまれる言語を保存することを目的として参加することもできます(例:ウィキプロジェクト アイヌ語)。なお人工言語については、安定的な話者コミュニティの存在が必要です。
ことばの進捗を捉える
編集辞書は旧態依然としていて古くさいもの、というイメージがあるかもしれません。たしかに「正しい」ことばを示すことは辞書の重要な役割で、おいそれと流行に流されてはいけません。しかし辞書が進捗しないのかというと、それは誤りで、電子化はもちろんのこと、コンテンツ面でも、コーパスを収録するなどいろいろな工夫や試みがなされてきています。ただし、それでも更新速度は相対的に遅く、ことばの変化にはなかなか追いつけません。ウィクショナリーはウィキですから、対応スピードを高めることができます。今後、適切な基準と検証方式を確立できれば、類を見ない実用辞典になるでしょう。