概要
編集利用目的
編集このボットは現在、ここ日本語ウィクショナリーにおけるアイヌ語関係の項目の自動化を目指すプログラムです。
運転方法
編集今のところ、特定なタスクに対し、手動でプログラムを作成し、動かします。基本的に非緊急な要件を低い間隔で編集する予定です。
運転原理
編集管理者利用者:Mkpoliによって書かれたPythonのプログラムを元に処理を行います。
タスク
編集アイヌ語項目仮置き発音を自動変換テンプレートに変換
編集概要
編集既存のアイヌ語項目の一部には以下のような記述が見られます。
==={{pron|ain}} === *{{IPA|...}} *{{X-SAMPA|...}}
以上のような記述を以下のような記述に置換します。
==={{pron}}=== * {{ain-IPA}}
背景
編集以前、アイヌ語の項目では発音を一時的に追加せず、発音テンプレートを仮置きする習慣があったと思われます。その一部は既に手動で置換されてきました。その置換を自動化することが目的です。
アイヌ語は文字を持っていなかったが、今ではローマ字やカタカナなどを用いて表記するようになりました。新しくできた文字体系なので、かなり音声的と言えます。そのため、アイヌ語のローマ字から自動的にIPAに出力できるテンプレート{{ain-IPA}}
等を以前制作し、更新してまいりました。これを用いることで、高精度でアイヌ語の発音を自動的に出力できるようになっています。
対象
編集対象は以下に一覧します。網羅した保証はありませんが、見つかり次第補足します。
対象(現在56項目)
- ahunpar
- ahunrupar
- amam
- annoski
- anokay
- anpe
- anutari
- aokay
- apeari
- apepasuy
- arsuy
- atkocike
- atuy
- ceppo
- cikappo
- e=i=
- ecioka
- eciokay
- eciutari
- epakasnu
- horkew
- husko
- icakkerere
- ikkakur
- ikupasuy
- ikure
- ikuruy
- inuye
- ipepasuy
- ipere
- iperusuy
- irara
- irwakutar
- isa cise
- isa nispa
- isitayki
- isoytak
- itanki
- itese
- iyohay
- iyotta
- kikir
- kina
- ku=i=
- more
- mun
- omanan
- payeka
- payekay
- piski
- sinrit
- sit
- so
- tanpa
- upaskuma
- utaroka
条件
編集- 有用である: 手間の節約になり、今後の編集の試験運用とします
- 無害である: リストは手動で検索によって得られたリストを基づいた、事前に定められた少量の項目を対象にし、変更後のテキスト結果のプレビューを人工的に検視し、変更後の項目はは人工ですべて点検します。
- 編集頻度が過剰でない: 1分間隔で編集させます
詳細
編集技術的にはPython 3.10.6によるスクリプトで、主にmwclient及びmwparserfromhellを利用します。
運転期間
編集2023年9月7日(木曜日)13:00より2023年9月7日(木曜日)14:00の範囲内