IPA辞書品詞体系ベースの辞書への語彙追加のための動詞の活用
ちゃお……†
まいおり……†
(この記事を書き始めた2018年当初は) NLPをするときに多くのタスクではどこかの段階で形態素解析をするかと思います。なので形態素解析の時点で間違っていると後段の処理も上手くいかないため、思ったような結果が出ないことがあります。たとえば、本来「動詞」であると識別すべき文字列を「名詞」と識別してしまったら困るケースがあります。そのため、誤識別しないように辞書に語彙を追加することがあります。
しかし、動詞の活用って本来は中学生の時に学ぶはずのものですが、意外とこれが出来ない人が多いなと感じます。(教師ガチャや家庭環境ガチャや出生ガチャ外れたり色々あるかと思います。) そこで、今回は動詞の活用について説明したいと思います。ただし、あくまでもIPA辞書品詞体系ベースの辞書への語彙追加を目的とした動詞の活用の説明とします。そのため、既に辞書に採録されているような「いる」「くる」「する」などの例外的な語についての説明は省略します。
基本的な考え方
未然形
まずは一番覚えにくそうと思われる未然形についての説明です。未然形は文字通り「未だ」「然り」、つまり「まだそのまま」なことを表現する時に使われる活用形です。たとえば「読む」の未然形は、まだ「読む」をしていないので「読ま (ない)」です。「書く」の未然形は、まだ「書く」をしていないので「書か (ない)」です。「読まない」「書かない」など、後ろに「ない」を付けた時に自然だと感じれば大体そうです。
この特徴に着目して、「読まない!」「書かない!」など否定的な言葉の活用形と覚えるのもいいでしょう。
連用形
次に難しいと思うのが連用形です。「用言」に「連なる」活用形です。「用言」とは動詞や形容詞、形容動詞、助動詞のように活用する語を示す言葉です。「読み (ます)」や「書き (ます)」のように後ろに助動詞「ます」を付けた時に自然だと感じれば大体そうです。
連体形
「体言」に「連なる」活用形です。「体言」とは「体言止め」という言葉が有名で、名詞や数詞などの活用しない語を示す言葉です。体言は、さっきの用言と逆の言葉ですね。「書く」人、「読む」時など後ろに名詞を付けた時に自然だと感じれば大体連体形です。
仮定形
名前の通り何かを仮定する時に用いられる活用形です。「書け (ば)」「読め (ば)」など後ろに「ば」を付けた時に自然だと感じれば大体そうです。
命令形
名前の通り命令する時に用いられる活用形です。「書け」「読め」など。
とりあえず妖花というバンドのSEEKというアルバムの帯に書かれてありそうなら命令形です!(雑な説明)
終止形 (基本形)
MeCabやMozcの辞書では「基本形」といいます。つまり、そのままでいいよ。 (めんどくさくなってきた)
その他の活用形
命令i
IPAdicに載っているので充分だと思うので割愛。
命令e
基本形の末尾を、子音はそのまま母音をエ段に置換したものです。「間違う」なら「間違え」、「ぬすむ」なら「ぬすめ」。
命令yo
命令形で「よ」に接続するもの。「伝える」なら「伝え (よ)」。
命令ro
命令形で「ろ」に接続するもの。「伝える」なら「伝え (ろ)」。
連用タ接続
「だ」や「で」と接続する連用形です。「読ん (だ)」「病ん (で)」など。
未然ウ接続
助動詞の「う」と接続する未然形です。「読も (う)」「書こ (う)」など。
未然レル接続
「れる」に接続する未然形です。たとえば「律する」の未然レル接続は、「律せ (れる)」です。
文語基本形
文語 (書き言葉) の基本形です。たとえば「制する」の文語基本形は「制す」です。
仮定縮約1
仮定形を縮約したものですが、実用的には連用形の末尾に「ゃ」をつけたものと覚えると簡単です。「引き戻す」なら連用形は「引き戻し」なので、仮定縮約1は「引き戻しゃ」になります。
体言接続特殊
体言に接続する特殊な活用形です。基本形の末尾を「ん」に置換したものです。たとえば「泣きぬれる」だったら「泣きぬれん」になります。
体言接続特殊2
ごめんなさい。これはわかりません。。。
n段活用
五段活用
五段活用の五段とは母音の「ア・イ・ウ・エ・オ」のことで、全ての活用形を通して末尾に母音の「ア・イ・ウ・エ・オ」全部使われていたら五段活用です。たとえば、「練る」は「練ら」「練り」「練る」「練れ」「練ろ」で「ラ・リ・ル・レ・ロ」が出てくるのでラ行の五段活用です。「読む」は「読ま」「読み」「読む」「読め」「読も」で「マ・ミ・ム・メ・モ」が出てくるのでマ行の五段活用です。
音便
五段活用の動詞の音便は、連用形末尾によって決まります。たとえば「基づく」の連用形は「基づき」なので「イ音便」です。ただし、「連用タ接続」の音便が「連用形」の音便より優先されるので、「出合う」の連用形は「出会い」だから「イ音便」ではなく、「出会っ (た)」などの「連用タ接続」の「促音便」となります。
五段・ラ行特殊
IPAdicに載っているので充分だと思うので割愛。
一段活用
一段活用の一段とは連用形の末尾がイ段あるいはエ段のことです。連用形以外の他の活用形はこれと同じか、またはこれに「る・れ・ろ (よ) 」を加えた形であるものです。イ段のものを「上一段活用」、エ段のものを「下一段活用」といいますが、IPA辞書品詞体系では区別されていないので、どちらも一段活用としてまとめられています。
一段,仮定縮約1
こちらも仮定形を縮約したものですが、実用的には連用形の末尾に「りゃ」をつけたものと覚えると簡単です。「持てる」なら連用形は「持て」なので、仮定縮約1は「持てりゃ」になります。
一段・クレル
IPAdicに載っているので充分だと思うので割愛。
一段・得ル
IPAdicに載っているので充分だと思うので割愛。
四段活用
現代では使われないので割愛。
下二段活用
現代では使われないので割愛。
上二段活用
現代では使われないので割愛。
変格活用
サ変
「サ行変格活用」の略で、「する」あるいは「ずる」に接続する「体言」を動詞化したものです。たとえば「得する」「涙する」などです。
サ変・−スル
上記の「する」に接続する方です。
サ変・−ズル
上記サ変の「ずる」に接続する方です。たとえば「命ずる」などです。文語基本形も「命ず」などとなります。
カ変
IPAdicに載っているので充分だと思うので割愛。
ラ変
IPAdicに載っているので充分だと思うので割愛。
自動化するにはどうすればいい?
とりあえず似ている語を借りて置換しましょう!それでうまくいかなかったらコスト調整しましょう。
たとえば、「ググる」という語を展開して追加したい場合は、似ている「くぐる」という語を検索して置換します。
$ nkf -w Verb.csv | grep ,くぐる,| tr "くぐ" "ググ" ググる,772,772,9279,動詞,自立,*,*,五段・ラ行,基本形,ググる,クグル,クグル ググら,780,780,9279,動詞,自立,*,*,五段・ラ行,未然形,ググる,クグラ,クグラ ググん,782,782,9283,動詞,自立,*,*,五段・ラ行,未然特殊,ググる,クグン,クグン ググろ,778,778,9279,動詞,自立,*,*,五段・ラ行,未然ウ接続,ググる,クグロ,クグロ ググり,788,788,9281,動詞,自立,*,*,五段・ラ行,連用形,ググる,クグリ,クグリ ググっ,786,786,9380,動詞,自立,*,*,五段・ラ行,連用タ接続,ググる,クグッ,クグッ ググれ,768,768,9279,動詞,自立,*,*,五段・ラ行,仮定形,ググる,クグレ,クグレ ググれ,784,784,9279,動詞,自立,*,*,五段・ラ行,命令e,ググる,クグレ,クグレ ググりゃ,770,770,9279,動詞,自立,*,*,五段・ラ行,仮定縮約1,ググる,クグリャ,クグリャ ググん,774,774,9283,動詞,自立,*,*,五段・ラ行,体言接続特殊,ググる,クグン,クグン ググ,776,776,9281,動詞,自立,*,*,五段・ラ行,体言接続特殊2,ググる,クグ,クグ