2016年3月28日月曜日

日本語形態素解析「Mecab」のインストール

「Mecab(めーきゃぶ)」は京都大学情報学研究科と日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットが共同で開発した形態素解析エンジン。
しかもオープンソース。
今回はMecabをインストールしたときのメモ。

インストール後にphpで利用できるようにした。

Mecabのインストール

Mecabを利用するにはMecab本体のインストールと、辞書のインストールが必要にになる。

Macabのインストーラーがあるディレクトリ

/usr/ports/japanese/mecab

#cd /usr/ports/japanese/mecab⏎ ←mecabのインストーラーが保存されている場所へ移動
#make config⏎ ←オプションはドキュメントをインストールするかどうか
#setenv iFORCE_PKG_REGISTER⏎ ←libiconvのバージョンを強制的に的に更新するために設定
#make install clean⏎ ←mecabのインストール

今回はlibiconvのバージョンが古かったため以下のコマンドで強制的にバージョンを更新するようにした。

ipa辞書のインストール

次にipa辞書をインストールする。
辞書をインストールしないと実行してもエラーとなる。

Macabのインストーラーがあるディレクトリ

/usr/ports/japanese/mecab-ipadic

#cd /usr/ports/japanese/mecab-ipadic⏎ ←ipa辞書のインストーラーが保存されている場所へ移動
#make config⏎ ←オプションはインストールするchersetを選ぶ
#make install clean⏎ ←ipa辞書のインストール

インストール可能なcharset「EUCJP」、「SHIFT-JIS」、「UTF-8」の3種類。

phpエクステンションのインストール

Mecabをphpで利用できるようにエクステンションをインストールした。

Macabのインストーラーがあるディレクトリ

/usr/ports/japanese/php5-mecab

#cd /usr/ports/japanese/php5-mecab⏎ ←phpエクステンションのインストーラーが保存されている場所へ移動
#make install clean⏎ ←phpエクステンションのインストール
#vi /usr/local/etc/php.ini⏎ ←viでphp.iniを開く
extension=/usr/local/lib/libmecab.so ←libmecab.soを追加後に保存して閉じる

libmecab.soが見つからない場合は、findコマンドで検索する。


find / -name "libmecab.so"⏎

Apacheを再起動

Apacheを再起動して設定を有効にする。

# /usr/local/etc/rc.d/apache22 restart⏎

0 件のコメント :

コメントを投稿

ご質問などあればこちらへどうぞ