形態素解析エンジンMeCabをMac OS Xにインストールする
新しいMacBook買いました.ついでに形態素解析も始めることにしました.Yahooの形態素解析サービスにお任せすることも考えましたが,初学者らしくMeCabを使うことにしました.ついでにPerlから呼び出せるようにもしたいですね.
MeCab用辞書をインストール
Finkはmecab-ipadicという名で辞書を提供しています.ただ,この辞書はutf-8で書かれてはいません.私はutf-8で処理をしたかったので,インストール前にちょっとした設定をしました.
まず/sw/fink/10.4/stable/main/finkinfo/text/mecab-ipadic.info をviか何かで開きます.viを使う場合は次のようにやります.
% sudo vi /sw/fink/10.4/stable/main/finkinfo/text/mecab-ipadic.info
ConfigureParamsに--with-charset=utf8を足します.足した結果は次のようになります.
Package: mecab-ipadic Version: 2.7.0-20060707 Revision: 1 Description: Japanese dictionary for MeCab License: BSD Maintainer: Todai Fink Team <fink@sodan.ecc.u-tokyo.ac.jp> BuildDepends: mecab (>= 0.91), mecab-dev (>= 0.91) Source: http://keihanna.dl.sourceforge.jp/mecab/20904/%n-%v.tar.gz Source-MD5: 45b9f822700ad4eceb6722d6edcc2a46 ConfigureParams: --prefix=%p --libexecdir=%p/lib --with-dicdir=%p/lib/mecab/dic --with-mecab-config=%p/bin/mecab-config --with-charset=utf8 CompileScript: << ./configure %c make << InstallScript: make install DESTDIR=%d DocFiles: AUTHORS COPYING NEWS README Homepage: http://mecab.sourceforge.jp/
その後,sudo apt-get install mecab-ipadicして終了.