形態素解析エンジンMeCabをMac OS Xにインストールする

新しいMacBook買いました.ついでに形態素解析も始めることにしました.Yahooの形態素解析サービスにお任せすることも考えましたが,初学者らしくMeCabを使うことにしました.ついでにPerlから呼び出せるようにもしたいですね.

Finkをインストール

MeCabFinkにパッケージがあるので,入っていない場合はFinkを入れます.

MeCabのインストール

% sudo apt-get install mecab

これでインストールできます.

MeCab用辞書をインストール

Finkmecab-ipadicという名で辞書を提供しています.ただ,この辞書はutf-8で書かれてはいません.私はutf-8で処理をしたかったので,インストール前にちょっとした設定をしました.

まず/sw/fink/10.4/stable/main/finkinfo/text/mecab-ipadic.info をviか何かで開きます.viを使う場合は次のようにやります.

% sudo vi /sw/fink/10.4/stable/main/finkinfo/text/mecab-ipadic.info

ConfigureParamsに--with-charset=utf8を足します.足した結果は次のようになります.

Package: mecab-ipadic
Version: 2.7.0-20060707
Revision: 1
Description: Japanese dictionary for MeCab
License: BSD
Maintainer: Todai Fink Team <fink@sodan.ecc.u-tokyo.ac.jp>
BuildDepends: mecab (>= 0.91), mecab-dev (>= 0.91)
Source: http://keihanna.dl.sourceforge.jp/mecab/20904/%n-%v.tar.gz
Source-MD5: 45b9f822700ad4eceb6722d6edcc2a46
ConfigureParams: --prefix=%p --libexecdir=%p/lib --with-dicdir=%p/lib/mecab/dic 
--with-mecab-config=%p/bin/mecab-config --with-charset=utf8
CompileScript: <<
  ./configure %c
  make
<<
InstallScript: make install DESTDIR=%d
DocFiles: AUTHORS COPYING NEWS README
Homepage: http://mecab.sourceforge.jp/

その後,sudo apt-get install mecab-ipadicして終了.