ラベル 日本語 の投稿を表示しています。 すべての投稿を表示
ラベル 日本語 の投稿を表示しています。 すべての投稿を表示

2016年1月1日金曜日

日本語の形態素解析を利用できるようにする

このエントリーをはてなブックマークに追加
これは今まで個人的には何度もやってきてるんだけど、作業メモといった形で残しておく。


Mecab,IPADicのサイトから一通りダウンロードしてインストールする。

Mecab


# tar -zxfv mecab-X.X.tar.gz
# cd mecab-X.X
# ./configure 
# make
# make install

IPADic


# tar -zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
# cd mecab-ipadic-2.7.0-XXXX
# ./configure -with-charset=utf8
# make
# make install

MecabのPythonバインディングもインストールしておく。

Mecab-python


# wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# cd mecab-python-0.996
# python setup.py build
# python setup.py install

試してみよう。

$ mecab
2016年が始まりました
2016 名詞,数,*,*,*,*,*
年 名詞,接尾,助数詞,*,*,*,年,ネン,ネン
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
始まり 動詞,自立,*,*,五段・ラ行,連用形,始まる,ハジマリ,ハジマリ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS

できた、できた。

今日の作業

名刺のデザイン考えたりしてました。正月感一切ないや。