2012年6月21日木曜日

形態素解析の精度を上げる方法

日本語用のMeCab, Chasen, yahoo!形態素解析APIなどが有名だが、精度をさらに上げるにはどうすればよいかのメモ。

Wikipediaの見出し語を抽出してMeCabの辞書を更新する

なるほど、その手があったか。
他にも「はてなキーワード」やtwitterトレンドなどをうまく使う方法がありそうだ。
思い付いたときにこの記事を更新していこうと思う。

0 件のコメント:

コメントを投稿