メディアテクノロジー&デザイン
Media Technology & Design 情報科学とメディアデザインに関するメモです。
2012年6月21日木曜日
形態素解析の精度を上げる方法
日本語用のMeCab, Chasen, yahoo!形態素解析APIなどが有名だが、精度をさらに上げるにはどうすればよいかのメモ。
Wikipediaの見出し語を抽出してMeCabの辞書を更新する
なるほど、その手があったか。
他にも「はてなキーワード」やtwitterトレンドなどをうまく使う方法がありそうだ。
思い付いたときにこの記事を更新していこうと思う。
0 件のコメント:
コメントを投稿
次の投稿
前の投稿
ホーム
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿