言語処理

wikipedia dump を使って複合名詞を判定してみる

例えば「ウォークマン」を形態素解析器にかけると、mecabやChasenの場合だと、 「ウォーク|マン」と分けてしまう。 多くの場合、連接する名詞をくっつけて複合名詞とすればうまくいくけど、例外もたくさんある。 単純に連接名詞をとるだけだと、「世界最高新…

wiki dump を使って複合語を判定してみる

てst class Foo def bar 'baz' # return baz end end

perl WordNet::Multi 使い方 メモ

マニュアル引用 use WordNet::Multi;&WordNet::Multi::wnDbOpen("wnjpn-0.9.db"); @synsets = &WordNet::Multi::wnAllSynsets; @words_en = &WordNet::Multi::wnWord("02084071-n", "eng"); @words_ja = &WordNet::Multi::wnWord("02084071-n", "jpn"); @syn…

WordNet::Multiをインストール メモ

http://nlpwww.nict.go.jp/wn-ja/data/WordNet-Multi-0.1.tar.gz からWordNet-Multi-0.1.tar.gzをダウンロード ↓ 解凍 # tar xvzf WordNet-Multi-0.1.tar.gz ↓ 移動 # cd WordNet-Multi-0.1 ↓ # perl Makefile.PL PREFIX=Writing Makefile for WordNet::Mult…