めかぶ– tag –
-
textminig
RMeCab(R-3.1.2 for Windows)のdocMatrix関数Hack4選。川端康成「雪国」の序文を形態素解析してみた!
日本語テキスト解析を行うRMeCabには、docMatrix関数という便利な関数があります。これは、docMatrixは、第1引数で指定されたフォルダ内のすべてのファイルを読み込んで、ターム・文書行列を作成する、いかにも形態素解析っぽいナイスガイな関数です。 今... -
textminig
R言語(R-3.1.2 for Windows)のインストールからRMeCabによる日本語文章の形態素解析(品詞分解)まで
そろそろ本気でテキストマイニングをやりたくなってきました。そこで今回は、全くゼロの状態から、R言語をWindows8.1にインストールして、RMeCabで簡単な日本語文章を、品詞分解するところまでやってみたいと思います。 基本的用語について R言語は、ドッ... -
textminig
形態素解析を利用するための参考ページまとめ15選。Twitterのつぶやき中にあるキーワードをランキングしたい!
TwitterのSearchAPIで拾ってきたつぶやきに、どんなキーワードがいくつ含まれているか、カウントしてみたいと考えています。具体的には形態素解析という技術が必要で、この方が艦これをテーマとして解析されています。 形態素解析なんてはじめて聞く言葉で...
1