R言語– tag –
-
textminig
RMeCab(R-3.1.2 for Windows)のdocMatrix関数Hack4選。川端康成「雪国」の序文を形態素解析してみた!
日本語テキスト解析を行うRMeCabには、docMatrix関数という便利な関数があります。これは、docMatrixは、第1引数で指定されたフォルダ内のすべてのファイルを読み込んで、ターム・文書行列を作成する、いかにも形態素解析っぽいナイスガイな関数です。 今... -
textminig
R言語(R-3.1.2 for Windows)のインストールからRMeCabによる日本語文章の形態素解析(品詞分解)まで
そろそろ本気でテキストマイニングをやりたくなってきました。そこで今回は、全くゼロの状態から、R言語をWindows8.1にインストールして、RMeCabで簡単な日本語文章を、品詞分解するところまでやってみたいと思います。 基本的用語について R言語は、ドッ... -
textminig
ゼロから学ぶテキストマイニング。参考書籍・Webサイトまとめ9選。概要、仮説の構築、R言語、RMeCab、twitteRなど
先日、形態素解析に関するまとめ記事を書きましたが、いまいち煮え切れません。なぜなら、Tiwtterのつぶやきについて、形態素解析だけを行っても、それだけで何か面白い知見を得られるわけではないからです。 そこで、最近個人的に目をつけたのが、テキス...
1