R

テキストマイニング

R

仕事でテキストマイニング実装することになりそう。久しぶりにMeCabと戦う。が、 今使ってる自宅PCになぜかMeCabがはいらない。 > install.packages ("RMeCab", repos = "http://rmecab.jp/R") Warning in install.packages("RMeCab", repos = "http://rmeca…

SEMの不適解

不適解が出てしまった時の対処。不適解とは、 ・推定値の絶対値が1以上 ・誤差分散が撹乱項の分散が0やマイナス など。これらは一般に論文には出せない。ただし「サンプル変動による不適解」と判断できれば、 論文に載せることも不可能ではない。 参考。 htt…

共分散構造分析2

昨日に引き続き、共分散構造分析の勉強。Rでsemパッケージがうまくいかないので、今日はlavaanパッケージと格闘。 2.lavaanパッケージ使い方は、semパッケージとあんまり変わらない。 ただ、モデルの記述方法が違う。モデルの記述方法 =~ 潜在変数の定義 ~ …

共分散構造分析

共分散構造分析をやってみた。ツールはRとAMOS AMOS student版(AMOS5.0)が無料でダウンロードできるため使用。 使い方は以下を参照。 心理データ解析第10回(2)だけど、student版はパスが54本までしか解析できない。 あと観測変数が8変数までしか使えない。…

共起ネットワーク

R

共起ネットワーク作成用Rスクリプト テキストマイニングでよく使われる語の共起ネットワークを トランザクションデータで使用してみた。今回もアソシエーション分析に使用したものと同じデータを使用。 行:ID 列:メディア名 値:メディアへの接触フラグ こ…

アソシエーション分析(バスケット分析)

R

アソシエーション分析実行用Rスクリプト 基本的にアソシエーション分析をするときは、データはlist型で定義したものを トランザクション型に変換(as(リスト名, "transactions"))して使用するが、 外部データ(csvなど)から読み込むときは、自動的にdata.…

疑問とその回避

R

apply関数を使って 行列処理をしてた時の エラーというか困ったこと func list2 for(i in 1:3){ if(list[i]==list[7]) list2[2,i] if(list[i+3]==list[8]) list2[3,i] } if(sum(list2[2,])==1) return(list2[1,list2[2,]==1]) else return(list2[1,list2[3,]…

因子分析その2

原因が本当にこれかは不明だけど「はい」「いいえ」みたいな二値データは 基本的には因子分析では扱われなくて、因子分析したいなら カテゴリカル因子分析ってやつを使うらしいhttp://home.hiroshima-u.ac.jp/keiroh/maeda/statsarekore/gedoufa.htmlテトラ…

因子分析

アンケート結果を因子分析して 因子を抽出しようとしているのだけど、なかなかうまくいかない 使っているのは、 factanal関数 factanal2関数(青木先生) fa関数(psychパッケージ) とかいろいろデータ形式は 「いいものは長く使いたいですか?」:「はい」…

クロス集計

R

以前に書いたtable()関数を用いて クロス集計が行えるentertainment-lab: Rのtable関数に関する調査ついでにここで扱われているcut関数とは 数値ベクトルを指定した区間に分類するための関数使い方は http://www.okada.jp.org/RWiki/?R%A5%D7%A5%ED%A5%B0%A5…

sort()とorder()の違い

R

並び替え関数 sort()とorder() 違いが書かれてるサイト。ああああ: R: sort と order の違い

度数分布

R

度数分布を表示する関数 table() > table(iris$length) 4.3 4.4 4.5 4.6 4.7 4.8 4.9 1 3 1 4 2 5 6 irisデータのlengthの度数分布 >table(iris[1]) でもいける(lengthが一列目) xtabs() > xtabs(Freq~Inocome,data=dataBox) Income 0-50 50-100 100-150 >…

NA処理

R

邪魔な欠損値をどう処理するかベクトルとしてうまく操作して やつらを回避したデータを取り出す dataBoxの二列目がNAじゃないベクトルを取り出す > data データNAを0に置き換える > x > c [1] 0 1 0 1 0 0 1ifelse()は ifelse(条件式,TRUEの場合に返す値,FAL…

コンソール出力の出力先を変更する

R

sink() sink(file="test.txt") または sink(file = "test.txt", append = TRUE) # 既存のファイルに追記~~~なんかしらの操作~~~sink()で終了