テキストマイニング

R

仕事でテキストマイニング実装することになりそう。久しぶりにMeCabと戦う。が、 今使ってる自宅PCになぜかMeCabがはいらない。 > install.packages ("RMeCab", repos = "http://rmecab.jp/R") Warning in install.packages("RMeCab", repos = "http://rmeca…

最適化問題

先日、データ解析コンペティションのOR部会で発表してきました。 準備足らなさすぎて、資料も体もぼろぼろでしたが、 どうにか当日は迎えられました。 内容はひどかったけど…。弊社の通常業務を、 通常通りにやりながら研究を進める事が、 どれだけ難しいか…

項目反応理論

今日の勉強。 項目応答理論(こうもくおうとうりろん)または項目反応理論(こうもくはんのうりろん)、略称IRT (Item Response Theory; Item Latent Theory) は、評価項目群への応答に基づいて、被験者の特性(認識能力、物理的能力、技術、知識、態度、人…

復活したい

そろそろ復活させたい 勉強用ノート。今年はついに データ解析コンペティションにもでるし。ちゃんと勉強再開しよう。 今日は今からこの二冊をまとめる。 ※社内PJ用だけども。 読み込んだ本だから、多分すぐに終わる...はず。マーケティングリサーチの論理と…

SEMの不適解

不適解が出てしまった時の対処。不適解とは、 ・推定値の絶対値が1以上 ・誤差分散が撹乱項の分散が0やマイナス など。これらは一般に論文には出せない。ただし「サンプル変動による不適解」と判断できれば、 論文に載せることも不可能ではない。 参考。 htt…

共分散構造分析2

昨日に引き続き、共分散構造分析の勉強。Rでsemパッケージがうまくいかないので、今日はlavaanパッケージと格闘。 2.lavaanパッケージ使い方は、semパッケージとあんまり変わらない。 ただ、モデルの記述方法が違う。モデルの記述方法 =~ 潜在変数の定義 ~ …

共分散構造分析

共分散構造分析をやってみた。ツールはRとAMOS AMOS student版(AMOS5.0)が無料でダウンロードできるため使用。 使い方は以下を参照。 心理データ解析第10回(2)だけど、student版はパスが54本までしか解析できない。 あと観測変数が8変数までしか使えない。…

線形計画法

OR

勉強の参考にしたURL。シンプレックス法(単体法:Simplex method)http://www.th.cs.meiji.ac.jp/researches/2007/nakata/integer.htmlRで解く最適化問題 線型計画問題編 線形計画法は、最適化問題の一つ。 他にも、非線形計画法や動的計画法などがある。遺…

共起ネットワーク

R

共起ネットワーク作成用Rスクリプト テキストマイニングでよく使われる語の共起ネットワークを トランザクションデータで使用してみた。今回もアソシエーション分析に使用したものと同じデータを使用。 行:ID 列:メディア名 値:メディアへの接触フラグ こ…

アソシエーション分析(バスケット分析)

R

アソシエーション分析実行用Rスクリプト 基本的にアソシエーション分析をするときは、データはlist型で定義したものを トランザクション型に変換(as(リスト名, "transactions"))して使用するが、 外部データ(csvなど)から読み込むときは、自動的にdata.…

GASでの日時データ

GASでの日時データの使用方法は JavaScriptと全く同じらしい。 今の日時を取得 var date = new Date(); dateから一日後の日時を取得 date.setDate(date.getDate()+1); 時間を設定する // dateの時間部分を21時に設定する date.setHours(21,0,0); とか。 参考…

Google カレンダーとの連携

Googleカレンダーは、CalendarAppsオブジェクトを使うといろいろ操作が可能。 カレンダーオブジェクトを取得する イベントを取得する カレンダーを作る イベントを作る とか。基本的にGoogleカレンダーのGUIでできること ほぼ全部できる。 ただ、イベントを…

異なるスプレッドシートからセルをコピーする

-異なるシートを参照する 現在アクティブになっているスプレッドシートではなく、 ドライブ上にある別のスプレッドシートを参照したいとき スプレッドシートのIDを指定することで参照できる。SpreadsheetApp.openById(id) スプレッドシートIdからスプレッド…

イベントハンドラとトリガー

Google Apps Scriptの勉強イベントハンドラとトリガーについて。 「初心者のためのGoogle Apps Scriptプログラミング入門」より スクリプトの実行とイベントハンドラ(2/5):初心者のためのGoogle Apps Scriptプログラミング入門 - libro イベントハンドラとは…

モデルに基づいたクラスター分析その3

最初に書いた mclustBICとMclustの出力は 本来一緒のはずらしいけど, 今回は異なってしまった理由は不明...なぜなんだろう(´Д` ) あとクラスターの分布が違うのは 使った混合分布の型(球、楕円球)、体積、形と軸の向きが 異なるから. (最初"EEE",二回目"…

モデルに基づいたクラスター分析その2

いろいろ調べてたら もう一つやり方見つけたただこれやったら全然結果変わってしまった(´Д` )とりあえずメモ。 > res > plot(res) これよりEEVのクラスター数7が最適 > res > cl > cl[1:10] 1 2 3 4 5 6 7 8 9 10 6 7 6 7 6 6 7 3 6 6 > table(cl) cl 1 2 3 …

モデルに基づいたクラスター分析

モデルに基づいたクラスター分析http://mjin.doshisha.ac.jp/R/29/29.html を参考にやってみたmclustパッケージをダウンロードまず書かれているように plot(EMclust) ってやったけどエラーどうやらmclustパッケージに EMclustは今入っていないらしい最適なモ…

疑問とその回避

R

apply関数を使って 行列処理をしてた時の エラーというか困ったこと func list2 for(i in 1:3){ if(list[i]==list[7]) list2[2,i] if(list[i+3]==list[8]) list2[3,i] } if(sum(list2[2,])==1) return(list2[1,list2[2,]==1]) else return(list2[1,list2[3,]…

因子分析その2

原因が本当にこれかは不明だけど「はい」「いいえ」みたいな二値データは 基本的には因子分析では扱われなくて、因子分析したいなら カテゴリカル因子分析ってやつを使うらしいhttp://home.hiroshima-u.ac.jp/keiroh/maeda/statsarekore/gedoufa.htmlテトラ…

因子分析

アンケート結果を因子分析して 因子を抽出しようとしているのだけど、なかなかうまくいかない 使っているのは、 factanal関数 factanal2関数(青木先生) fa関数(psychパッケージ) とかいろいろデータ形式は 「いいものは長く使いたいですか?」:「はい」…

クロス集計

R

以前に書いたtable()関数を用いて クロス集計が行えるentertainment-lab: Rのtable関数に関する調査ついでにここで扱われているcut関数とは 数値ベクトルを指定した区間に分類するための関数使い方は http://www.okada.jp.org/RWiki/?R%A5%D7%A5%ED%A5%B0%A5…

ミーティング用メモ

土曜日は片所さんとMTGそこでやること。1)N社コンテスト内容確認 ・ブランドロイヤル ・バラエティシーカー ・新規購買者 の3つの群に対して・認知 ・意欲 ・購買 の3つの反応を分析した結果はいまいちだけど とりあえず報告データの切り取り方とか もう…

sort()とorder()の違い

R

並び替え関数 sort()とorder() 違いが書かれてるサイト。ああああ: R: sort と order の違い

度数分布

R

度数分布を表示する関数 table() > table(iris$length) 4.3 4.4 4.5 4.6 4.7 4.8 4.9 1 3 1 4 2 5 6 irisデータのlengthの度数分布 >table(iris[1]) でもいける(lengthが一列目) xtabs() > xtabs(Freq~Inocome,data=dataBox) Income 0-50 50-100 100-150 >…

NA処理

R

邪魔な欠損値をどう処理するかベクトルとしてうまく操作して やつらを回避したデータを取り出す dataBoxの二列目がNAじゃないベクトルを取り出す > data データNAを0に置き換える > x > c [1] 0 1 0 1 0 0 1ifelse()は ifelse(条件式,TRUEの場合に返す値,FAL…

コンソール出力の出力先を変更する

R

sink() sink(file="test.txt") または sink(file = "test.txt", append = TRUE) # 既存のファイルに追記~~~なんかしらの操作~~~sink()で終了

test

はてなで R用雑記帳開設 なう。