« 分析ディー2(11/25) | トップページ | 情報研ほか(11/27) »

さらにデータ分析(11/26)

100万レコードを超えるデータの処理と再び格闘。まずは分析をするというよりかは,思いついた仮説をどんどん確かめるための簡単な処理方法を見つけるために悪戦苦闘。Excelはとても柔軟で素晴らしいソフトであると再認識したけども,100万を超えるデータは扱えないし,列数が多いと4GBを積んだパソコンでもリソース不足と出てしまう。そこで,昔,キーボー島のログ分析をする際に試みたSQL Serverとその分析ツールを試みるも,値の合計を時間軸に区切って求めるといったビジネス用の分析ツールは充実しているものの,今回の用途を満たさないようだ。しかも,ドキュメントがあまりなく,ネットで探しても,本屋に行っても,情報不足。試行錯誤したけど明快な解は見つからず。やっぱりSQL文で書いてみると,出来ることは出来るけども,とても面倒だ。SPSSでの分析も,何冊も本を買うけども,単純に度数や平均を求めたい話はあまり書かれていない。と,今日もたいした成果もなく終了。この数日で,Excel,SQL server,SPSSの本が増え,たくさん読破したので,筋トレみたいなものか。

|
|

« 分析ディー2(11/25) | トップページ | 情報研ほか(11/27) »

コメント

コメントを書く



(ウェブ上には掲載しません)




« 分析ディー2(11/25) | トップページ | 情報研ほか(11/27) »