とあるアナリストの備忘録 / 出勤管理プラグイン編

WordPressプラグイン(出勤管理プラグイン)を運用していたり、某企業でフリーランサーとして働いています。

ウェブ解析士という資格をとってみた

 

まず知らない人のためにウェブ解析士とは

一般社団法人ウェブ解析士協会が認定しているウェブに

特化した分析資格を取った方のことを指します

 

この手の資格や協会っていくつかありますよね。

一応ここはその中で有名だそうです

 

僕個人の意見ですが、

分析業務もしくはマーケティングの仕事をしている人は基本土台がなく、

自力で勉強して実務している方が多いんじゃないかなと思います。

 

僕も正直ちゃんとしたスキルがあるかどうか不安だったので

試しがてら受けてみました

 

どうやらウェブ解析士には 

初級、中級、上級と一応段位があり、上級までいくと人に講師として生徒にレクチャーできるそうです。

 

詳しくはこちら

 

実際受けてみて

 

試験の前に講習が半日程度あります。

 

内容は演習を主に進められ、実際実務で交わされるような会話が中心です。

この日に力が付くわけではないですが、こういう機会があるのは良いなと思いました。

 

またGoogleアナリティクスを想定している内容なので少し偏りはあるかもですが、

基本的な分析に対するマインドセットなどはどの業界も一緒だと思うので金額も少額ですし受けてみる価値はあると思います

 

また僕と一緒に演習を受けた方はマーケティングを実務としている人が多く、

その方たちは口コミで受けに来ているようで僕みたいに何も知らずに受けにくる人はあまりいないようですw

 

講師の方にどんなところで講習しているのかと尋ねたところ、

*1某SAP会社も社内研修で受けさせてもらっているそうです。

 

着地が受けてみた方が良いみたいな流れになっていますが、

けして回しモノではないのであしからずw

 

Rのライブラリを使って綺麗plotしてみる

 

先日デフォルトのplotで決定木を出してみたところ、かなりひどいアウトプットがでてきて良いライブラリーがないか調べてみました。

 

geom_histogram | ggplot2で描くヒストグラム

 

サンプルデータはiAnalysisさんをこっそり拝借。

Rで多変量解析(一般化線形モデル)〜タイタニックのデータも分析しました〜 - iAnalysis 〜おとうさんの解析日記〜

 

 

 タイタニックの死亡原因を決定木から検証

 

f:id:sanochih:20130826210156p:plain

 

ggplot2をインストールするだけでかなり見栄えがよくなりました。

 

なにやら色分けもできたりしてかなり素敵な感じです。

 

業務がら依頼者にアウトプットする必要があるのでこういう風にわかりやすくplotできるとかなり手間を省けていいですよね

スクレイプしてジャンル別SAPタイトル数とかを出してみたお

 

以前、アプリの流行り廃りをみたくて各プラットフォームでどんなアプリがでているのか知りたかったので実際プログラムを組んでとってみました。

 

やり方は簡単で各プラットフォームにアクセスしてスクレイププログラムを流すだけ。

※若干ノイズなどが多いのでアプリ名や提供会社は抜粋しています。

 

各プラットフォームとカテゴリ別にクロス集計してみました。

 

f:id:sanochih:20130825112742p:plain

 

※各SAPプラットフォームからスクレイプしてとったデータのクロス集計です。

 

まあだいたい想像はついていたのですが、

RPG、恋愛タイトルが上位です。

 

8位のカードゲームは呼び方が違うだけでおそらくRPGに含まれるでしょう

 

GREEのタイトル数がモバゲのタイトル数よりも多いのは

google VS. Apple のようにインセンティブやアプリ制限あたりがあるのでしょうか

 

このデータを使ってクラメールの連関係数やら相関比でも出したら面白そう

 

追記:各プラットフォームごとにカテゴリの定義や名前の違いがあるため、正しいデータとなっていませんのでざっくりとデータをみる指標としてみてください

RStudioを使ってヒストグラフを簡単にアウトプットしてみた

 

業務では主にExcelを使って分析しているのですが、

より効率的に分析をするためにRを使い始めました。

 

まずは準備

 

 Rのインストール

http://cran.md.tsukuba.ac.jp/bin/windows/base/

 RStudio

http://www.slideshare.net/TakashiYamane1/rstudio

 

RStudioはR言語を使うためのIDE(総合環境)です。eclipseみたいなモノです 

 

とりあえずJリーグの年収をヒストグラフにしてみた 

 

f:id:sanochih:20130824164533p:plain

参照元:

2013年ジュビロ磐田 - サッカーJリーグ年俸名鑑

 

 

 Rだとたった2行。

> rawData <- read.csv("Data.txt")
> hist(RawData$salary)

 

 

データの読み込みと表示の宣言だけ

 だいたい1000~2000万程度もらっているですね

 

複雑な処理が簡単に

 個人的にexcelで分析業務で利用することが多いのですが、

データ量が多い場合は特にexcel上で固まったりすることが多いのですがこのRを使うとかなり早い印象をうけました。

 

僕はここらへんことを勉強しています

 Rを使えるようになるための10のこと+α - iAnalysis 〜おとうさんの解析日記〜

Appleのランキングロジックが変わってもやはりパズドラは強かった

 

SocialGameInfoでも記事になっていたAppleロジックが変更されたようです。

 

App Storeのランキングロジックが変更 継続利用を重視? 更新間隔も3時間に【追記】 | Social Game Info

 

社内でもちょっと話題になっていました。

 

記事にも記載されていましたのが無料ランキングが大幅に影響を受けているようです。

 

もともと無料ランキングはDL数が大きく影響していました。

ですが今回のアップロードで起動回数や起動時間をみているのではないかと憶測されています。

まずはアクティブUUが多そうなLINEから

 

--LINE--

 

f:id:sanochih:20130822221540p:plain

 

やっぱり8/9くらいからランキングが上昇傾向にありますね。


次はLINEプラットフォームのポコパン

 

--ポコパン--

 

 

 

ポコパンに関しては期間中にCMを打ったりしていたので実数としてみるのは難しそうですが、
綺麗に上昇していますね

 

王者、パスドラ

 

--パズドラ--

 

 

 

やはり上昇してますね


今度はガンホーの成長株のケリ姫

 

--ケリ姫--

 

 

このアプリも期間内にCMを打っているのですが、現在3位まで上昇しています。

この伸びだしは凄い


逆に落ちているところ

アソビズムのアプリ

 

--ドラゴンポーカー--

 

見事に落ちてますね

 

今回のロジックでわかること

 

①無料ランキングロジックが変更(DL数ではなくおそらくDAUや継続日数)
②ユーザとしては正しいランキングを表示されてユーザビリティは良くなった
③アド系会社にはかなりの痛手

 

チェインクロニクルで好調のセガがさらに絶好調

 

7月31日にセガサミーの決算が発表されました。

http://www.segasammy.co.jp/japanese/ir/library/pdf/settlement/2014/2014031q_tanshin_j_final.pdf 



今期コンシューマの売上は厳しいんじゃないかといわれているの中、

唯一売上を伸ばしています。(前期比29%)

またネイティブでリリースされているセガのタイトルを調べると、なんと40タイトル!

前期から51⇒130タイトルもリリース。

さらにトップセールス上位に食い込んでいるアプリは、

・ぷよぷよ
・ボーダブレイク
・ドラゴンコインズ

そしてチェインクロニクル

企業ベースでこれだけのタイトルを上位に食い込ませているのはセガくらいです。
売上ベースでもデジタルコンテンツで60%UPです。

とあるアナリストの備忘録-決算


気が付けばパッケージの売上にも近づいてきました。

もちろんぷよぷよやボーダブレイクといったIPを使ったタイトルが売上がたっているのもそうですが、
ドラゴンコインズやチェンクロなど新規タイトルでしっかり当てているのがさすがコンシューマのセガだなと思います

ちなみに採用面でみると、

とあるアナリストの備忘録-採用


こちらもネイティブでの勢いを止めないようですね

ウェブビーコン型とパケットキャプチャー型のどっちがいいの?

最近データをしっかりとること(クリーニング)について考えているのですが、


本当にGoogleアナリティクスでよいのかどうか悩んでいます。


というのも、
アクセス解析ツールにも取り方をいくつあって


ウェブビーコン型 … Googleアナリティクスやサイトカタリストなど

パケットキャプチャー型 … RTmetrics

サーバ型 … WebTrends


おそらく本流はウェブビーコン型で理由は取り付けが容易ということと、
費用価格が安いことが理由と点の2つかなと思っています

というのも、
まだまだデータ解析等に高い費用をかけている会社は少数であることと、
googleアナリティクスでほとんどのことができてしまうことが要因になっているような気がします

サーバ型は僕もあまり聞いたことないのですが、
おそらくこの手はサーバーにログを仕込むことから莫大な費用がかかるのではないかなと思います。

なので費用面でも


ウェブビーコン型 > パケットキャプチャー型 > サーバ型


となります

またそれぞれメリットとデメリットがあるのでまとめておくと、

  • パケットキャプチャー型

 

メリットは
これは間違いなく、仕込みがいらない点だと思います

ウェブビーコン型の場合、
一つファイルにこの仕込みJSを仕込んでおこないとデータを取得することができません

大規模サイトの場合、ゆうに100~200ページを超えたりするのでそれ一つづつに
仕込んでチェックするのは大変ですし、工数がかかりますよね。

ですが、パケットの場合はそれ作業が全くいらない点が大きいと思います

デメリットとしては、
無償で提供しているものがなく、ほとんどが有償のようです。

おそらくパッケージではなくASPなどのリースで購入されることが予想され、
データ保管料としての価値を見出す必要があり、敷居が高いです



  • ウェブビーコン型


メリットは
これは無償であることが大きいと思います。

代表されるGoogleアナリティクスは無償でかつ、カスマイズ性もかなり高いです。
なのでカスタム変数などを仕込んでユーザセグメントをわけたりしてよりユーザ動向をチェックできることができます

また設置や方法も簡単にできるので、敷居が低いといえるかと思います。

ここでもデメリットは、
パケット型でもお話したように、一つ一つにJSを埋め込む必要があり手間とそれがしっかりと認識しているかどうかのチェックが必要です。

またJSが使えない場合、
データをしっかりと取得することができない場合があります

携帯でも使えるタグがあるのですが、正確性については少し微妙な気がします

flashやPDFなどもデータも取得も少し大変だったりします


またどちらの解析方法で取得できないのが、


データを遡ることができない


というのも大きい気がします

サービス運用が1年程度であればよいのですが、

5年~10年など運用しているサイトの場合、その前のデータを遡れないのは解析側としては痛いと思います

またサーバ型ではそれが可能だそうです。


ここでやはり大切なのは、

目的に合った解析ツールを選ぶことだと思います


例えば、

1年くらいの運用で小規模サイトでかつ、
今まで解析ツールなど導入していないサービスなどであればウェブビーコン型のGoogleアナリティクスをいれれば良いと思います

中長期運用している大規模サイトで、
広告費用だけでなく、ユーザの行動分析など定量分析を1か月に1回提出して報告会を行っている会社であれば
有償なツールを使って運用した方がよいかもというお話しになるかもしれません

また社内で解析ツールを作って運用している会社も僕は何社か知っています


まずは目的にあったツールを検討することをおすすめします