とあるアナリストの備忘録 / 出勤管理プラグイン編

WordPressプラグイン(出勤管理プラグイン)を運用していたり、某企業でフリーランサーとして働いています。

データマイニング

知恵袋ベースにコンテンツを作ったみたらどうなるか?

最近システムマチックな内容が多かったけど、たまにコンテンツベースのサイトも作りたいと思い、知恵袋Q&Aベースにサイトをつくってみた。 今回の収益モデルは、広告モデル(アフィリエイト)です。 アフィリエイトサイトを作る上で、たくさんのノウハウがあ…

BeautifulSoupを使ってWEB上にあるデータをスクレイプしてみる

PythonのBeautifulSoupを使ってスクレイプをしてみました。 普段はPHPでスクレイプしているのですが、BeautifulSoupの方が汎用性が高い+処理速度が速いと聞いて使ってみました。 まずはPythonをインストールする 簡単にインストール手順をまとめておく ①Pyt…

Rのライブラリを使って綺麗plotしてみる

先日デフォルトのplotで決定木を出してみたところ、かなりひどいアウトプットがでてきて良いライブラリーがないか調べてみました。 geom_histogram | ggplot2で描くヒストグラム サンプルデータはiAnalysisさんをこっそり拝借。 Rで多変量解析(一般化線形モ…

スクレイプしてジャンル別SAPタイトル数とかを出してみたお

以前、アプリの流行り廃りをみたくて各プラットフォームでどんなアプリがでているのか知りたかったので実際プログラムを組んでとってみました。 やり方は簡単で各プラットフォームにアクセスしてスクレイププログラムを流すだけ。 ※若干ノイズなどが多いので…

ウェブビーコン型とパケットキャプチャー型のどっちがいいの?

最近データをしっかりとること(クリーニング)について考えているのですが、本当にGoogleアナリティクスでよいのかどうか悩んでいます。というのも、アクセス解析ツールにも取り方をいくつあってウェブビーコン型 … Googleアナリティクスやサイトカタリストな…

CVRとCTR 用語をしっかり理解しましょう

仕事にかかわらず、何かを構築するには土台がしっかりしている必要があります。家を建ているときはまず立てる土地をならしてからはじめるそうです.英語を話せるようにするにも、まず英単語を理解する必要があります。個人的な意見ですが、WEB業界で使われて…