読者です 読者をやめる 読者になる 読者になる

とあるアナリストの備忘録 / 出勤管理プラグイン編

WordPressプラグイン(出勤管理プラグイン)を運用していたり、某企業でフリーランサーとして働いています。

s-cute女優マッチングサイト | まじめにエロサイトを作ってみてわかったこと

とりあえずやってみた

まじめにエロサイトを作ってみてわかったこと

 

s-cute女優マッチングサイト

http://db.over20.me

※2015.05.16 再開しました。

 

というサイトを作ったので、備忘録として残しておく。

 

 

きっかけは、完全に一致さん、エロ系まとめサイト

 

いつかはエロ系サイトを作りたいと思っていたけど、内容がさだまらず数年、寝かせていた。

昨日、エロ系まとめサイト経由 で 完全に一致|AV女優類似検索システム

(数年前けっこう有名だったみたい)をみつけて作ってみようかと。

 

 

ジャンル、女優マッチングサイト

 

自分の興味のあるものと掛けあわせたいと思っていたので、

いつもお世話になっているs-cuteさんのデータを使うことにした。

 

s-cuteとは10年運用されているけっこう老舗のエロ動画サイトで、

かなり質が高いので評判のサイト。

 

ここでは素人さやリアルな絡みをコンセプトにしているので、AV女優さん名はでてきません

(ただアルファベットで名前表記)

 

サイトとしてはコンセプトがあるので、表記しないのはいいのだが見ているユーザとしてはやはりこの子が誰なのか知りたいのが本心。

 

で、けっこうs-cute + 女優名を検索すると、Q&Aサイトで投稿されているのをみて、

自分と同じように探している人がいるだなと思った。

 

ニーズがあると思い、s-cuteとAV女優をマッチングさせるサイトにした。

 

 

コンセプト、scuteの女優さんが誰なのか知るためのサイト

 

AV女優と紐づけるためにまず、サイズ(BWH)を条件にすることにした。

 

車の車種とか車種番号がついているからけっこうひも付けが簡単なのだけど、ヒトの情報って意外に結びつきが難しかったりする。

 

というのも、名前は重複がかなりあり、データの粗があって難しい。

 

サイズを詐称していなければ、紐づけられるのではないかと思った。

 

 

環境、

 

費用面、AWS(EC2 / RDS / Route53)※あいのり

CMSwordpress

言語、php 、bootstarap

 

他サイトをみると、エロ系がOKなレンタルサーバーを利用していることが多いみたいだけど、AWSで運用しているサイトをいくつかあったので、

そこにあいのりすることで実装することにした。

 

ごりごりにサイトを作るのもありだけど、最初はどのくらいの反響があるか知りたかったので、まずはCMSwordpress)で構築。

 

 

データの取得、

 

まず先人のデータを利用しようと思ったけど、データに粗があるのを見つけたので本家(DMM)から取得することにした。

 

DMM側からもAPIを提供しているみたいだけど、商品データだけだったので(欲しかったのは女優マスターデータ)

女優さん一覧画面から取得するようにした。

 

※商品データはのちのち利用しようと思っている。

 

意外にデータ量は少なくて、1万件未満。一応間隔を置いて取得したけど半日位でとれた。

 

cron を仕掛けて、定期的にデータをとるように設定。毎回データをとるのは負担を掛けてしまうので、データに差異ときだけデータを格納するようにした

 

環境設定を忘れてしまうので、ドットインストールで復習。

 

やってみて、おそらく企画から3日くらい(スクレイプ 1.5日、サイト構築 1.5日)

 

 

マネタイズ、

 

アダルトはアドセンスとか広告媒体が絞られているので、とりあえずは掲載をしない方向。

※あとはあいのりなので費用は取り急ぎかからないから

 

 

やってみてわかったこと、

 

問題点

1)サイズだけではけっこう粗い

 

データを取ってみてわかったけど、スリーサイズだとけっこう重複のデータがでてくる。

あと日本人の女性の平均身長値はかなり密集しているので、身長の追加してもまだ粗がでる。

 

他の情報をいれてみようと思って、出身地とかいれるとかなり整合性が高くなった。

 

ただ、DMM側の情報が正確に入っていないこと(未記入)が多々あり、sucte側のデータと結びつきが悪くなってしまった。

 

ここは自動でやると結びつきが悪くなるので、詳細画面で条件を追加できるにすることでクリアした。

 

今後、

 

1)本来の目的はこちらで女優のデータを持つということなので、他のアダルトサイトとかからデータをとれるようにしたい。(カリビアンとか有名なサイトから順次かな

2)せっかくなのでAPIとか提供しようと思っている。