ストレイテナーと確率5(2と4の続き、まとめられる曲をまとめて再検証)
前回↓の続き。
ストレイテナーと確率2
ストレイテナーと確率4
前回の検証では、集計のKEY判定を収録されている曲名の文字列だけで行っていた。
よって、実際には(ほぼ)同じ曲なのに別々の曲として集計されていたり、
一方でオリジナルとアコースティックアレンジで別の曲なのに曲名が同じというだけで同じ曲として集計されていたり、
といった点が若干の心残りとしてあった。
(当時は「面倒くさい」で片づけた)
実例を挙げると(上記記事内でもちょこっと書いてあるが)、
Dear Deadman収録の「Melodic Storm-DEAR EDIT-」はシングルの「Melodic Storm」とほぼ同じだが曲名が異なり、、
TITLE収録の「REBIRTH」はSOFT収録の「REBIRTH」とまったく違うが曲名が一緒。
このため、Melodic Stormの集計範囲からはDEAR EDITは除外されているし、
REBIRTHはオリジナルとアコースティックで全く違うが同じ曲として集計されている。
実際に聴いているときは、曲名ではなくその曲の中身で「どの曲か」を判別しているはずである。
よって、上記の「違い」を加味して、前回行った検証を再実施してみようと思う。
これは、「CLONEをよく聴く気がしてならない」というモヤモヤとしたものが晴れない自分を納得させるためのものである。
⇒この判別を正せば、ひょっとしたらCLONEが選ばれやすさ1位になるんじゃあねーか!?という淡い希望を抱いている
基本的な検証ロジックは前回から変更しない。
よって、あくまで集計は曲名にて実施する。
なので、集計前に、楽曲リスト側で区別がつくような曲名を振っておくことで対応する。
マスタデータの修正を行う、といったところか。
これは手作業にて実施するしかない。
何故なら「これとこれは同じ曲だな」と耳で判断しているのは俺自身だからである。
よって機械的な判別は不可能。
「曲名が違うが同じ曲」もしくは「曲名が同じだが違う曲」のリストとして俺が考えたのは以下の通り。
No楽曲コメント
1 | Melodic Storm -DEAR EDIT-(Dear Daedman収録) Melodic Storm(シングル=ベスト版) |
冒頭にて記述した組み合わせ。イントロがちょっと違うが基本、同じとみなす。 |
2 | The Remains -DEAR EDIT-(Dear Daedman収録) The Remains(シングル) |
No.1と大体同じ組み合わせ。これは正直、聴き分けがつかない。同じ曲じゃないの? |
3 | ROCKSTEADY(Early Years収録) ROCKSTEADY(ROCK END ROLL=ベスト版) |
似てるけど別曲。Early Yearsの方は最初の方の歌詞に"ROCKSTEADY"×2が入っているし。 余談だけどベスト版に入ってるのがROCK END ROLL再録版ということは、正式版はやっぱこっちなのかな。 |
4 | DJ ROLL (VIDEO ADDICT EDIT)(LOST WORLD'S ANTHOLOGY収録) DJ ROLL(SILVER RECORD収録) |
これは、正直ちょっと迷ったのだが、一旦同じ曲として集計させてもらう。ただこれはよく聴くと違いがわかる。 余談だが、SOFTにも同じ曲名の曲があるが、これは後述にて厳密に区別をつける。 |
5 | SOFT一式※「シンクロ」除く SOFT元ネタ |
ベスト版とSOFT収録版で同じ「シンクロ」があるので、この1曲を除く全曲にSOFT収録版であることがわかるような区別がつく曲名にする。 今思ったが「Phantasien」に対する区別の対処は不要だな。どっちでもいいけど。 |
これにより、重複度4と判定され「もっとも選ばれやすい」曲となったSIX DAY WONDERは、
SOFT収録版とそれ以外が別曲となって(実際、別の曲だし)集計されるため、重複度は最大3となってCLONEやTRAVELING GARGOYLEと並ぶ。
となると手持ちのストレイテナー楽曲内での最大重複度は3となって、
特定の楽曲が突出して一番よく選ばれるという事態にはならないだろうことが予測できる。
これをもとに、楽曲リストのテキストファイル(TSVファイル)は下記の形式のファイルとして用意する。
もともとNo.7までの項目で構成されたTSVファイルだったが、今回新たにNo.9を追加する。
※というか、このTSVファイルの仕様を前回までにまるで書いていないな…まあ個人の趣味だからどうでもいいが
No項目名属性コメント
1 | 曲名 | 文字列 | 曲名。これはiTunes管理上のオリジナル曲名。今迄これを使って集計していた。 |
2 | 時間 | 時刻(mm:ssもしくはm:ss) | 曲の演奏時間。文字列として読み込んだ後、DateFormatでパースしてDate型にして扱う。 |
3 | アーティスト | 文字列 | アーティスト名。全部"ストレイテナー"なので今回の検証では使用しない。 余談だがFrom Noon Till Dawnも「feat」以降をとって"ストレイテナー"にしている。 |
4 | アルバム | 文字列 | アルバム名。これもiTines管理上のもので、作品の位置づけとはイコールではない。シングルならシングル名の「アルバム」になっている。 |
5 | ジャンル | 文字列 | ジャンル名。今回の検証では使用しない(使用しないが、値としては保持している) |
6 | レート | 文字列 | レート数。今回の検証では使用しない(使用しないが、値としては保持している) |
7 | 再生回数 | 数値 | 再生回数。今回の検証では使用しない(使用しないが、値としては保持している) |
8 | 集計用曲名 | 文字列 | 上記の内容を加味して、区別がつけるようにした曲名。今回はこの値を使って集計する。 |
この「集計用曲名」を使って再度、シミュレーション用プログラムを実行する。
まずは「ストレイテナーと確率2」にて実施した「60分以内に選ばれやすい曲とは?」から。
といっても今回の「集計用曲名」とは無関係の「シングル・アルバム区別あり集計」「アルバム集計」は同じ結果だろうから見ない。
今回「集計用曲名」を使用したことで変化が出るであろう、「シングル・アルバム区別なし集計」の結果を確認する。
で、再実行したところ、結果は↓のようになった。上位10位を表示。
曲名視聴回数
LITTLE MISS WEEKEND | 18308 |
MELODIC STORM | 18275 |
TRAVELING GARGOYLE | 18212 |
REMINDER | 18183 |
MAN-LIKE CREATURES | 18117 |
VANDALISM -PROTOTYPE- | 18099 |
TRAIN | 18034 |
SIX DAY WONDER | 17947 |
羊の群れは丘を登る | 17840 |
CLONE | 17610 |
今回、曲に区別をつけたことで、上位層に変化が見られた。
●前回1位だったSIX DAY WONDERは7位にランクダウン。
●前回2位だったROCKSTEADYは13位にまでランクダウン。
●前回11位だったCLONEは10位にランクアップ。
●前回8位だったLITTLE MISS WEEKENDが1位にランクアップ
といった具合になった。
この検証は「演奏時間が短い方が選ばれやすい」ということがわかっているので、
同じ重複度(3)ならもっとも演奏時間の短いLittle Miss Weekend(3:33)が最も選ばれやすい、
という結果になったということか?
ただ次点のMelodic Stormは3:46なのに対し、TRAVELING GARGOYLEは3:14なので、
理屈でいえばTRAVELING GARGOYLEが最も選ばれやすいような気がする。
ちなみにTRAVELING GARGOYLEは前回でも3位である。
今回はたまたま運がよくLITTLE MISS WEEKENDが選ばれ続けた、ということなのだろうか…?
いずれにしてもCLONEはそこまで順位を伸ばしてこれなかった。
まあよく考えたら当然だな。演奏時間6分近くあるし。
続いて「ストレイテナーと確率4」にて実施した「n曲目はどの曲が選ばれやすい?」という検証。
前回は、「nの値に寄らず、どの曲順においても同じ確率で曲が選択される」という結論になった。
つまり、シングル重複度、アルバム収録数が多い方が選ばれやすい(たとえ100曲目であっても)。
今回も同様に、「シングル・アルバム区別なし集計」において、
どのような結果が得られるかを再実施して確認してみる。
結果的には↓のようになった。
n=1(1曲目)n=100(100曲目)
順位曲名回数
|
順位曲名回数
|
うん、別に何も変わってないね。
こんなことだろうとはなんとなく予想していたが、本当にこんなことだったか。
100曲目にVANDALITSMがあがってるのは少し気になるが…まあ偶然でしょう。
というわけで別に曲名の判定を見直したところであまり大きな結果変化は起きないということがわかった。
やはり、実際に聴きまくって比較するしかないのかもしれない。