所得结果
天猫销售数据分析
结果发现,下列每一组中的手机互为替代商品
(a)UMO/优摩 w9220 Yusun/语信 T28 (b)Huawei/华为 C8812 ZTE/中兴 N807 (c)OPPO U705T TCL Y910T (d)Coolpad/酷派 8150D ZTE/中兴 V889D (e)K-Touch/天语 E800 UMO/优摩 W800 七喜 TD710 (f)UMO/优摩 W800 七喜 TD710 Konka/康佳 E5680 (g)UniscopE/优思 U1201 Huawei/华为 Y300-0000 (h)Coolpad/酷派 8050 Coolpad/酷派 E239 (i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0 (j)Coolpad/酷派 8020 Haier/海尔 HT-I600 (k)七喜 H750 Gionee/金立 C620 (l)Lenovo/联想 A790E 广信 ef58 (m)Huawei/华为 c8810 Samsung/三星 s6108 (n)AUX/奥克斯 V930 TCL Y710 (o)Philips/飞利浦 W8355 ONN/欧恩 V8 16G版 (p)TCL Y710 Gionee/金立 GN705w
将手机聚类,找出互为替代的手机。
替代商品的挖掘 天猫销售数据分析
from __future__ import division from math import sqrt #coding=gbk f1=open(r'E:\tmao\shoujiInformation.txt') records=f1.readlines() f1.close() price=[] number=[] product=[] for i in range(len(records)): item=records[i].split('\t') price.append(item[0]) product.append(item[1]) number.append(item[2]) for i in range(len(price)): for j in range(i+1,len(price)): distance=sqrt(pow((float(price[i])-float(price[j])),2)+pow((int(number[i])int(number[j])),2)) if distance<=2: #if the distance minuse 2,we consider the two is replaced product print product[i],'\t',product[j] else: pass