为算法提供数据
时间:2022-04-21 00:03:01 | 来源:行业动态
时间:2022-04-21 00:03:01 来源:行业动态
运行良好的算法的核心是一组专有数据。在Stitch Fix中,第一个数据集来自客户自己,他们在加入服务时填写了一份深入的资料。
问题的范围很广,从基本的(身高和体重)问题到品味和喜好方面的问题(你喜欢把衬衫塞进裤子还是不塞进裤子?),还包含了个人特质(你是冒险者么?)以及生活方式(你是一位新妈妈吗?)方面的问题。
第二组数据是关于商品的。它包含了测量数据(男士衬衫大约有30个测量点)、款式(波西米亚风格还是新潮的风格)以及材料方面的数据(它是否容易起皱?它是否需要干洗?)每款衣服都会多次进行标记,并经过源自客户偏好不同的算法进行匹配打分,然后进行排名。
拥有了来自两方面的数据,一系列机器学习算法就可以将客户和最适合的商品进行匹配。这些算法会弄清楚每个特征对每个特定的个人有多重要,如何用一个特征交换另外一个特征(例如,新妈妈可能就不想购买由需要干洗的织物制成的休闲服装)。
随着时间的推移,算法从实际的客户无论是个体还是总体身上学习如何看待衣服。这可能要归功于从客户那里收集到的反馈数据,这些数据被传回给算法,这样它们就可以看到它们的决策在现实生活中的表现如何并且使用这些信息来不断地提升它们的决策公式(机器学习)。
Colson表示:反馈数据是我们最有价值的数据集,是我们的秘方,对我们而言是独一无二的。传统的零售商可能永远都不知道为什么顾客会什么都不买就走出商店了,因此也就无法知道如何在下一次的时候让顾客更高兴。Stitch Fix会向客户询问很多有关他们与衣服互动的问题,试图去理解购买或者不买的原因。
Colson表示:我们同我们的客户之间的良好关系只有在他们能够从我们这里获得价值的时候才会有效。这里没有出售这回事只有相关性。
当然,究竟要问哪些问题才能够弄清楚购买衣服的过程中最关键的因素?这一点并不总是很显而易见。然而Stitch Fix使用了文本框来捕捉这些重要的信息,客户可以在这些文本框中写下他们的评价。之后,对这些评价进行自然语言处理,然后指向新的特征集群,这成了算法的一部分。例如,一位客户在评价中写道:我很高兴,因为我可以穿着这件衣服去公园,参加户外婚礼。这表明了拥有一件可以在正式场合穿着的休闲服装的重要性
Colson表示Stitch Fix绝大部分对业务效果有着非凡意义的算法功能都是由数据科学家团队构思出来的。