杏彩体育:什么时候觉得数据分析真的非常有用?
数据分析有没有用,取决于你能否用数据去指导你的实践,如果你的数据仅仅是分析,那抱歉,数据分析对你来说,不仅枯燥乏味,而且几乎毫无用处,因为你没有结论,没有应用场景,他就仅仅是一个数字而已。
相反,如果你的分析能解决一个问题,或者解答一个问题,这样的分析就是有价值的。我举个例子,我们该如何用数据去分析一个品牌的“门店密度”。
首先说说为什么要分析这个,因为有投资者找到我们想要评估某品牌的开店策略以及未来的成长空间。开店无非是两种策略,一种是在一个全新的地方开店,另一种是在已有门店周围开店。如果要在门店周围开店,又担心会相互蚕食,不知道到底有没有进一步加密的潜力。
解决这一问题的核心在于定义好什么叫“门店密度”,只有量化的指标才能比较和指导实践,但目前的困难是这个指标很重要很复杂但目前没有现成的算法。如果你适合干数据分析,看到这里你会感到兴奋,因为你似乎发现了一个创新的机会。
在7-Eleven 在早期创业时,面临一个重大抉择:是先在全国100个城市各开一家店,还是先在一个城市密集开100家店?
这个问法可能有点极端,但分散开店的好处是符合直觉的,可以尽可能覆盖更多的客群,避免品牌内部陷入相互蚕食的内耗。但7-Eleven 最终选择了“同城密集开店”的策略——1号店开业后,严格要求店铺开发负责人在选址上“决不允许踏出江东区一步”。正是凭借这一策略,7-Eleven 在第2年总门店数就达到了100家,而美国南方公司(7-Eleven品牌原属于美国南方公司)达到这一目标花了整整15年。
我们习惯用结果倒推原因,所以在7-Eleven的成功面前,大家很容易就认同了这一策略的优势,并迅速复制开来。在国内市场,北京的便利蜂、上海的星巴克、长沙的茶颜悦色、成都的红旗连锁、合肥的老乡鸡都是这一策略的典型应用。以长沙的茶颜悦色为例,店与店之间最短距离的平均值甚至只有190米,而7-Eleven 在最成熟的东京也只有328米,相比之下,反倒是7-Eleven 在这一策略上落后了很多。
众多国内品牌在短时间内的迅速崛起似乎很好的印证了“密集型开店策略”的成功,对于新品牌而言,这可能是快速打穿市场最有效率的做法。
门店要密,就不太可能做的很大,这就严重限制了这一策略在不同行业的应用。一是大店的选址非常受限,得先看有没有合适的物业,不是你想在哪开就能在哪开;二是大店租金成本更高,需要覆盖更多的客流才能盈利,开的太近规模效应可能还没发挥作用,蚕食效应倒是能给你整的明明白白。举个例子,同样是餐饮行业,一条街上可以开两家肯德基,但很少有开两家海底捞的。
一个区域的市场总量总是有天花板的,网点不可能无限密集下去。所以这里有一个适度的问题。但仅仅知道要“适度”还远远不够,就像菜谱里的“盐少许”到底是多少盐一样,一样的菜谱不一样的人做,结果却可能截然不同。
要让“适度”变得可操作,就需要一个可量化的指标来描述门店的密集程度,让我们可以很方便的比较不同行业、不同品牌门店的开店策略,并从中获得一些有意义的参考和洞察。
虽然我在前面使用了“平均最短距离”这一指标,但严格来说,这是一个非常粗糙的指标,因为他首先需要自定义了一个范围,如1km范围内最近门店的距离。但如果离它最近的门店在1km之外呢?这个时候就要排除这个点不纳入计算。极端情况下,一个非常分散的门店布局仍然可以得到一个非常密集的指标。
而如果我们要将更多的点纳入计算,就得扩大计算范围,但这样一来数据又极易受到极端值的影响影响。如下图,如果门店距离超过1km的就不纳入计算,那么算出来的结果就是50m,虽然遗漏了蓝色的点,但总体比较符合。而如果为了确保所有的点都纳入计算,把范围扩大到5km,那么这些点的平均距离就达到了500m,是原来的10倍,这样的结果显然和我们的看到的分布相悖。这种极易受到人为设定因素干扰,波动较大的指标在实践中的应用中也往往颇受争议。
其实最直接的密度指标还不是这个最短平均距离,而是用门店数量/面积。但这里的面积究竟是什么的面积?一般我们会用到城区面积。但显然,这对不同量级的品牌并不公平。以红旗连锁和茶颜悦色为例,成都城区1285km²,红旗连锁3239家,门店密度2.5家/km²。长沙城区1200km²,但茶颜悦色只有389家,门店密度仅为0.3家/km²。这显然与我们观察到现象的不同——茶颜悦色门店虽少,但分布区域也更窄,门店之间要密集得多。
突破口在于回归问题的核心,跳出“密度”这一名词的限制。“密集型开店策略”的核心是要在已开门店的周边开新店,我们把这样的新店叫做“加密型门店”,事实上,我们只需要描述加密门店在总门店中的占比就可以很好的衡量品牌的开店策略——加密型店铺占比越高,品牌越是倾向于“密集型开店”策略,门店也就越密集,在地图上呈现的结果就是越趋向于成团连片分布。
但这里仍然有一个人为设定的参数:关联距离。关联距离一般取500米,这是一个经验值,大概是普通人步行5~8分钟的距离,用来表示一个门店的辐射范围。但不同行业的辐射半径明显是不同的,研究咖啡茶饮便利店,我们可以粗略用500米计算,但如果是单店规模更大、辐射能力更强的火锅呢?500米的取值就很难有说服力了。
由于我们很难预判不同行业不同品牌的门店辐射能力,所以我们分别取值10米、20米、30米直至2000米,分别计算了单品牌在不同的关联距离下加密型门店的占比,并将其描点成线。
令人惊喜的是,这是一条非常平滑的曲线,当我们用三次函数对他进行曲线拟合时,拟合度R²达到了0.97以上,完美的一度让我怀疑我一定是哪里算错了。这样高度的可预测性为后续的其他量化研究搭建非常可靠的数学模型,这也是他能在我研究的众多算法中脱颖而出的原因之一。
显然,越在上方的品牌对应的门店密度也就越高。例如,在500米的关联距离下,最密集的是红旗连锁,加密型门店占比达到81%,最低的星巴克的只有35%,分布也更为稀疏,这也表现出不同行业之间不同的特征。遇到问题的是红旗连锁和茶颜悦色两个品牌,两条曲线米的距离上交汇,小于这一距离,茶颜悦色更密,大于这一距离,红旗连锁更密。
这的确有点令人费解,为了解释这一现象,还是让我们回到地图上观察。为了让解释更加直观,我在283米的两端分别取曲线米,以每家门店为圆心分别画75米和250米的圆,这样相距150米和500米的门店就会融合成一个图形,代表他们是一组加密门店。
当半径为75米时,茶颜悦色已经有大量门店(≥47%)连成一片,而红旗连锁的门店之间还相对分散,能够连在一起的门店(≥18%)较少。这说明在相邻的门店中,茶颜悦色门店间距要小得多。
而当半径扩展到250米时,情况发生了逆转,由于茶颜悦色的门店有明显的多核心生长、区域性分布,块与块之间分布的较远,无法连成一片,曲线后期占比增长缓慢。而反观红旗连锁,在整个城市中的密的非常均匀(主要都150到350米的距离之间),几乎能连成了一片,所以加密门店占比更高。
接下来基于这一指标,对极海目前正在监测的重点品牌(门店总数≥300家)中,制作了一张全国门店密度的排行榜。
从图中我们有两点发现。一是将加密门店运用到极致的主要还是便利店行业,咖啡茶饮行业是近些年迎头赶上,逐渐崭露头角的,这一策略的应用其实也是有行业限制的。
二是榜单中有很多我原本并不熟悉的品牌,直到我百度了才知道这些品牌还挺厉害的。主要原因在于很多加密型的门店具有很强的地域性,在当地家喻户晓但出了这个地界就少有人知道,就在我们看不到的地方闷声发大财,这里其实蕴含了很多好的投资创业的机会等待大家挖掘。
其实做到这一步差不多就完成了基本的数据分析工作,但如果你要说服别人,最好提前想好你的应用场景,并用大家都熟悉的品牌证明你的指标分析是有效果而且是有意义的。
前文提到,由于我们很难预判不同行业不同品牌的门店辐射能力,所以我们分别取值10米、20米、30米直至2000米,分别计算了单品牌在不同的关联距离下加密型门店的占比,并将其描点成线。借助这根曲线我们还可以方便的看出不同品牌在选址过程中对门店间相互距离(辐射范围)的考量,并从中获得更多有价值的信息。
以瑞幸和奈雪为例,他们都曾号称自己要对标星巴克,但很明显,瑞幸对标的仅仅是星巴克的“咖啡”品类,而奈雪对标的则是星巴克的“第三空间”。
在瑞幸咖啡的布局中,占绝对主力的是快取店,这一类的门店面积通常在20~60㎡,吧台式设计搭配几张桌子和座椅,方便上班族上下班或午休时带杯咖啡。主打简配场景+自提+外送,单店辐射范围小,可以更密集的开店。
而一个典型的奈雪门店面积通常在200㎡以上,以打造一个“适合聚会和享受优质茶饮体验的舒适、高端的社交场所”。符合这样条件的高规格的门店即使在一线城市也是稀缺资源,这极大的影响了奈雪的拓店速度。而更高的成本需要覆盖更大的范围的客流才能盈利,在选址时就得避免门店过于接近相互蚕食。综合下来,奈雪的门店一定要比瑞幸稀疏的多。
这一点在二者的密度曲线图上得到了验证。这里我们需要进一步探讨一下关联距离的实质。关联距离其实就是一个门店的辐射范围,只不过由于我们很难事前预判,所以才将每种假设都画成现在的曲线%的加密型店铺占比为基准作线与曲线相交,大略估算瑞幸咖啡需要的辐射半径为520/2=260米,而奈雪的需要的辐射半径达到了1650/2=825米。
这样分散的大店布局给奈雪带来两个问题,一是制约了门店的规模的拓展速度,二是增加了物流配送和管理的成本,尤其是强调高品质新鲜茶饮的奈雪中含有大量对配送条件要求极高的鲜果与鲜奶。
也许正是认识到了这一点,奈雪正在试图积极布局Pro店。和以往主要在大型商场选址不同,Pro店强化了在高级写字楼及住宅社区选址的布局,移除了现场面包房区域,转而销售中央厨房的预制烘焙产品,以减少门店对面积和人工的需求。
虽然目前Pro店在门店中的占比虽然只有18%,但从2020年11月开始,奈雪PRO逐渐取代常规店成为新开门店的主流类型。而按招股书重的计划,今明两年规划拓展的750家门店中,有70%将是PRO店。
我们分别计算了不同条件下奈雪门店的密度曲线,可以明显的看到,含有PRO店的布局,让奈雪门店的密集程度有了显著的提升。这对即将上市的奈雪而言,有两方面的意义,一是扩大的适用场景,预期门店规模上限将被调高,这让估值有了更充分的支撑;二是中央厨房配送和加密门店的策略有助于系统性的降低成本,优化目前的单店模型,增加盈利水平。
现在让我们在对比中加入星巴克的密度曲线,与我的预期的不同,以“第三空间”著称的星巴克与瑞幸咖啡的门店密度基本一致,但要远高于奈雪的茶。我们之前做过推论,高密度和大面积是很难兼容的,那么这样高的密度还能支持一个具备强社交功能的“第三空间”吗?
实际上,这些年来,对星巴克“第三空间”模式质疑的声音是一直存在,尤其是在星巴克与阿里巴巴合作上线年。>
最开始,专星送仅在北京、上海部分重点商圈展开,但截至目前,82%的星巴克门店都覆盖了这一服务,截至2020财年的第四季度末,星巴克中国的“第四空间”(即数字业务,包括专星送外送服务、啡快手机点单服务)营收占比已经超过了26%,并且持续快速增长。
对于以单店营收有限的餐饮企业而言,门店规模就是估值未来,门店不增长,有时候甚至比没有利润还让人焦虑。截至目前,星巴克在中国内地已有5091家门。