许多人认为,要成为成功的数据科学家,必须掌握编程、了解分析工具和统计学等技能。这些技能确实必要,但还不足以区分一个优秀的数据分析师和平庸的数据分析师。一个优秀的数据分析师与平庸的数据分析师之间的关键区别在于,他们能够将复杂的问题框架化,做出简化的假设,分析问题,然后提出解决方案。而分析工具只是实现这一过程的手段。
在今天的文章中,将通过一个案例研究来探讨这种结构化的问题解决过程。将学到什么?在这里,将找到实践问题,以训练大脑在解决复杂问题时进行分析性思考。这种大脑训练不仅会向介绍一种新的问题解决方法,而且还会帮助在处理数字时思考得更快!
为了更好地解释,考虑一个简化的场景:两辆车从第一个交通信号点A开始。点B是一个交通信号,停车时间为60秒,行驶时间为20秒。A和B之间的距离是600米。Car1以5米/秒的速度开始,Car2以6米/秒的速度开始。谁会先通过交通灯?这里是假设条件:
1. 交通灯配置为平均速度,第一个信号变绿后120秒(600米/5米/秒)变绿。
2. 交通灯绿灯持续20秒,红灯持续60秒(20*3)。
假设两辆车都在0秒开始。
Car1到达信号B的时间 = 600/6 = 100秒
Car2到达信号B的时间 = 600/5 = 120秒
灯在(40,60);(120,140);(200,220);(280,300)变绿。
因此,61秒到达点B的车和140秒到达的车在通过第二个信号时没有区别。让计算最小和最大速度,这将显示在两个信号场景中没有区别:
最小速度 = 600米/120秒 = 5米/秒 = 18公里/小时
最小速度 = 600米/61秒 = 9.8米/秒 = 35公里/小时
在这个场景中,无论以18公里/小时还是35公里/小时的速度驾驶,都会在同一时间通过第二个信号(B)。一般来说,在高峰时段的交通中,很难以如此宽范围的速度驾驶,因此担忧现在看起来是合理的。可能无法控制到达办公室所需的时间(这显然是对问题的过度简化)。
让使其更加复杂……!现在有4个信号A、B、C和D。同样的两辆车从A开始,在0秒。AB、BC和CD之间的距离相同。现在的问题是,谁会先通过信号D。
不涉及数学,答案非常直接。如果两者同时通过B,A-B对与B-C对相同,反过来C-D对也相同。因此,两辆车将同时通过D。实际上,保持平均速度18公里/小时的车和35公里/小时的车将同时通过D。这进一步加强了假设。
问题再次归结为:“当开车去办公室时,只是一个无助的木偶,受交通警察控制吗?”让将其概括为参数方程。实际场景太难在本文中概括,所以让建立一些假设:
1. 交通灯变绿t秒,然后变红3t秒
2. 道路上车辆的平均速度是v米/秒
3. 挑战者以x倍v米/秒的速度驾驶
4. 所有道路的长度为l米
到目前为止,已经知道,解决一个交通灯对或更多对的问题几乎无关紧要。如果更快的司机能够在绿灯前通过交通灯,平均车辆则不然。因此,实现这一点所需的时间差将是3t。以下是正在解决的最终方程:
平均车辆所需时间:l/v秒
更快车辆所需时间:l/vx秒
简化为:
l/v - l/vx > 3t
已知x、v、l和t都是正数,这可以进一步简化为:
xl - l - 3tvx > 0
x(l - 3tv) > l
这是一个大奖!知道l总是正数,因此要使上述方程实用,x和(l - 3tv)都必须是正数。这意味着如果3tv超过l,就没有机会打败交通灯。例如,如果t = 30秒,v = 5米/秒,l = 145米,即使以子弹的速度驾驶,也无法战胜赔率!
让假设一些参数,进一步理解这个方程:假设l = 600米。方程变为:
x(200 - tv) > 200
这里有一些经验法则,可以让有可能打败交通信号:
- 最小化t(交通灯周期):在交通灯快速变绿-红的地区,有可能打败交通灯。
- 最小化v(道路上的平均速度):如果道路上的平均速度异常低,可以快速驾驶以打败这些慢速司机(当然!)。
- 最大化x(更快的乘数):如果超速驾驶,仍然可以赢得比赛。但请注意,如果v*t超过200,就没有机会获得。
不要错过:介绍结构化思维和分析的艺术。让尝试可视化一些关系。
x(l - 300) > l
- 在3 * 绿灯时间 * 平均速度超过道路长度的车道上驾驶快速是没有意义的。
- 如果以下条件对有利,打败交通是可能的:
- 高x。驾驶得非常快(不安全的选择)。
- 高l。例如,在高速公路上快速驾驶是有意义的。
- 低t:在高计时交通信号的道路上驾驶快速是没有意义的。
- 低v:如果道路上的平均速度非常低,可以打败他们。已经知道这一点!