Raw Data Store
怎么讲Project
1.scope 足够大
你这个project涉及到的团队成员 10-20个还是 ABC 三个
impact 影响到的人 影响到的是哪些人还是哪个team 尽可能地量化
在公司做事的两个目的:
1.1 给公司赚钱
1.2 给公司省钱
把你做的项目跟公司的revenue联系起来
- 讲一个跟JD相关的project
讲project一定要讲跟岗位相关的project
- 要讲 difficult/challenge 以及你是如何解决这些问题
避免有流水账的问题
Difficults 和 challenge 可以分为2类:
3.1 technial relevant
注意一定不要loss 听众,要讲techincal部分讲明白
讲ML project
input 和 output是什么
数据量有多少
你是如何match the performance
你的success metrix 有哪些
你最后为什么选了这个model
你在数据处理过程中,有没有遇到data unbalanced的情况,你是如何处理的
3.2 Non-tech
体现 communication skills
体现 leadership
跟隔壁组A,B,C合作了一下,你impact了多少人
体现 ownship
你跟很多人一起合作,你有没有以ownship的姿态去对待他们
pm有哪些需求告诉你要做,你不能光是闷头做,你有没有push back,怎么商量,你是怎么一个角色
你虽然是管这一部分的,但是其他人做的跟这部分相关的,你也要去了解。把自己的ownship精神,在讲故事的过程中体现出来。
还有一个就是,你做完了这个project之后,你并没有直接撒手不管。你还是有去继续follow up这个project,尽管你还有其他project同时在做。 体现 end to end ownship.
比如你还是会时不时和负责这个project的组的人 开个会,比如你create 一个model,这个model的performance是怎么样。这个performance的变化之类的东西。体现你实打实的想为公司干活,将这个工作做好。
BQ 打分点
- scope
比如 challenge project?
scope比较大的 project
什么是scope大
1.1 project impact 大 影响其他组 影响 产品本身是一个提现
1.2 lead 的人 或者 合作的人
和 隔壁组的engineer合作
和 financial team 合作
和 legal team 合作
和 cross-functional team 合作
1.3 leadership 在scope大的项目里面 你的责任是什么
你是只负责写代码,还是说要负责沟通
跟leader 那边 negotiate or 扯皮
你作为一个engineer, 你要负责这个project的设计 —> scope 比较大
Design是你来做的
lead without authority
你mentor 你们组的两个人,你还impact其它组的人
你的manger lead你,他就是你的authority
你在这prject里面,你影响了其它组的人
其它组的人的manager又不是你的,所以是without authority
但是你influence them,让他们把你的project作为他们的authority
大家平常都很忙,手上有多个projects
你是如何发挥你的作用和影响,在mutiple thread的情况下,能让你的project往前推进,并且很好的完成。
- Ambiguity
相对于学校项目。在现实生活中,你的data都不可能是直接获得,你需要自己选择data cleaning,自己搭建data pipeline。
这里面就会有很多ambiguity
比如你要做的这个data pipeline, 之前没有人做过,那你需要做各种各样的research,跟隔壁组沟通。
别人全都不对,你要自己主动去学习,提现自己的主观能动性。
你可以说 你当下的这个project 是 groundbreak project
之前没有人做过,你是你们org第一个initiate这个project的人
而且你org没有人知道这个model是什么,怎么用
你就独立的lead这个project
把这个new initialitive, 然后克服了这么多ambiguitys,然后把这个再org中推进下去。
北理工
我想说 我在北京工作的时候,负责的电池寿命预测项目
目标是 建立 一个 SD 用来预测 电池的寿命
我主要负责带领 2 个 data engineer 来 完成这个项目 的业务逻辑的技术实现。
我的任务 主要是 保证 项目 顺利 正常 运行,并且 解决项目中的 技术 和 管理难题。
比如 制定计划 和 对任务进行分配。
首先 我带领团队 进入的深入调研, 研究了 多个电池寿命预测模型,并评估它们的可行性
然后 是 将任务分解为多个部分: data cleaning, data pipeline construction 和 modeling
然后根据每个成员的特点,将具体的任务 分配给他们。 比如 有个 成员之前 有过 数据处理的相关经验,我会将data cleaning 任务分配给他。
然后 设定 定期的regular meeting: 方便追踪任务进度 和 及时调整计划 来应该变动。
当然 在项目开发 过程中, 我们也遇到了一些难题:
比如 data 处理效率问题
为了解决这个问题,我提出了 批处理 和 并行化的 data cleaning方案
提高了数据的处理速度
从而提升整个项目的进度。
R: 最终 我们这个项目 按时交付,我们团队成功处理 超过1亿条数据,并且使用LSTM model提升了电池寿命预测的精度。
这个项目帮我们组通过了专家评审,并且获得来自外部机构的投资。总金额达到了500w。
L:
我从这项目学会 如何在 在复杂的环境中带领团队,有效的拆分任务来应对项目挑战。
并且意识到 成功不仅依赖于 技术能力,还需要良好的团队协助 和 管理能力。
并通过定期沟通 和 进度跟踪,客服挑战,实现业务目标。
memo 痕迹 ----> 多练 —> 提取关键词 —> 避免全程盯
电池预测 北京理工 data engineer —> chanllenge project
根据 manager的业务逻辑 从 技术角度开发一个一个电池寿命预测项目
主要是 通过预测新能源汽车电池退役时间,从而开辟一个新的项目,给公司带来新的业务收益点
在这个项目开发过程中 我带领两个data engineer 来负责 业务逻辑的实现
包括 raw data的清洗,data pipeline的搭建, modeling的选择
主要挑战是
- data 量大,且数据都是raw data 需要自己设计处理业务实现逻辑
- 需求不明确 && 需求在一开始不是很具体,就是一个大方向 开发一个系统用来预测电池寿命
- 刚入公司,缺乏对 电池相关业务的了解
- 项目复杂
Actions
-
do serach
1.1 收集跟电池相关的业务资料,学习影响电池寿命的相关要素
1.2 研究时序预测模型的相关资料,如何将时序预测模型应用到当前业务场景
-
召集同开会,进行brain storming, 并整理每个人的意见
-
根据收集来的信息,将复杂任务拆分,然后根据每个组员的情况,将任务分配给人大家
-
设定 定期的regular meeting,1. 针对项目中的变动和不足之处,及时的调整方向 和 2. 同步信息 3. 跟踪任务进度
完成项目,获得专利,并且量化结果
Action 参照 故事 —> Tell me about an accomplishment you were proud of
Tell me about the project you were most passionate about
I first did a deep dive into the payment gateway specification docs and was able to understand what the client actually needed.
Next, I met with the client’s payment processing team and integrated our solution with their test system.
After several iterations, I was able to ensure that transactions were being processed securely, quickly and reliably.
I communicated regularly with the rest of my team to ensure that my work was well integrated with the rest of the platform.
北理工 data sharding
关于Database sharding 部分的延伸可以采用这个
BQ —> Tell me a time you predicted something
Black Cow home page
2.1 home page load speed速度变慢,原因是 有一个功能的组件加载需要消耗大量时间
而且这个组件在首页
因此每次用户访问首页都需要load该功能
所以导致网站加载速度变慢
我想用这个经历 描述 自己 took out of the responsibility
我的主要责任是负责问卷功能的开发,而不是peformance optimization
但是当我发现这个功能之后,我认为它会影响到客户体验而且对产品长远发展有严重影响
所以主动承担责任来实现对这个问题的优化
首先是定位问题,如何定位
然后基于定位的问题,如何优化
优化 前端 upload file function
使用code split and lazy loadiing 优化 home page loading speed
使用 load balance 和 cache-client 优化 Voice recognition function
Black Cow 前端和UI/UX cross-function 合作项目
3D/2D 可视化 用户 wealth adivce
我另外一个故事关于Wealth Management System的是
和corss-function team合作
设计开发一个数据可视化的图标,用来像用户展示它们的推荐的内容
前端最初提出的是一个2D可视化图标,展示用户信息
在开发过过程中,我意识到3D的效果要大于2D,并且增加悬浮功能,比如当鼠标移动到相应模块
可以浮动显示更多的信息。
然后将我的想法分享给前端 和 manager
但是我的manager顾虑时间开发问题 和 临时更换方式会不会耽误进度
我首先是 do research
然后是基于我的调研,制作了一个3D 效果 的demo 和 2D效果的demo
并且 制定一个 开发计划 和 成本和时间评估
然后 召开会议 在会议上 展示效果 从而说服我的经理
最终,我在规定时间内完成3D可视化的功能开发
产品效果超过预期,这里你在帮我扩展一些结果。
Recommendation System
从用户角度思考, 说服别人
Item recommendation system —> missing DDL
学习项目 开发 movie recommendation system
challenge: 团队进度落后,面临DDL
Action:
- 立即召开会议 评估现状
- 重新分配任务优先级
- 引入额外资源(找经验丰富的同时帮忙)
Result:
- 暗示完成任务
- 学会项目管理经验
在sky blue,我作为项目组长负责开发一个item推荐系统。
项目中期我们发现严重落后于计划,离DDL只剩2周。
我立即召集团队开会,发现主要问题在于推荐算法的复杂度超出预期。
我决定采取以下措施:首先将功能分为核心和附加两类,优先确保核心推荐功能实现。
其次,我找到之前相关经验的senior manger请教算法优化方案。
最后,我每天跟进团队进度,及时解决阻塞问题。
最终我们在DDL前完成了所有核心功能,这次经历让我深刻理解了项目管理中及时识别风险和灵活调整策略的重要性。
others
sky blue - ecomerical website —>Tell me about a time you showed initiative and took the lead
fast moving store —> Tell me about a time you set a goal and were able to achieve it
mobile app 改为帮助朋友的start up公司 开发一个手机app—>Tell me about the project where you did your best work
make mistakes – e-commerical web – black friday – traffic load —> Tell me about a time you had to come to a decision in limited time