Raw Data Store

怎么讲Project

1.scope 足够大

你这个project涉及到的团队成员 10-20个还是 ABC 三个

impact 影响到的人 影响到的是哪些人还是哪个team 尽可能地量化

在公司做事的两个目的:

1.1 给公司赚钱

1.2 给公司省钱

把你做的项目跟公司的revenue联系起来

  1. 讲一个跟JD相关的project

讲project一定要讲跟岗位相关的project

  1. 要讲 difficult/challenge 以及你是如何解决这些问题

避免有流水账的问题

Difficults 和 challenge 可以分为2类:

3.1 technial relevant

注意一定不要loss 听众,要讲techincal部分讲明白

讲ML project

input 和 output是什么

数据量有多少

你是如何match the performance

你的success metrix 有哪些

你最后为什么选了这个model

你在数据处理过程中,有没有遇到data unbalanced的情况,你是如何处理的

3.2 Non-tech

体现 communication skills

体现 leadership

跟隔壁组A,B,C合作了一下,你impact了多少人

体现 ownship

你跟很多人一起合作,你有没有以ownship的姿态去对待他们

pm有哪些需求告诉你要做,你不能光是闷头做,你有没有push back,怎么商量,你是怎么一个角色

你虽然是管这一部分的,但是其他人做的跟这部分相关的,你也要去了解。把自己的ownship精神,在讲故事的过程中体现出来。

还有一个就是,你做完了这个project之后,你并没有直接撒手不管。你还是有去继续follow up这个project,尽管你还有其他project同时在做。 体现 end to end ownship.

比如你还是会时不时和负责这个project的组的人 开个会,比如你create 一个model,这个model的performance是怎么样。这个performance的变化之类的东西。体现你实打实的想为公司干活,将这个工作做好。

BQ 打分点

  1. scope

比如 challenge project?

scope比较大的 project

什么是scope大

1.1 project impact 大 影响其他组 影响 产品本身是一个提现

1.2 lead 的人 或者 合作的人

和 隔壁组的engineer合作

和 financial team 合作

和 legal team 合作

和 cross-functional team 合作

1.3 leadership 在scope大的项目里面 你的责任是什么

你是只负责写代码,还是说要负责沟通

跟leader 那边 negotiate or 扯皮

你作为一个engineer, 你要负责这个project的设计 —> scope 比较大

Design是你来做的

lead without authority

你mentor 你们组的两个人,你还impact其它组的人

你的manger lead你,他就是你的authority

你在这prject里面,你影响了其它组的人

其它组的人的manager又不是你的,所以是without authority

但是你influence them,让他们把你的project作为他们的authority

大家平常都很忙,手上有多个projects

你是如何发挥你的作用和影响,在mutiple thread的情况下,能让你的project往前推进,并且很好的完成。

  1. Ambiguity

相对于学校项目。在现实生活中,你的data都不可能是直接获得,你需要自己选择data cleaning,自己搭建data pipeline。

这里面就会有很多ambiguity

比如你要做的这个data pipeline, 之前没有人做过,那你需要做各种各样的research,跟隔壁组沟通。

别人全都不对,你要自己主动去学习,提现自己的主观能动性。

你可以说 你当下的这个project 是 groundbreak project

之前没有人做过,你是你们org第一个initiate这个project的人

而且你org没有人知道这个model是什么,怎么用

你就独立的lead这个project

把这个new initialitive, 然后克服了这么多ambiguitys,然后把这个再org中推进下去。

北理工

我想说 我在北京工作的时候,负责的电池寿命预测项目

目标是 建立 一个 SD 用来预测 电池的寿命

我主要负责带领 2 个 data engineer 来 完成这个项目 的业务逻辑的技术实现。

我的任务 主要是 保证 项目 顺利 正常 运行,并且 解决项目中的 技术 和 管理难题。

比如 制定计划 和 对任务进行分配。

  1. 首先 我带领团队 进入的深入调研, 研究了 多个电池寿命预测模型,并评估它们的可行性

  2. 然后 是 将任务分解为多个部分: data cleaning, data pipeline construction 和 modeling

    然后根据每个成员的特点,将具体的任务 分配给他们。 比如 有个 成员之前 有过 数据处理的相关经验,我会将data cleaning 任务分配给他。

  3. 然后 设定 定期的regular meeting: 方便追踪任务进度 和 及时调整计划 来应该变动。

    当然 在项目开发 过程中, 我们也遇到了一些难题:

    比如 data 处理效率问题

    为了解决这个问题,我提出了 批处理 和 并行化的 data cleaning方案

    提高了数据的处理速度

    从而提升整个项目的进度。

R: 最终 我们这个项目 按时交付,我们团队成功处理 超过1亿条数据,并且使用LSTM model提升了电池寿命预测的精度。

这个项目帮我们组通过了专家评审,并且获得来自外部机构的投资。总金额达到了500w。

L:

我从这项目学会 如何在 在复杂的环境中带领团队,有效的拆分任务来应对项目挑战。

并且意识到 成功不仅依赖于 技术能力,还需要良好的团队协助 和 管理能力。

并通过定期沟通 和 进度跟踪,客服挑战,实现业务目标。

memo 痕迹 ----> 多练 —> 提取关键词 —> 避免全程盯

电池预测 北京理工 data engineer —> chanllenge project

根据 manager的业务逻辑 从 技术角度开发一个一个电池寿命预测项目

主要是 通过预测新能源汽车电池退役时间,从而开辟一个新的项目,给公司带来新的业务收益点

在这个项目开发过程中 我带领两个data engineer 来负责 业务逻辑的实现

包括 raw data的清洗,data pipeline的搭建, modeling的选择

主要挑战是

  1. data 量大,且数据都是raw data 需要自己设计处理业务实现逻辑
  2. 需求不明确 && 需求在一开始不是很具体,就是一个大方向 开发一个系统用来预测电池寿命
  3. 刚入公司,缺乏对 电池相关业务的了解
  4. 项目复杂

Actions

  1. do serach

    1.1 收集跟电池相关的业务资料,学习影响电池寿命的相关要素

    1.2 研究时序预测模型的相关资料,如何将时序预测模型应用到当前业务场景

  2. 召集同开会,进行brain storming, 并整理每个人的意见

  3. 根据收集来的信息,将复杂任务拆分,然后根据每个组员的情况,将任务分配给人大家

  4. 设定 定期的regular meeting,1. 针对项目中的变动和不足之处,及时的调整方向 和 2. 同步信息 3. 跟踪任务进度

完成项目,获得专利,并且量化结果

Action 参照 故事 —> Tell me about an accomplishment you were proud of

Tell me about the project you were most passionate about

I first did a deep dive into the payment gateway specification docs and was able to understand what the client actually needed.

Next, I met with the client’s payment processing team and integrated our solution with their test system.

After several iterations, I was able to ensure that transactions were being processed securely, quickly and reliably.

I communicated regularly with the rest of my team to ensure that my work was well integrated with the rest of the platform.

北理工 data sharding

关于Database sharding 部分的延伸可以采用这个

BQ —> Tell me a time you predicted something

Black Cow home page

2.1 home page load speed速度变慢,原因是 有一个功能的组件加载需要消耗大量时间

而且这个组件在首页

因此每次用户访问首页都需要load该功能

所以导致网站加载速度变慢

我想用这个经历 描述 自己 took out of the responsibility

我的主要责任是负责问卷功能的开发,而不是peformance optimization

但是当我发现这个功能之后,我认为它会影响到客户体验而且对产品长远发展有严重影响

所以主动承担责任来实现对这个问题的优化

首先是定位问题,如何定位

然后基于定位的问题,如何优化

优化 前端 upload file function

使用code split and lazy loadiing 优化 home page loading speed

使用 load balance 和 cache-client 优化 Voice recognition function

Black Cow 前端和UI/UX cross-function 合作项目

3D/2D 可视化 用户 wealth adivce

我另外一个故事关于Wealth Management System的是

和corss-function team合作

设计开发一个数据可视化的图标,用来像用户展示它们的推荐的内容

前端最初提出的是一个2D可视化图标,展示用户信息

在开发过过程中,我意识到3D的效果要大于2D,并且增加悬浮功能,比如当鼠标移动到相应模块

可以浮动显示更多的信息。

然后将我的想法分享给前端 和 manager

但是我的manager顾虑时间开发问题 和 临时更换方式会不会耽误进度

我首先是 do research

然后是基于我的调研,制作了一个3D 效果 的demo 和 2D效果的demo

并且 制定一个 开发计划 和 成本和时间评估

然后 召开会议 在会议上 展示效果 从而说服我的经理

最终,我在规定时间内完成3D可视化的功能开发

产品效果超过预期,这里你在帮我扩展一些结果。

Recommendation System

从用户角度思考, 说服别人

Item recommendation system —> missing DDL

学习项目 开发 movie recommendation system

challenge: 团队进度落后,面临DDL

Action:

  1. 立即召开会议 评估现状
  2. 重新分配任务优先级
  3. 引入额外资源(找经验丰富的同时帮忙)

Result:

  1. 暗示完成任务
  2. 学会项目管理经验

在sky blue,我作为项目组长负责开发一个item推荐系统。

项目中期我们发现严重落后于计划,离DDL只剩2周。

我立即召集团队开会,发现主要问题在于推荐算法的复杂度超出预期。

我决定采取以下措施:首先将功能分为核心和附加两类,优先确保核心推荐功能实现。

其次,我找到之前相关经验的senior manger请教算法优化方案。

最后,我每天跟进团队进度,及时解决阻塞问题。

最终我们在DDL前完成了所有核心功能,这次经历让我深刻理解了项目管理中及时识别风险和灵活调整策略的重要性。

others

sky blue - ecomerical website —>Tell me about a time you showed initiative and took the lead

fast moving store —> Tell me about a time you set a goal and were able to achieve it

mobile app 改为帮助朋友的start up公司 开发一个手机app—>Tell me about the project where you did your best work

make mistakes – e-commerical web – black friday – traffic load —> Tell me about a time you had to come to a decision in limited time