那人,那年,那些事儿

Wu Rui bio photo By Wu Rui Comment

2014年5月27日,小吴来到哥村刚好21个月。此时国内打车软件激战正酣,百度投资了Uber,腾讯入股滴滴,阿里支持快滴。表面上看是打车之争,实质上是对线下支付,O2O入口的争夺。高潮时期,三家都日均烧钱一个亿来补贴用户,力度之大是过去的互联网从未经历过的。另一边,外卖业务开始冒头,被认为是团购后的下一个爆发点。这时美团、大众点评还未合并,但都相继在外卖领域布局,新贵饿了么线下疯狂扩张配送体系。如果继续走现金补贴的路线,很快也要进入资本战争阶段。

闪回美国三线城市哥伦比亚,春季学期已经结束,小吴研究生阶段的主要课程已经修完,接下来主要是完成实验和写毕业论文了。5月27日是个重要的日子,通过朋友介绍的机会,小吴终于开始了在美国的第一份兼职工作。雇主Campus Facilities(CF)是学校负责基建和设施维护的一个独立部门。小吴所属的IT团队为CF做内部应用系统开发,支撑管理工单、合同、供应商等。也偶尔会帮助学校HR部门做一些项目,维护或搭建新的人事和工资系统。

小吴的mentor是个美国人叫Cayle,体型肥硕但是能灵活的坐着办公椅转来转去。桌面上有每日依赖的药物,也有汉堡可乐这样的快餐,喜欢吃各种豆子配玉米薄饼的墨西哥菜。Cayle是团队的技术主力,带着小吴用J2EE + Vaadin来做Java的全栈开发。全校统一购买Oracle的服务,license和服务每年都会花掉学校十几万刀,换来的是书架上每个版本的PL/SQL Programming和偶尔需要的远程电话支持。在这样一个美国中部的小城,Cayle过着典型的中产阶级生活。做着稳定的技术工作,定时上下班。家里住着小别墅,休息时间也在花园里种一些小番茄之类的蔬菜。

工作时间一开始难以适应,早上7点半上班,下午4点下班,中午半小时午餐时间。小吴每天都要起个大早,骑着借来的自行车纵穿Hitt Street,经过校医院,到达南部停车场附近的办公室,午饭经常是顶着太阳骑车回到学校食堂解决,而后没有太多休息时间,工作到四点再骑车回去,所以晚上的时间往往还很充足。那时候的薪资是13刀/小时,根据美国法律,暑期可以每周工作40小时,开学后就只能每周20小时。时薪在学校内部尚可,对比去餐厅打工的是8刀/小时,但是远远低于硅谷FLAG的实习薪资。第一个月结束小吴在BlueNile上买了一颗小石头送给女友,女友也很是喜欢。后来对比国内柜台,价格也是超值了。

在CF一直做到12月硕士毕业,8个月的收入支撑了小吴回国前一整年的开销还有剩。开学后的日子也很充实,上午上班,下班做实验写毕业论文。钱包鼓了以后生活也更滋润了。每周去沃尔玛采购一次,水果最爱车厘子和马奶葡萄,十块钱的能吃一周。偶尔煎一块黑盒装的牛眼肉,锅里一滴油都不放,煎好以后休息两分钟,一滴肉汁不流失。餐厅最爱吃chipotle,墨西哥的烤肉卷有肉有饭有蔬菜,口味也喜欢,一顿7块5。外卖最爱吃多米诺的披萨,加鸡翅的套餐13块钱,也是超值。

北美的校园生活特别容易让人沉醉其中,舒适的环境,不大的课业压力。不少留学生会因为这样那样的原因在学校多待上一年甚至几年。读个minor吧,双硕士也不错,咬咬牙读个博士,甚至单纯因为论文或是找工作的原因延毕。不同的人有不同的人生进度,有时候缓一缓也未尝不好,但关键时候还是要把握自己,走出舒适区,以免有违初心。

2015年2月21日,小吴第一次来到硅谷。毕业季应聘的过程并不顺利,在毕业舒适区中沉浸了两个月的小吴心态发生了变化。从开始的不慌不忙,到接受Google、亚马逊等大公司相继面试失利后的惨淡现实,着实感受到自己需要一些变化。这按罗永浩的说法,是需要一种艰苦凄惨的环境来磨练自己,烘托背水一战的气氛。所以没有太多准备,小吴带着一套正装就搭上了飞往旧金山的飞机。

程序员在美国找工作无外乎几件事:1. 找一个大都会落脚 2. 反复的刷题 3. 找人内推

非常幸运,两天后小吴就在craigslist上找到了一位不错的房东。房子位于圣何塞一个安静的街区,院子里自己搭出来的一间房,没有厕所,但是房东提供了被褥,厨房里的锅碗也可以借用。房东Lucy是珠海人,老家的房子据说和澳门只隔一条马路。Lucy家乡有出海打拼的传统,先来的人站稳脚跟以后就拉帮带,逐渐在加州本地自成一派。Lucy会理发,在圣何塞开了一家美容+理发店。在硅谷这样的地方语言不构成问题,牙医有中国人开的,律所有中国人开的,所有中文服务印成了一本厚厚的中文黄页。Lucy还拉帮带了一个表哥。表哥会装修房子,小吴住的单间就是他在后院里搭出来的,他自己的单间就在对面,Lucy不收他房租。表哥40岁了还没结婚,也没什么积蓄,喜欢唱歌,小房间里放了一套音响,经常放着“为你我用了半年的积蓄,飘洋过海的来看你”。

题刷的很快,内推也很有效,陆续经历了不少笔试、面试、onsite。在这个过程中隐隐感觉到一些问题。首先是职位,后端开发的职位很多,但大多是应用开发的职位,大数据类的核心研发我基本没有碰到。其次是老印无所不在,下到程序员,上到CEO,无处不卡着你。小吴印象最深的是去面试德勤位于奥兰多的一个研发中心,在休息室等待的candidates除了小吴还有三个老印,面试官还是老印,公司除了高层95%都是印度人,真是让人感受到一种印度恐惧。后来偶然的机会看到国内的招聘机会(刚兴起的拉钩),抱着试一试的心态小吴选投了8家公司的大数据/机器学习岗位。居然每个都快速回复了,有家甚至直接安排第二天在北京SOHO面试。面试节奏很快,最终选定的是一家安全行业的创业公司在成都研发中心的算法岗位。后来多次有朋友问为什么选择创业公司,小吴都回答说其实也没考虑太多,价钱合理,离家近,职位喜欢,还能期望什么更多呢。

前后在加州只待了一个月,Lucy和表哥待小吴都很好。Lucy好交际,朋友广。经常分享一些朋友农场送来的菜,还免费给小吴剪过头发,一次晚餐上的海石斑和白斩鸡现在都还能回忆起食材的鲜美。走之前听说表哥也要回珠海相亲了,不知道在飞机上听着这首“漂洋过海来看你”的他是什么心境。

小吴在硅谷期间滴滴、快滴完成了合并,4月份58、赶集宣布合并,11月份美团和大众点评发布联合声明。2015年,O2O市场格局已定,资本寒冬下初创公司死伤惨重,行业巨头纷纷合并。百度推出糯米,阿里打造口碑,京东开启到家,头部公司继续在资本市场投入的同时也在自有业务上发展布局。2015另一个特点就是,三巨头正在不断瓜分天下。各个垂直领域的创业公司在战场上打的头破血流,在接受巨头持续输血的同时也逃避不了逐渐成为巨头生态组成的命运。

2015年5月5日,青年节的后一天,小吴在成都入职。成都做为一个二线网红城市在IT领域也有一定的产业聚集,一些互联网指数报告中把成都排在北上广深杭之后的第六名。不少大企业考虑到人才和成本优势在成都开设了研发中心。开发出王者荣耀的腾讯天美L1工作室就地处天府三街的腾讯大厦,另一边蚂蚁金服已有上千名员工入驻了天府四街的蚂蚁C空间。在某些细分领域,比如游戏开发,成都有着相当规模的产业集群和历史积淀。但是,缺乏本土独角兽和近年房价的上涨让成都未来的发展有点堪忧。从员工成长的角度,由于远离总部经济和创业中心,职级和薪资的天花板看得见摸得着。从成都最近两年的人才流入流出也能看到新的围城,外漂的游子想回成都过上有生活的日子,往往先要接受降薪;本地的人才想要有更好的发展,就不得不背井离乡,加班加点并且承担更高的生活成本。

2015年的时候公司还是A轮创业阶段,合着北京的员工一起算,小吴拿到了35的工号。北京office负责做产品和项目,成都刚起步,前期主要由领导带着一起做安全研究,向项目上输出一些算法能力。研究的核心就是应用各种机器学习的方法解决安全问题。比如调研图数据库、算法,把公司采集的流量数据用图的方法构建起来找异常点。又比如做时间序列分析,调研业界开源的各种时序算法,在公司数据集上测试,从关联分析角度做correlation算法,做可视化分析等等。网络安全对小吴来说空白比较多,同步不得不恶补网络安全的基础知识。互联网上的基础架构DNS、ASN、BGP、Whois等;传统的安全设备、认证、厂家、服务;新兴的移动安全、云安全、IoT安全等问题;还有公司产品的核心——安全管理;诸如此类,不一而足。

公司施行扁平化管理,成都的同事都汇报给一个领导。领导是东南大学少年班毕业的天才少年,因此出道特别早,2004年就加入了趋势科技,离职前是趋势技术级别最高的专家。小吴印象最深的是2017年在北京团建时CEO说过的一句话,“因为Justin就想待在成都,那我就可以为他在成都开一家分公司”,可见领导在公司的分量。领导还是通才,涉猎很广,学习东西又够快够深。给安全研究组指导方向,这是本行,但还能指导算法人员,对各种异常检测技术的优劣也是烂熟于心,用深度学习攒一个异常检测模型,只要半天就能调个不错的结果。做数据可视化方案,2D、3D都可以快速实现验证原型。对大数据前沿技术的发展保持敏感,对核心DAG的优化也有不少实践经验,主导公司大数据实时处理系统的架构。甚至在设计和交互上还能细致的指导,让公司产品的UI、UX提升非常大。

2016年是人工智能走向主流的元年。AlphaGo击败李世石,宣告破解人类最复杂的游戏。百度推出Level4的无人驾驶,自动驾驶事业部负责人王劲宣布获得加州官方许可的测试牌照。IBM、微软、Facebook纷纷推出人工智能平台,使其生态圈内的开发者进入通用人工智能时代 AI-as-a-Service。

安全领域,各公司的老总们也开始思考人工智能时代企业所面临的新挑战。从内而言如何应用人工智能、机器学习算法提高自己产品的防护能力、威胁检测能力,降低对专家干预的依赖,减少人工运维的成本。从外部推动来看,企业客户越来越专业,对厂商技术能力、产品成熟度的要求越来越高。更有追逐时尚的客户直接要求厂商具备机器学习算法能力。有的竞标测试中,大数据存储计算,算法检测模型两大能力可以占到50%的技术评分点。

360在2015年成立了人工智能研究院,由知名机器学习专家颜水成担任研究院长,主要任务是完成人工智能相关方向的原始技术积累和安全领域垂直应用的探索。2017年,360团队在‘人工智能’世界杯ImageNet竞赛中拿下单项第一和团体冠军。全球市场来看,已经有80+的安全公司引入了人工智能技术进行安全分析。在各种安全峰会上,越来越多的议题和人工智能有关‘人工智能与安全’‘威胁情报与安全智能’‘云计算与大数据安全’等等。2018年的RSA大会,各厂家的展台上更是无AI不安全。

跟传统安全的攻击与防护不同。小吴所在公司所做的安全管理处理的更多是一条一条的日志,从海量日志中关联、提取威胁事件,提高安全运营的效率。通过大半年的摸索,小吴发现对不同的客户数据可以有一个统一的基本的处理流程,从数据清洗到特征提取,再到几类经典算法的异常检测。这可不就是一个分析师的三板斧么,如果能把这个过程自动化,那以后无论来了谁家的数据,都能快速输出一些结论。顺着这个思路,2016年1月,小吴演示了【 基于profile的用户行为异常检测方法】,这也成为了后来UEBA的理论原型。

UEBA是User and Entity Behavior Analytics的缩写,意为用户与实体的行为分析。2014年美国咨询公司Gartner的副总裁Avivah Litan提出了UBA的定义,2015年更名为UEBA,2016年入选信息安全十大技术。

User and entity behavior analytics offers profiling and anomaly detection based on a range of analytics approaches, usually using a combination of basic analytics methods (e.g., rules that leverage signatures, pattern matching and simple statistics) and advanced analytics (e.g., supervised and unsupervised machine learning). Vendors use packaged analytics to evaluate the activity of users and other entities (hosts, applications, network traffic and data repositories) to discover potential incidents。

UEBA收集系统中任何设备和人产生的信息。最优的情况下会从网络设备、系统、应用、数据库和用户处收集海量的行为数据。利用这些数据,UEBA会在各个维度建立动态的基线以确定各种不同情况下的正常状态是什么。UBA最早聚焦在数据窃取、失陷账号、终端安全等内部威胁检测上,而后的UEBA更广泛的应用于了IoT安全、金融反欺诈、业务安全等领域。

演进到2018年,UEBA的市场也产生了一些变化。首先是UEBA自身的技术逐渐成熟,能够给客户带来的价值日渐清晰和明确。作为一种技术或者方法论,其应用场景逐渐的开拓和延伸,市场上除了少数专业玩家,像SIEM,IAM,EDR、DCAP等领域的厂商也开始广泛使用UEBA的技术,朝着多引擎、多核心、智能化方向演进。在智能化的同时,也给客户带来了困扰,如何自证技术有效性是厂商们普遍需要解决的问题。在应用人工智能的同时,PoC、部署的时间和成本大大增加,既要部署人员梳理复杂的业务,又要数据专家做数据分析。Gartner也针对性的提出了两点建议,一是清楚的定义UEBA要解决的安全场景以及对应输出的内容。二是对一些主要的用户场景,要做到数据源接入和对应分析模型的内置,以降低部署成本。

从2016年开始至2018年,小吴负责了UEBA从1.0到3.0三个大版本的研发工作。UEBA也从一个孵化项目发展成了公司的核心产品。广泛部署在了多个不同行业的头部企业中,如医药、券商、保险、航空、传统能源国企等。这三年中转变最大的,是小吴的角色定位。在UEBA之前,小吴主要是做机器学习的应用研究,每天日常工作是读最新的论文,处理数据,做验证性测试。研发1.0版本时,小吴做起了Java研发,承担了工作流架构设计的工作。到2.0的时候,UEBA要真正产品化。小吴带起了一个小的研发团队,有算法的同学,有Java同学,有前端同学,还第一次引入了UX。给客户的输出也更专业了,场景列表、客户案例、技术说明、用户手册等整套文档。到了3.0,产品定位和销售模式愈加清晰,研发层面也汇聚了更多资源。UEBA不仅要分布式、实时化,还要支持更多的应用场景,灵活的业务模型定制,复杂的机器学习工作流。小吴的角色重心又转向了产品,对行业的调研,客户价值发现,新功能定义,和UX定设计稿,和公司产品经理讨论数据模型、业务模块整合。作为内部创业项目,除了产品研发层面,对外沟通的工作还占了小吴一半的时间。产品功能、新技术、路线图需要不断的向客户、向销售、向公司内其他团队输出,取得他们的认可。项目上需要帮助梳理需求,审核方案,参与PoC和实施,解决各种问题。时常还要承担公司对外PR任务。到2018年,能够沉下心来做技术做算法的时间越来越少了,这也是小吴后来离开公司的原因之一吧。

抛开技术细节,在Justin带领下最令小吴受益的是,如何做一个2B的产品。超脱于具体的问题,其基本套路可以抽象成:

  1. 问题调研:新问题还是老问题?如果是老问题,学界有什么研究成果,业界有没有成熟的解决方案,公认的benchmark是什么,可能的提升空间在哪里,对应给客户带来什么价值。如果是新问题,那如何准确的定义问题,近似问题有哪些,有哪些可以迁移的方法,如何评价效果,是否真正对应了客户需求。
  2. 快速验证:对论文方法、开源代码进行快速复现,验证其benchmark,同时验证该方法在公司数据集上的适应度。对数据库有依赖的,快速收集行业方案,选取公认前五的用公司数据集做benchmark。在此基础上,对创新的方法做验证,看有没有提升。这部分和写论文的流程类似,核心在于快而精,但不求全。
  3. 价值判断:行业公司有什么方案,甚至什么产品,解决了客户哪部分问题。我们的方案、产品解决客户哪部分问题。我们的侧重点要放在哪里,价值点在哪里,与其他厂商有什么交叉,有什么不同。我们带来的这部分价值,与客气期望的价值是否对应,等等。这些问题都决定着产品是否走在正确的方向。
  4. 产品化:确定客户价值后,要定义需求优先级,设计ROADMAP,细化PRD,做好研发管理的各个方面。
  5. 业务方验证:东西做出来了,需要在业务方或者客户那里做beta测试。首先验证有效性,是否解决了客户问题,解决的过程和结果客户是否满意。其次是系统稳定性,易用性,从体验上进行优化。最后是模型的可解释性,泛化能力等。
  6. 交付:正式版交付前需要将剥离核心层封装起来,接口化,只开放外围业务代码给具体实施的业务方,以降低定制成本、维护成本,同时保证核心模块的安全。
  7. 迭代:任何产品都需要根据客户反馈进行迭代。

2018年7月9日,小米公司正式登陆港交所。八年了,当年一起喝下小米粥的13名创业伙伴终于迎来了敲钟的这一天。在手机这个地狱战场上,小米初期毫无硬件经验,却用三年时间就做到了全国第一,之后又用三年半做到了印度第一。在手机的巨大成功下,小米通过自建生态链改变了100多个行业,小米电视到小米手环,从移动电源到平衡车,再次拿下了多个市场第一。小吴是小米的小粉丝,他任务无论小米生态在成长过程中并发了多少问题,‘让每个人都能享受科技的乐趣’这样的愿景仍然是美好的。

在小米敲钟前一周,小吴迈上了职业生涯的下一个台阶——阿里巴巴。阿里巴巴已经迈过了19个年头,并已经在2014年上市,马云希望阿里能成为员工幸福指数最高的企业,并成为一家“活102年”的企业,横跨三个世纪。阿里集团还拥有庞大的电商帝国,淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络,阿里大文娱等,每一个都是垂直领域的一方诸侯。小吴工作的是集团的安全部,为以上这些业务部门做安全防护,保证大家的购物高效、安全。

放弃家乡的工作,放弃舒适的工作环境,与家人分离,这样的选择需要勇气。但相信阿里巴巴的工作阶段一定能够给小吴的职业生涯带来更大的不同。

comments powered by Disqus