大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤
大模型创业太累,又一大牛决定重回大厂。
Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2、Bard的重要参与者。
本周是他回到谷歌的第一周,也是他离职创业一年半之后,选择回归老身份的开始。
他将继续担任谷歌DeepMind高级研究员,向谷歌大神、也是他之前的老板Quoc Le汇报。
回顾过去这段创业经历,他表示学到了很多,比如基础设施方面的知识、如何从头开始训练大模型等等。
但与此同时,他也经历了一些不那么好的时刻:
公司费劲筹集的一亿多美金,对于一个不到15个人的团队仍然紧张,还差点卖身自救。
个人层面,他的身心健康受到了很大影响。由于工作强度大和不健康的生活方式,他还长胖了15公斤。
为此他表示:
放弃舒适区并创业对我个人来说真的很可怕。
大牛重回谷歌大厂
去年三月末,他官宣离职谷歌参与创业RekaAI,并担任该公司的首席科学家。
在此之前,他在谷歌大脑工作了3.3年,参与诸多大模型的研究,撰写累计约45篇论文,其中16篇一作,包括UL2、U-PaLM、DSI、Synthesizer、Charformer和Long Range Arena等,约20次产品发布,妥妥大牛一位。
从技术角度上讲,他坦言学到了很多关于在谷歌没法学到的知识。
比如学会使用Pytorch/GPU 和其他外部基础设施,以成本最优的方式从头构建非常好的模型。
为此他还在个人网站上分享了相关经验:训练模型的首要条件是获取计算能力,但这一过程就好像买彩票。
并非所有硬件都是一样的。不同算力提供商的集群质量差异非常大,以至于要想训练出好的模型需要付出多大的代价,这简直就是在抽签。简而言之,LLM 时代的硬件彩票。 这与在谷歌使用TPU相比,这些GPU的故障率让他大吃一惊。
此外他还吐槽外部代码库的质量远远落后谷歌的质量,这些代码库对大规模编码器-解码器训练的支持非常少。
但这种持续遇到问题持续解决的经验, 并非痛苦反而很有趣,并且最终凭借着自身技术实力也挺了过来。
在创业初期,他们的旗舰模型Reka Core在Lmsys首次亮相,就跻身第7位,公司排名前五,实现了对GPT-4早期版本的超越。
目前他们主要有四个模型,适用于不同的应用场景。
而真正“打倒”他驱使他离职的,是更为现实的原因。
就公司层面来说,作为初创企业,其资金、算力和人力跟其他实验室相比都要少得多。
就算他们分批筹集了一亿多美金,对于一个不到15人的团队仍然不够。
今年5月Reka AI还被曝出卖身自救,Snowflake正就以超过 10 亿美元收购Reka AI的事宜谈判。
不过现在来看,收购事宜还没有谈成。在Yi Tay宣布新动向后,他们紧急发声,现在公司还在积极招人ing。
而就他个人来说,这是段非常紧张的时期。尤其刚开始创业的时候妻子怀孕,他不得不同时兼顾两边,由此身心健康受到很大的损害。
并且由于高强度的工作和不健康的生活方式,他长胖了15公斤。
不过他自己也曾透露过自己有睡眠障碍。
种种原因,他决定重回谷歌,回归到一个研究者的身份。
在初创企业世界探索了一年半之后,我决定回归我的研究根基。
在分享经历的开始,他写下了这样一句话。
回到谷歌之后,他将探索与大模型相关的研究方向,以高级研究员的身份,向大神Quoc Le汇报。
在博客的最后,他感谢了创业这段时间始终联系的谷歌老朋友。
并且还特地感谢了在新加坡同他共进晚餐的Jeff Dean,并且提醒他Google 很棒。(Doge)
谷歌老同事:欢迎回来
一些谷歌老同事在底下纷纷表示:Welcome back!感觉像是过了十年。
值得一提的是,像这种大牛重返大厂并非个例。
今年8月谷歌以25亿美元打包带走了明星AI独角兽Character.AI的核心技术团队,远高于Character.AI 10亿美元的估值。
其中包括两位创始人——Transformer“贡献最大”作者Noam Shazeer和Daniel De Freitas。其中Noam Shazeer出任Gemini联合技术主管。
这样看起来,对于这些大牛来说,大模型创业确实不易,重返大厂确实是个不错的选择,至少钱够算力够、安安心心做研究。
而随着新一轮的洗牌期到来,更多技术大牛朝着科技巨头聚拢,也已经初见端倪。

本文链接:http://www.tiefuzhen.com/game/202411/149068.html
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
盗贼pve天赋 盗贼三系天赋
首先**,本天赋使用范围如下:3、纯PVE玩家,想PVP?买双天赋去吧4、主手慢速拳套副手快速匕首的DZ(参考PPM实测,这个方案比较折中而且可 [详细] -
天天向上天佑 天佑上天天向上节目是哪一期
1、天佑在《天天向上》的出场是在20180202期。2、这一期节目中,天佑作为嘉宾参与了录制,与主持人和观众分享了他的音乐创作经历和心路历程 [详细] -
获取北地香料 的方法 wlk (获取北地香料的途径)
购买部落玩家可在城中找NPC米森希购买,联盟玩家可在城中找NPC德里克奥斯购买,达拉然城每日烹饪任务北地香料可通过完成达拉然城的每日烹饪任务获得,联...[详细] -
周星驰御用配音!著名配音演员石班瑜去世:享年66岁
快科技9月18日消息,据看电影官微消息,著名配音演员石班瑜于2024年9月17日上午去世,享年66岁。石班瑜原名石仁茂,绰号石斑鱼,1958年3月9 [详细] -
击破谣言!实测iPhone 16全系可用微信
快科技9月19日消息,iPhone 16系列评测解禁,经博主凰家评测测试,iPhone 16系列4款机型全系可用微信,击破了之前的谣言。此前在9月2日, [详细] -
口袋妖怪 口袋妖怪全流程图文攻略 (口袋妖怪口袋暴龙5.0最终版进化图鉴)
总览口袋妖怪和珍珠各有其之处,但从整体游戏体验和玩家反馈来看,口袋妖怪相对更为,优势对比故事情节和角色塑造口袋妖怪在故事情节和角色塑造上更为出...[详细] -
领主之塔 塔达林高阶领主
在DNF游戏里,领主之塔是一个非常好的活动副本,可以兑换到很多有用的史诗装备。那么有很多的玩家们还不清楚dnf领主之塔位置在哪?所以下面 [详细] -
饥饿游戏3 饥饿游戏3完整剧情
1、背景:在第75届饥饿游戏*后,女主凯特尼斯用弓箭射穿人工穹顶,利用电力场破坏游戏场。被前来救援的十三区飞机接走,同时被接走的贡品还 [详细] -
口袋妖怪红宝石神兽 口袋妖怪红宝石神兽有哪些
关于口袋妖怪红宝石神兽分布图,口袋妖怪红宝石神兽这个很多人还不知道,今天来为大家解答以上的问题,现在让我们一起来看看吧!1、口袋妖 [详细] -
可以先跟随游戏内引导进行游戏 进入游戏后 (跟着旅游团可以中途离开吗)
进入时间领主之塔只有在以下时间段开放,周六周日下午4,10~4,40周六周日晚间10,10~10,40每天有3张门票,强韧获取方式领主之塔内的怪物可以爆出强韧碎...[详细]