RockAI,一群要替代Transformer的中国年轻人

在“百模大战”打得不可开交的群替轻人时候,一家成立于2023年6月的代T的中中国AI初创企业试图掀翻2017年谷歌提出的Transformer架构,深入更底层做创新。国年
Transformer是群替轻人目前主流生成式AI所采用的架构,包括引发这一轮AI热潮的代T的中ChatGPT在内。谷歌发布Transformer架构的国年论文标题说,注意力即为一切(Attention Is All You Need)。群替轻人
这家名为RockAI(岩芯数智)的代T的中中国企业却想通过架构创新,减少冗余计算和算力消耗,国年要“让世界上每一台设备拥有自己的群替轻人智能(Make every device its own intelligence)”。
不到两年,代T的中他们取得了不错的国年进展。RockAI做出了Yan架构,群替轻人在2024年1月发布中国首个非Transformer架构Yan1.0大模型,代T的中之后将其迭代至多模态Yan1.3版本,国年可高效处理图文、语音等多模态信息,适配树莓派、无人机、机器人、PC、手机等各类终端设备,在弱网环境、硬件和算力不那么高的条件下实现端侧智能。
在RockAI位于上海的办公室,在一个全开放式办公区里,坐着他们的全部团队约60人。这一群极客少年工作起来十分投入,叫他们名字时通常会被置若罔闻,必须得拍一下肩膀,对方才可能反应过来。
2025年3月底,南方周末研究员在这里见到了RockAI的两位联合创始人刘凡平、邹佳思。温和、内敛,甚至还有些斯文,他们的外表和谈吐,实在不像是喊出如此张扬口号的野心勃勃的创业者。
实际情况便是如此。他们曾在互联网大厂里从事过搜索、游戏开发工作,还有过短暂的小型创业经历,在二三四五网络科技股份有限公司(以下简称“二三四五”,岩山科技(002195.SZ)前身)共事期间一起优化Transformer,穷尽各种可能之后,他们一拍即合,决定创业,建自己的AI架构。
“如果以前是‘软件定义硬件’,那么未来则是‘智能定义硬件’。”RockAI创始人、CEO刘凡平对南方周末表示,智能终端是走向通用人工智能(AGI)的“最优载体”,它的形态将根据需求千变万化,扮演真正的“变形金刚”(Transformers)角色。
就像ChatGPT引爆生成式人工智能革命,DeepSeek颠覆“算力霸权”,Yan架构和它所处的中国制造生态,能否带领群体智能走向AGI?
从底层架构革新
南方周末:你们最早什么时候意识到大模型的效用?
刘凡平:从外界来看大模型好像近两年才爆发,但我们所学专业和工作经历都与算法高度相关,在相关技术最初出现时就有感知,2019年团队做搜索推荐业务时就想用Transformer架构解决问题。几次尝试,
相关文章
- 发布者:小宁 浏览量:6461发布时间:2022/3/28 15:51:11 除了旅途,你有多久没吃方便面了?对于方便面市场的发展瓶颈,即使是行业大佬也表示很无奈,传统方便面2025-09-07
- 日前,丰泽区发布2022年小学招生工作意见。今年小学招生工作总体延续2021年招生办法,仍坚持“划片招生,就近入学”的原则,略有调整。与去年相比,丰泽区小学招生政策主要有以下几2025-09-07
- 双塔奇兵难得罕见 浓眉考神能否重现先辈传奇?发布时间:2019-09-07 15:42 来源:豫都网 我要投稿[摘要]奇幻巨著《指环王》第二部就叫做《双塔奇兵》,讲的是兵分两路,弗罗多和山姆前往魔多山2025-09-07
- 交通执法部门:严厉打击出租车违法行为如遇无良司机,旅客可拨打12328投诉厦门日报讯记者 汤海波 通讯员 魏晓红 辜永志 林明和)记者从市交通执法支队了解到,1月1日至10日,交通执法人员查获拒载、绕2025-09-07
該擔心嗎?5大股市泡沫指標:市場多焦慮?台積電效應很危險?|天下雜誌
【理財五角課,每週三推出】股市飆漲,人們開始擔心,短時間內抓到手的財富究竟是不是黃粱一夢?股市泡沫,究竟要看哪個判斷指標才準?您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀2025-09-07- 东南网1月20日讯本网记者 文洁 通讯员 林睿)18日晚,第11届南普陀义工联欢晚会在厦门大学举行,社会各界爱心人士南普陀义工一起共同回顾过去志愿服务取得成果,展望义工事业未来,喜迎新春佳节。南普陀寺2025-09-07
最新评论