Fireworks乔琳 我们的秘诀是什么 AI产品上市时间从五年压缩到五天 (fireworksmania烟花模拟器下载)

文章编号:43582 资讯动态 2024-12-09 人工智能Firework乔琳

在大模型革命的第一波浪潮中,许多初创公司和企业基于领先的闭源模型,如OpenAI的ChatGPT设计自己的商业模式。然而,随着越来越多新的开源模型的出现,大模型从训练转向推理,基于大模型的商业模式也在悄然改变。

最近,在人工智能领域,一家名为Fireworks AI的公司迅速崭露头角。在今年7月的B轮融资中,该公司在红杉资本的领投下筹集了5200万美元,估值达到了5.22亿美元。

作为一个SaaS平台,Fireworks AI专注于提供生成式人工智能推理和高质量的调优服务。公司致力于为客户打造速度快、成本合理且高度可定制的生成式人工智能(GenAI)解决方案,满足不同客户的独特需求。

在获得融资一个月后,Fireworks AI首席执行官乔琳做客红杉资本的Training> Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

简单、可以扩展:PyTorch和Fireworks的通用逻辑

乔琳创立Fireworks的初衷源自于一个特别的想法:缩短AI模型训练和推理时间,以此推动各种AI应用的繁荣发展。在training>Fireworks与开源

越来越多的开源项目让商业活动使用AI模型的成本越来越低,但乔琳认为,和其他开源项目对比,Fireworks的优势不仅仅在于针对客户需求定制模型。

与开源项目相比,使用Fireworks的成本更低,这不仅仅体现在经济成本上,还包括了开发成本。Fireworks提供的是一套现成的解决方案,它减少了在尝试和优化不同模型上所花费的时间和精力。

此外,Fireworks还能提供更低延迟的推理速度,以更低的成本实现更多功能。根据Fireworks官方数据,Fireworks的RAG速度比Groq要高9倍;Fireworks SDXL的图像生成速度比其他提供商的平均水平高6倍;Fireworks的推测解码速度更是能够达到惊人的1000个令牌/秒。

与开源原始模型相比,Fireworks能将成本降低五倍,甚至在进一步微调的情况下降低三十倍。以vLLM为例,FireAttention吞吐量比vLLM高15倍,Mixtral 8x7b的每枚代币价格要比vLLM低4倍。

Fireworks还提供了极致简化的自动化服务。Fireworks在后端进行了大量的自动化工作,包括自动调整复杂性和性能优化。这一点是许多仅提供基础库和工具的开源项目所不具备的。Fireworks构建了一个完整的系统,能够自动根据开发者或企业的工作负载进行调整,实现更高的性能和更优的质量。这种自动化服务不仅简化了开发过程,也提高了整体的效率和产出。

市场趋势与竞争

许多初创公司在探索创意产品与市场契合度时,倾向于从OpenAI起步。然而,随着业务规模的扩展,他们迫切需要选择性能更优、延迟更低的AI模型来适应产品市场的需求。在这一关键时刻,Fireworks AI能够提供既经济又性能出色的AI解决方案。

乔琳观察到,在与客户的互动中,与CTO的接触日益频繁,这反映出整个行业正朝着创新驱动型业务转型的方向迅速发展。这一转变的背后有两个主要原因:

首先,行业领导层都注意到了生成式人工智能(Generative Artificial Intelligence,GenAI)浪潮正在重塑行业格局。新兴的初创公司正在以惊人的速度涌现。如果现有企业创新速度不够快,不能高效利用生成式人工智能,就会很快被市场淘汰。

其次,生成式人工智能降低了AI模型训练门槛。传统人工智能训练中,一般只有大规模公司才能提供训练模型需要的海量数据和资源。但生成式人工智能的出现让人们可以在已有的基础模型上进行构建,通过微调得到合适的模型。

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

在这一行业变革中,通用小模型因其灵活性越来越受到商业用户的青睐。Fireworks提供了大量规模在7B-13B之间的开源模型,在降低成本的同时,使开发人员能够专注于更小、更集中的数据集,更高效地处理部分特定的业务。

尽管OpenAI等公司研发出了可随意使用的通用款人工智能,但在某些领域,通用模型缺乏业务逻辑,无法满足特定业务需求。

Fireworks AI的模型微调服务正是为了解决这一市场痛点。Fireworks要求客户或开发人员首先收集并标记业务数据,然后根据具体情况选择合适的微调算法,调整参数和模型权重等。Fireworks在后端处理复杂的技术问题,而在前端为客户提供一个简单易用的界面,并留给客户足够的设计空间。通过这种方式,Fireworks使客户能够轻松地定制和优化AI模型,以满足其特定的业务需求。

未来愿景

Fireworks AI的愿景是构建一个能够提供全面知识访问的简单API。

目前,公司已经开发了一百多个模型,包括大型语言模型、图像生成模型、音频生成模型、视频生成模型、嵌入式模型和多模态模型,实现了广泛的基础模型覆盖,并针对延迟、吞吐量和每个Token的成本进行了优化。

尽管这些基础模型集合了丰富的知识和训练数据,但它们所涵盖的信息仍然有限。许多实时数据无法被捕获,而且大量信息隐藏在不公开的API之后,无法直接访问。

为了克服这些限制,Fireworks致力于创建一个功能强大的API,它能够精确地调用不同的模型和API,实现对全部知识的访问。在此基础上,Fireworks想建立一个可以访问数百名专家的专家混合网络,每个专家都很小但很灵活,能够针对特定问题提供高质量的解决方案。

乔琳相信,随着AI模型规模收益的放缓,行业将转向更注重模型适用性的优化。Fireworks AI凭借其创新的技术和定制化服务,完全有能力引领这一行业转变,为用户带来更高效、更精准的AI应用体验。

谁是乔琳?

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks AI于2022年底在加州创立,乔琳是 Fireworks AI 的首席执行官兼联合创始人,她本科和研究生毕业于复旦大学完成了计算机科学专业,并拥有加州大学圣塔芭芭拉分校计算机科学博士学位。

2015年,乔琳加入了Meta(原Facebook)。当时正值公司AI技术从CPU向GPU转型的关键时期,需要从头开始设计AI基础设施。她带领团队研发了Caffe2等创新模型;并在后来的几年时间里带领由300 多名世界级优秀工程师组成的Meta PyTorch团队,领导开发了PyTorch及其周围的整个系统,乔琳也被誉为“PyTorch之母”。Meta PyTorch团队的研发成果给Facebook 数据中心提供了有力支持,并广泛应用于数十亿移动设备和数百万 AR/VR 设备。

乔琳从PyTorch上了解到了开发人员在AI开发竞赛中时面临的巨大障碍,找到稳定可靠的模型和架构和较低的模型总拥有成本。面对这处市场空白,乔琳选择离开Meta开启新的事业。她和Dmytro Dzhulgakov、Dmytro Ivchenko、James Reed、赵晨宇、Pawel Garbacki还有Benny Chen一起创立了Fireworks。这一批来自Meta PyTorch团队和GCP团队的精英在AI框架和AI基础设施方面有着深厚的背景,也正是这些专业知识能够让他们把复杂的AI构建不断简化,在保证灵活稳定的基础上降低AI的使用成本。

曾和乔琳在Meta同组研究AI Infra的贾扬清,也在去年创立了自己的人工智能公司,Lepton AI。Lepton AI和Fireworks属于同一赛道上的竞争对手。AI开发简化这个赛道考验的是团队的技术经验,只有技术大牛才有底气创立团队加入竞争。

乔琳的Fireworks也是打出了很有底气的口号,“用于构建可用于生产的复合 AI 系统的最快、最高效的推理引擎”。

原创文章,未经授权禁止转载。详情见 转载须知 。

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

全局中部横幅
三人小游戏,三人小游戏大全,三人小游戏无敌版,4399小游戏

4399三人小游戏大全收录国内外三人小游戏,三人小游戏无敌版,三人坦克小游戏,三人赛车小游戏,三人闯关小游戏,三人玩的小游戏,好玩就拉朋友们一起来玩吧!

广东领天机电专注东莞柴油发电机出租,深圳柴油发电机出租,惠州柴油发电机出租及发电机维

【广东领天机电】-【热线电话:13729996265】位于广东东莞,珠三角各大城市设有服务部,专注于东莞柴油发电机出租,深圳柴油发电机出租,惠州柴油发电机出租及发电机维修配套服务!

游技天地

游技天地是游戏玩家的技能提升平台,提供专业的游戏攻略、技巧和游戏内战术。我们的团队由资深玩家组成,他们凭借丰富的游戏经验,为玩家提供实用的攻略和建议。

民航信息装备网

民航信息装备网服务、支持、宣传民航,提供最新优质信息资讯、企业形象宣传及搭建供需互动的行业服务平台,助力产学研用深度融合,推动民航产业技术和装备创新突破、迭代升级,为实现民航高质量发展贡献力量。

速达软件,速达进销存,速达财务软件,速达进销存软件,进销存软件,财务软件,进销存软件,ERP软件,库存软件,生产系统,速达售后,速达电话

初壹软件-让管理从未如此简单,中小企业管理软件知名品牌和行业领导者,上万家企业用户忠实的选择。多年来速达致力于佛山进销存软件、佛山ERP软件、佛山财务软件、佛山CRM软件等管理软件的研发和服务。专业的精神,卓越的产品,易学易用的优势是我们成功的保证!

得物APP应用

得物App是全球领先的集正品潮流装备、潮流商品鉴别、潮流生活社区于一体的新一代潮流网购社区。“多道鉴别查验工序”的平台品控,为新世代消费者带来更安心的网购体验。得物App致力于打造年轻人的潮流生活社区,成为中国潮流文化风向标和年轻人的发声阵地。

启东人才网

启海人才网www.qd0513.com,启东人才网,启东人事人才网,启东手机找工作,启东招聘求职第一品牌,启东人才网免费注册简历找工作,免费发布招聘信息

阿里云企业网盘

阿里云企业网盘促销活动价格优惠!企业云盘收费标准为按容量计费,1TB起售,免费送流量!阿里云盘企业版,即阿里云网盘与相册服务,多级权限管理,高效协同,开箱即用,电脑、手机都可以实时同步最新文件,企业办公必备产品!帮助用户解决办公数据的搜索、管理、共享、审计等文件管理难题。

混砂机

青岛欧德机械有限公司是一家集生产和销售一体的混砂机设备厂家,我公司生产的混砂机,筛沙混沙效率高,一台也按批发价,品质有保证.可定制.欢迎来电咨询订购!

龙之小站资源屋

龙之小站是一个专注于电脑、手机和电视的app软件、应用工具、资料教程的免费源码分享平台,第一时间免费分享实用的APP软件、AI智能应用、最新电影、ChatGpt、操作系统等。坚持优化,绿色,亲测好用,在保护您安全快速舒心使用软件的同时,尽最大努力让您不花钱就能享受付费VIP的待遇

小豚智造

小豚智造运营管理平台(DMOM),是以MES制造执行系统为基础,扩展供应链、电子仓储、高级排程、大数据分析等方面的能力,覆盖计划、物料、生产、质量、设备、物流等核心制造领域,集制造执行与工厂运营于一体,帮助工厂高效的实现从客户下单、原料入厂到成品出厂的全链路数字化管理。通过小豚物联网平台对设备实时的数据采集,并对接集成ERP系统,实现数据在各个系统间的互联互通,打通信息孤岛,帮助工厂解决生产过程中遇到的交付延期、库存积压、设备效率低、次品率高、生产过程不透明等问题,最终提高效率、降低成本,真正实现数字化智能工厂的目标。

全局底部横幅