Scaling 具身智能爆发在即 达摩院赵德丽 law打破固定路径加速AI变革 (scaling)
我们正身处一场技术革命的历史开端,以ChatGPT为标志的这轮AI科技浪潮是算法和软件诞生以来人类科技最重要的技术变革,由此开启了以智能为核心的第四次工业革命,这次AI变革是由以Scalinglaw为底层逻辑的基础模型驱动,其整体的发展脉络由基础模型的技术逻辑主导,进入2025年,我们清晰地看到,Scalinglaw本身仍然成立,但以...。
具身基础模型最终状态可能是 丨具身先锋十人谈 智源学者仉尚航 4D世界模型 (模型基础工具)
今年业界开始流传着一个说法,具身多模态大模型是当下为数不多的新的创业机会,今年,受大模型启发,业界看到了大模型带给机器人领域的新能量,开始研究能同时完成多种任务的具身智能的基础模型,希望实现能跨越不同任务、不同本体、不同场景,具有泛化能力的机器人智能体,具身智能基础模型是一个新的领域,相关工作并不多,从早期的Saycan到后面斯蒂朗宁...。
大数据 吴恩达 告别 (大数据nb)
吴恩达是人工智能,AI,和机器学习领域国际最权威的学者之一,最近一年里,他一直在提,以数据为中心的AI,,希望将大家的目光从以模型为中心转向以数据为中心,最近,在接受IEEESpectrum的采访中,他谈到了对基础模型、大数据、小数据以及数据工程的一些感悟,并给出了发起,以数据为中心的AI,运动的原因,过去十年,代码—神经网络的架构...。
的 AI Model 丨CVPR 视觉 已经发展到哪一步 现场直击 Foundation 2024
2024年美国时间6月17日至21日,IEEE国际计算机视觉与模式识别会议,CVPR,在美国西雅图召开,如大家预料,视觉FoundationModel成为今年CVPR除自动驾驶、3D视觉等传统研究课题以外的核心会议主题,此外,由于会议召开前后,国内快手,可灵,开放图生视频功能火爆出圈、Runway时隔一年推出新模型Gen,3Alpha...。
组织调整结束 1 X 开启 商汤CEO徐立发表全员信 新架构 (组织调整结束语怎么说)
12月3日,商汤科技董事长兼CEO徐立发布全员信,宣布组织调整结束,开启新架构——,1,X,,以更好地应对AI2.0时代所带来的机遇与挑战,什么是,1,X,新架构,1,代表商汤集团核心业务,打造行业领先的AI云,实现大装置、基础模型和AI应用的无缝集成,在CV领域,打造通用视觉模型深耕各个应用场景,X,代表商汤集团重组拆分的生态企...。
Trainium芯片 亚马逊自研3nm 能否成为英伟达之外的第二选择 (training)
Trainium是亚马逊云科技,AWS,专门为超过1000亿个参数模型的深度学习训练打造的机器学习芯片,在2024年re,Invent大会上,AWS宣布Trainium2正式可用,其性能比第一代产品提升4倍,可以在极短的时间内训练基础模型和大语言模型,AWS周二宣布,将推出一款由数十万颗自研Trainium芯片组成的巨型人工智能超级计...。
2024 谷歌研究院获得最佳论文 万人参加 超 CVPR 1.2 (2024谷歌地图)
作者,赖文昕马蕊蕾编辑,陈彩娴北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会CVPR2024正式公布了最佳论文等奖项,今年共有2篇论文获得了这份全球最重要的计算机视觉领域的大奖,团队成员分别来自谷歌研究院、加州大学圣地亚哥分校、南加州大学、剑桥大学及布兰迪斯大学,本周,6.17,6.21,,第四十一届国际计算机视觉与模式识别会议...。
多模态视频理解模型新标杆!微软黄学东团队发布 i (多模态视频理解基础模型)
黄学东领衔,微软Azure认知服务研究团队重磅发布,视觉,语言,语音,多模态预训练模型i,Code,在5项多模态视频理解任务以及GLUENLP任务上树立了业界新标杆!编译丨OGAI人类的智能涉及多个模态,我们整合视觉、语言和声音信号,从而形成对世界全面的认识,然而,目前大多数的预训练方法仅针对一到两种模态设计,在本文中,我们提出了一种...。
通义千问开源数学模型Qwen2 (通义千问开源模型)
8月9日消息,阿里通义团队开源新一代数学模型Qwen2,Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型,Qwen2,Math基于通义千问开源大语言模型Qwen2研发,旗舰模型Qwen2,Math,72B,Instruct在权威测评集MATH上的得分超越GPT,4o、Claude,3.5,Sonnet、Gemini...。
打破大模型的 空中城堡 BMVC最佳论文Runner (打破大模型的英文)
两只新生猫的运动方式是否为主动,对视觉感知能力的影响非常大,这启发了人工智能中的具身学习范式,其中最关键的要素便是——主动,作者丨王晔UC伯克利教授JitendraMalik前段时间发文表示,虽然以大型语言模型,LLMs,为例的,基础模型,在机器翻译和语音识别等方面非常有用,但将这些模型称为基础模型,不禁让人怀疑这些模型是不是真的可以...。
Diffusion终端侧展示 全球首个运行在Android手机上的Stable (diffuse)
作者,高通技术公司工程技术副总裁侯纪磊,高通技术公司产品管理高级副总裁ZiadAsghar上图为StableDiffusion利用文本提示,穿盔甲超级可爱的毛绒绒猫战士、逼真、4K、超细节、V,Ray渲染、虚幻引擎,生成的图像基础模型正在席卷AI行业,基础模型指基于海量数据进行大规模训练的大型神经网络,进而能以高性能表现适应广泛的后...。
阿里通义Qwen2成斯坦福大模型榜单最强开源模型 (阿里通义千问)
6月20日消息,斯坦福大学的大模型测评榜单HELMMMLU发布最新结果,斯坦福大学基础模型研究中心主任PercyLiang发文表示,阿里通义千问Qwen2,72B模型成为排名最高的开源大模型,性能超越Llama3,70B模型,MMLU,MassiveMultitaskLanguageUnderstanding,大规模多任务语言理解,是...。
智能体来了 世界上第一个用于芯片设计和验证的 王威廉最新创业项目 AI (智能体技术)
今年AI智能体简直火得不行,各种初创公司像雨后春笋般冒出,光是YCombinator一家今年就已经投资了94家相关初创公司,怪不得吴恩达说,AI智能体工作流程将在今年推动AI的巨大进步——甚至可能超过下一代基础模型,这是一个重要的趋势,我呼吁所有从事AI工作的人都关注它,注意到,最近又有一家公司高调登场——这次是要在半导体领...。
GPT 超越 (gpt超越扩散)
在大模型技术圈里,有一个获得不少认同的说法,阶跃星辰的底层基础模型能力很强,甚至是几家大模型公司中数一数二的,但其实,拥有这种看法的大多是足够了解国内大模型能力现状的人,对于圈子之外的人,无法直观感受到这种潜移默化的底层硬实力,然而,在被誉为,世界上第一个不可玩弄的LLM基准测试,的LiveBench榜单中,阶跃星辰给了行业一次强有力...。