时间: 2024-11-30 16:38:51 | 作者: OD体育网页版登陆
过去一年,AI 硬件行业都在寻找下一个 AI iPhone,但却又仿佛受到诅咒般地高开低走。
售价 199 美元的当红炸子鸡 Rabbit R1,在发售之初,一天之内就售出 1 万台,至今已售出超过 10 万台。
而最近,据创始人 Jesse Lyu(吕骋)透露,现在每天大约只有 5000 人还在使用 R1。此外,自首次发布以来,他的团队已经向 R1 推送了 16 次无线更新。
Lyu 也没有回避用户的差评如潮,但他同时也表示,硬件初创公司若是想要参与到市场对话中,就必须接受产品的不完美。
另外,Lyu 宣布,R1 即将在 10 月 1 日推出全新模型——Large Action Model。据称该模型能推理执行普通任务的步骤,比如购买音乐会门票、注册网站,甚至玩在线游戏等。
值得一提的是,资深记者 Mishaal Rahman曾指出,R1的底层系统疑似套壳Android。Lyu 则回应强调Rabbit OS 和 LAM 都是在云端运行的,基于高度定制的 Android 开源项目,并进行了底层固件的修改。
英特尔今年早一点的时候对将其产品和制造部门进行了拆分,分别成立了「英特尔代工(Intel Foundry)」 和 「英特尔产品(Intel Product)」 两个部门。
收购英特尔的产品部门将有利于 Arm 转向销售更多自己的产品,从而更好地和英伟达等 AI 芯片巨头竞争,而不单单是销售芯片许可证。
据介绍,作为腾讯 Robotics X 实验室最新一代机器人,小五集合了此前多代机器人研发的核心能力,融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术。
实验表明,小五可在真实人居环境中完成行走、搬运物体等动作,处理复杂任务,与人进行交互。
小五与此前的机器人最大的不同,是在本体上采用了四条直线腿和轮足复合的设计,既保持了足式机器人的越障能力,也保持了轮式机器人运行的效率,让机器人在平地上有更快的速度。
「清爽、无广告」是当下 AI 搜索引擎的最大卖点,但也有几率会成为初创企业的致命弱点。
AI 搜索引擎领头羊 Perplexity 最近被曝出正在和 Nike 和万豪等品牌就新广告模式进行谈判。新广告模式将允许品牌对「赞助」问题进行竞价,具有广告商批准的 AI 生成答案。
Perplexity 表示,希望在今年年底前推出广告系统,并瞄准「高端」品牌客户。
知情的人偷偷表示,在 Perplexity 的广告系统下,营业销售人员将按所谓的 CPM 收费,也就是为这些赞助帖子产生的每 1000 次展示支付超过 50 美元的费用。
创始人兼 CEO Aravind Srinivas 称:「如果广告是相关的,并且来自高质量的品牌,那么这些广告就真的很有用,很多人都是基于这一点进行购买的。」
本周,Stability AI CEO Prem Akkaraju 宣布,曾执导过《泰坦尼克号》《异形》《阿凡达》等电影的导演詹姆斯·卡梅隆,加入 Stability AI 董事会。
卡梅隆以艺术家为中心的视角,加上他的商业和技术敏锐度,将支持 Stability AI 继续释放新的机会,使创作者能够以曾经很难来想象的方式讲述故事。
Stability AI 在新闻稿中写道,卡梅隆的加入代表着 Stability AI 变革视觉媒体的使命向前迈出了重要一步。
卡梅隆曾表示:「早在三十多年前,我就已经站在了 CGI 技术的最前沿,并且从那时起,我就从始至终保持在这一领域的最尖端。现在,生成式 AI 与 CGI 图像创作的结合,正成为新一轮的技术浪潮。」
本周,Meta 发布了其首款 AR 智能眼镜 Orion,它一共由三个部分所组成:眼镜本体,一个手势追踪腕带,以及一个遥控器大小的「计算模块」,三者无线连接。
这种「分体式」的方案,加上机身采用了更轻的镁材料,Orion 眼镜本体实现了惊人的 98 克重量,还可以实现 2 小时左右的续航。
镜框上微型的投影仪会将光发射在波导中,而波导投射在透镜上,从而显示出具有不一样纵深和大小的 AR 虚拟内容(扎克伯格称其为「全景图」)。
根据现有的演示视频,用户都能够戴着眼镜打开多个 Meta Horizon App 窗户进行多任务,或者用 Meta AI 对现实世界的事物进行识别、标注。
不过,目前的 Orion 设备还是原型机,只面向部分开发者和体验人员提供,这中间还包括老朋友黄仁勋。
具体可以回看 APPSO 此前详细的总结文章—— 真 AR 眼镜来了!十年保密项目烧钱数十亿,Meta 最强 AI 加持,黄仁勋首测
据悉,一方面,这笔费用为了获得Character.AI的技术许可,另一方面,则是借此让创始人 Noam Shazeer 同意回归 Google。
在 Google 内部,人们一致认为 Shazeer 的回归是公司同意支付这笔巨额许可费用的主要原因。
越是生机勃勃,越是震荡不断,此刻 OpenAI 正在迎来一种非世俗意义上的「新生」。
先是 OpenAI CTO 宣布离职,挥挥手引发两名高管出走,后又被曝出离职的 Ilya 曾考虑回归 OpenAI,却被公司管理层耍了一道。
被誉为 AI 乔布斯的 Altman 在本周也拿到了反派角色的剧本,在其领导下,OpenAI 无视安全, 匆忙上马拥有安全漏洞的 GPT-4o,又不断压榨员工,甚至连高管都苦不堪言。
苹果在最后关头宣布退出 OpenAI 新一轮融资。不过,好在苹果选择「放手」后,微软、英伟达等巨头仍在谈判桌上。其中已投 130 亿美元的微软预计还将追加约 10 亿美元。
但可预见的是,OpenAI 正坚定地从非营利组织转型为营利性公司。因为报道还提到,若是 OpenAI 两年内没完成公司结构的重组,本轮投资者将有权要求退回他们的「真金白银」。
这场 OpenAI 连续剧显然还将持续下去,吃瓜群众能做的也只有静待反转、反转和反转。
9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,一举推出了豆包视频生成-PixelDance、豆包视频生成-Seaweed 两款大模型。
这次 APPSO 参与了内部测试,得到可以称为了不起的效果——还是那句话,很强,很炸裂
10 秒钟收获影视级短片,花式运镜主体依然清晰,这个全新国产视频模型稳稳拿捏
相较于以往版本,这两款新模型均配备 2M 上下文窗口,是之前型号的两倍。
此外,1.5 Flash 模型请求速率限制提高 2 倍,而 1.5 Pro 模型请求速率限制提高约 3 倍。
并且,两种模型在 MMLU-Pro 基准测试中的成绩提升了约 7% ,在 MATH 基准测试中成绩提高了约 20%。
例如,Gemini 模型能够综合处理长达 1000 页的 PDF 文件,回答包含超过一万行代码的代码库的问题,甚至处理长达 1 小时的视频内容。
1B(文本输入)、3B(文本输入)、11B(文本+图像输入) 以及 90B(文本+图像输入)模型,适应于不同的应用场景和计算资源。
Llama 3.2 保持了与前代版本相同的 128K 上下文长度,允许用户输入大量文本,进行复杂的任务处理。
在相关的基准测试中,Llama 3.2 的视觉模型在图像理解任务上超越了其他竞争对手,如 Claude 3 Haiku 和 GPT-4o,在图像理解任务方面表现出色。
我们慢慢的开始大规模讨论人形是否是机器人最合适的形态,但现实的发展或许还远远没到这一步。
据晚点 Late Post 报道,特斯拉 Optimus 人形机器人目前已经生产数百台,但还不到可以上产线工作的状态,目前只能用来采集数据、测试不同的设计方案。
此前,Fortune 曾报道,为了更好地训练特斯拉 Optimus,特斯拉正在招聘「数据收集操作员」,以每小时 48 美元的价格进行数据收集和训练工作。
报道中还提到,一位接触过特斯拉团队的投资人表示,马斯克对人形的坚持,是为了换掉制约汽车制造的最后一个环节——工人。
马斯克的预言有很多,有声称 2029 年将会将人类送上火星,也声称明年 AI 将会比任何人都聪明,更曾大胆预言20 年后地球上将会有大约 10 亿个人形机器人。
不用等到秋天,OpenAI 宣布 ChatGPT 新版高级语音模式将在本周内向所有 Plus 和 Team 用户全量推送。
CNBC 和 X 网友 @MattVidPro 的体验都发现,只能和 ChatGPT 聊 45 分钟左右。当用户的使用时间剩余 15 分钟时,系统就会发出提醒。
此外,OpenAI 还一口气推出了五种听起来更自然的全新语音风格——Vale、Spruce、Arbor、Maple、Sol。
遗憾的是,ChatGPT 的视频和屏幕共享仍旧没上线。简言之,姗姗来迟的高级语音模式本质上还是一个品。
更多具体信息欢迎回看 APPSO 此前文章—— ChatGPT 高级语音模式首批体验来了!网友玩坏了,但还是个版
当 AI 在游戏的世界里「攻城略地」时,一部分游戏从业者却果断 Say no,拒绝盲目跟随 AI 潮流。
据《》报道,任天堂灵魂人物宫本茂在接受媒体采访时表示,任天堂会更理性看待 AI 对游戏的影响,希望走出和其他电子游戏行业不同的路。
例如,现在有很多关于人工智能的讨论。当这种情况出现时,任何一个人都开始朝着同一个方向发展,但这正是任天堂更希望朝着不同方向发展的地方。
作为参考,索尼 PlayStation 之父久多良木健曾表示,随着 AI 和其他新技术的出现,他预计游戏将逐渐进入实时计算时代。
Tesla 前 AI 总监、OpenAI 创始小组成员 Andrej Karpathy 最近提出一个疑问,为什么我们现在的科技大多都在向着这种复杂、依赖性过高、对用户不友好的方向演变?
计算器是你大脑的一个完全自给自足的算术插件。它今天可以工作,几千年前也能工作。你为它买单,它就归你所有。它无另外的的主人。它只做它该做的事。它是完美的。
他以计算器举例称,相比繁琐复杂的现代科学技术产品,计算器自给自足,简单易操作,可以长期工作,支持一次购买,不会收集用户个人信息,无需账户、更新、权限,没有广告或促销、无数据泄露风险。
Karpathy 建议,消费者和开发者应记住技术能是啥样子。其中消费者应该更加警惕,拒绝不良的科技趋势,而开发者应该在设计产品时考虑更多的伦理和隐私问题。