前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中 ,迄今为止AI的表现并不算好 。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude、谷歌的Gemini 、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场 。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时 ,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一。过去几年,从摩根大通到Balyasny Asset Management等行业巨头 ,几乎已将这项技术用于其他各个环节 。如今,大语言模型已在量化机构中用于解析新闻,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中 ,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙,因为众所周知 ,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险 。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。 ”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准 。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极。2025年第四季度 ,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 油气费用
双双重挫 伊朗评估美国提出的止战新方案

    油气费用 双双重挫 伊朗评估美国提出的止战新方案

      在伊朗评估美国提出的一项结束近10周战争的新方案之际,油价一度跌破每桶100美元,天然气价格也大幅下挫。  基准布伦特原油一度下跌12%,至每桶96.75美元;WTI原油跌幅最高达13%。欧洲天然气价格一度暴跌14%。不过,在美国总统唐纳德·特朗普周三在TruthSocial上发文表示如果伊朗不同意,“轰炸将重新开始”后,油气价格随后收复了约一半跌幅...

    2026/05/07
  • 【唐山市疫情最新消息,唐山市疫情最新公告】

    【唐山市疫情最新消息,唐山市疫情最新公告】

    唐山2月12日新型肺炎确诊病例人数(唐山市新型肺炎确诊病例)累计确诊病例35例!2020年2月12日河北省新型冠状病毒感染的肺炎疫情情况2020年2月12日0—24时,河北省报告新型冠状病毒肺炎新增确诊病例14例,其中,沧州市5例、张家口市4例、唐山市2例、邯郸市2例、廊坊市1例。新增治愈出院病例6例,其中,邯郸市2例、保定市2例、张家口市1例、秦皇岛市1...

  • 北京新增3本地确诊(北京新增3例本地确诊活动轨迹)

    北京新增3本地确诊(北京新增3例本地确诊活动轨迹)

    央美确诊教师辟谣出轨〖壹〗、央美确诊教师马某已通过社交媒体辟谣出轨传言,称系受海南省交通投资控股有限公司邀请前往海南考察,同行者为一名男教授,并已委托学院报警处理。事件背景:8月4日,北京新增3例京外关联本地新冠肺炎确诊病例,其中一名居住在望京国风上观小区的病例为中央美术学院教师马某。〖贰〗、首先,并不是所有看到谣言的人都看到了辟谣,也就是说必然有一部分深...

  • 哈尔滨最新疫情报道(哈尔滨最新疫情报道今天)

    哈尔滨最新疫情报道(哈尔滨最新疫情报道今天)

    哈尔滨疫情怎么样了?022年3月27日哈尔滨发布56号公告时,当地疫情处于多点散发、快速传播的严峻阶段,防控压力陡增,正处于严格管控下逐步趋稳的转折点。疫情形势背景当时哈尔滨市受奥密克戎变异株影响,本土疫情呈现多点散发特征,聚集性疫情频发。哈尔滨作为东北地区的重要城市,一直以来都高度重视疫情防控工作。此次疫情发生后,哈尔滨迅速采取了果断措施,包括关闭九小场...

  • 郑州新增3例确诊病例(郑州新增三例详情)

    郑州新增3例确诊病例(郑州新增三例详情)

    中国疫情最严重的三个省江苏省是近来全国疫情最为严重的省份之一。根据最新的中高风险区域名单,江苏省拥有2个高风险地区和50个中风险地区。8月1日,江苏新增40例本土确诊病例,其中11例为轻型,29例为普通型。同时,新增2例本土无症状感染者,以及3例境外输入确诊病例。疫情最严重的三个省是湖北省、广东省和河南省。湖北省是疫情爆发的中心地带,尤其是武汉市。这里最初...

  • 英飞凌展望超预期,AI热潮提振功率芯片业务

    英飞凌展望超预期,AI热潮提振功率芯片业务

      德国芯片巨头英飞凌科技公司上调全年业绩预期,受人工智能数据中心电源解决方案需求激增及汽车订单回暖推动,公司预计营收将“显著增长”,优于此前“温和增长”的判断。  财报显示,第二财季营收38.1亿欧元,同比增长6%。其中,被视为AI业务核心的电源与传感器系统部门营收同比增长26%至12.6亿欧元。公司预计第三财季营收约41亿欧元,高于分析师预期的40.4...

    2026/05/07
  • 31省份新增18例(31省区市新增18例)

    31省份新增18例(31省区市新增18例)

    31省份新增本土“86+206”省份新增本土“86+206”例主要涉及的省份及具体情况如下:本土确诊病例(86例)分布:甘肃新增36例,为当日本土确诊病例数比较多的省份;广东新增32例,是南方地区病例集中的省份;上海新增5例,显示其仍存在局部传播风险;江西新增5例;海南新增3例;江苏新增2例;内蒙古、河南、重庆各新增1例。国内疫情又爆发了吗,国内疫情防控、...

  • 【云南最新疫情通报,云南最新疫情最新消息确诊19例】

    【云南最新疫情通报,云南最新疫情最新消息确诊19例】

    大理“截胡”重庆口罩被通报批评——都是自己人,抢啥抢!|这注定是个不...〖壹〗、云南大理因“截胡”重庆口罩被通报批评,相关责任人受处分。事件概述云南大理在疫情期间“截胡”了一批重庆市政府指定企业采购用于疫情防控的紧急物资,其中还包括黄石托重庆购买的部分。这批物资本应用于疫情重灾区,却在中途被大理市政府强行征用。广东疾控提醒有西双版纳傣族自治州旅居史人员...

  • 前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

    前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

      人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。  在全球领先AI模型参与的一系列新的交易竞赛中,迄今为止AI的表现并不算好。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模...

    2026/05/07
  • 天津第21-27例感染者轨迹公布/天津新增2例感染

    天津第21-27例感染者轨迹公布/天津新增2例感染

    未出过本市,健康码行程上为什么会出现别的城市?〖壹〗、如果你为你的家人用你的身份证办理的手机卡,你的家人去过外地,健康码会显示去过外地。2020年12月10日,国家卫健委、国家医保局、国家中医药管理局联合发布《关于深入推进“互联网+医疗健康”“五个一”服务行动的通知》,明确要求各地落实“健康码”全国互认、一码通行。〖贰〗、如果说未出过本市区,但是健康行程码...

返回顶部