金融新基建丨“千模酣战”,金融业大模型为何还在“前牛顿时代”?
刚刚过去的世界人工智能大会(WAIC)上,各家厂商AI大模型“大秀肌肉”
2023-07-1021世纪经济报道记者李览青 上海报道
刚刚过去的世界人工智能大会(WAIC)上,各家厂商AI大模型“大秀肌肉”。在“千模大战”的硝烟背后,大众普遍关心的话题是,谁将历经千帆成为中国版OpenAI?
“大模型的迭代是一场‘暴力’填数据、拔规模而造就的‘美学盛宴’。”中金公司研究团队在近日发布的“AI浪潮之巅”系列报告中如是说。
(相关资料图)
尽管作为推动AI大模型发展的“三驾马车”,数据、算力、算法都关系着大模型技术商业化落地的成败,但从多位接受21世纪经济报道记者采访的业内人士看来,在“抢芯片”之外,决定大模型质量和商业化落地的核心要素是数据。对于既要安全又要发展的金融业而言,在数据共享尚不充分的大模型起步阶段,更需要建立开放的行业生态。
金融行业对模型并不陌生,机器学习也不是新鲜词。
一直以来,在智能营销、智能风控、智能投研、智能客服等领域,基于机器学习驱动的建模能力都是金融机构数智化转型的基础。“大模型”是大型语言模型的简称,机器用大规模语料库数据进行训练,通过算法从数据中学习如何完成任务,参数规模大、数学公式复杂。从AlphaGo到ChatGPT,如今机器已经可以在开放系统下实现自我学习与持续反馈。
与过去相比,当下的大模型时代对算力、算法、数据的需求已然改变。
“今天的AI体系是强依赖数据的,是数据驱动的智能体系。”蚂蚁集团副总裁兼首席技术安全官韦韬表示。
“这次OpenAI为我们带来的最重要的技术并不是几千亿的参数,而是基于数据的反馈,让这个系统在持续强化学习下越来越聪明。”马上消费金融CIO蒋宁告诉记者,即使大模型具备优秀的算法,如果没有高质量数据集的训练,就像失去学习能力的博士生,会逐步失去竞争力。
然而,目前“千模竞帆”背后是国内各厂商的数据生态割裂。
“目前在通用大模型建设过程中,一方面当前中文高质量数据有限,另一方面中国移动互联网生态与互联网生态处于割裂情况。”蒋宁告诉记者。
上海数据交易所副总经理韦志林在接受21世纪经济报道记者采访时指出,大模型之所以强大,能够不断地迭代,都依赖于算力算法以及最重要的数据。“在‘三驾马车’中,数据是最核心、最长远、最基础的要素,它每天都在产生,应用场景非常丰富。”从其与大模型企业沟通的情况来看,相较全球语料库建设,国内语料库供给需要进一步提升,语料库的质量、标准、多样性都有所欠缺。
“大模型技术出现后,数据供应的过程中还遇到四方面问题。”中国电子副总经理陆志鹏提到,一是缺少合规确权的机制,目前国内面临的问题就是数据的有效供给不足。很多企业都在做语料库,但数据都非常有限,而且可能面临着统一标准的问题;二是缺少数据的计量估价机制;三是缺少协调分配;四是缺少安全隐私保护机制。
“我们国家的数据生产量全球排名在第二名,但是分散在各个行业、各个组织中,整体的数据是分开的。但大模型所需要是将数据进行物理归集,在短时间内基于一定的算力与算法进行预训练。”韦志林提到,国内各大主流厂商都推出了基于己方已有数据的大模型,但由于数据分散、丰富度不足、质量参差不齐等原因,各个大模型都存在一定的局限性。
“数据已经成为重要的生产要素,当数据开放共享的安全与收益分配机制还不完善,具有大量数据的头部大厂开放高质量数据集的意愿不足,所以其主要将数据价值创新服务于企业内部,而没有拿出去的动力。”韦志林表示。
通用大模型激战正酣,金融业的大模型运用则主要在行业垂直模型领域。
今年3月,彭博针对金融业推出大型语言模型BloombergGPT,引发市场对金融垂直领域大模型的关注。
在国内,今年5月,星环科技推出了第一款面向金融量化领域的生成式大语言模型“无涯Infinity”,度小满开源国内首个千亿参数金融大模型“轩辕”,今年6月,恒生电子发布金融行业大模型LightGPT,并宣布将于9月底正式开放试用接口。
多位受访对象向21世纪经济报道记者表示,目前金融业的大模型运用主要在工具层与应用层,无论是技术服务商还是金融机构,都在“量力而为”。
“我们以后不会再开发其他领域的模型,每个行业都有自己的行业壁垒。”星环科技CEO孙元浩在接受记者采访时提到,公司的主要战略是提供大模型(LLMOps)的工具链,帮助金融机构训练自己的大模型。“基础大模型与应用之间的鸿沟实在是太大了,我们不可能用一家公司去做每个行业的大模型。和过去相比,大模型主要有2个方面需要改造,一是高达上千亿的模型参数,需要算力支持,需要分布式、高可扩展的调度框架,二是巨量的高质量语料训练。”孙元浩表示,在过去服务于证券行业时,有二十万个已完成标注的语料,也开发了量化因子,使得其训练的模型基于量化策略可以直接用来做示范交易。
对金融机构内部来说,垂直领域的大模型更类似于“个性化小助手”与业务流程优化助手。
众安保险首席技术官蒋纪匀告诉记者,大模型在保险业的落地,需要关注大模型在保险专业领域的知识增强,在合规安全的前提下,对接口调校和限制也有更高要求。因此众安自主研发了AIGC中台灵犀,通过适配如GPT、通义千问、文心一言等国内外主流大模型,灵犀可以帮助保险机构更好适配AIGC能力,允许机构用户,在大模型内嵌入行业专业领域知识库,实现AIGC在保险垂直领域的应用快速适配。
“谈论大模型技术在金融核心业务场景下的应用为时尚早。”萨摩耶云创始人兼董事长林建明在接受21世纪经济报道记者专访时提到,金融业对于算法可解释性与可信度要求极高,AI仍处于“前牛顿时代”,人类还没有搞懂基本原理,目前萨摩耶云对语言生成模型的应用主要集中在结合个性化推荐、用户画像等,解决线上线下协同过程中的自动化断点问题。
当通用大模型走向金融行业落地,割裂的数据生态使越来越多的机构拥抱合作互通。
就在7月10日,中国证监会科技监管局局长姚前刊文《关于大模型生态建设的若干思考》。姚前指出,在具体应用落地的过程中,GPT类大模型还会面临一系列挑战。一是如何确保训练数据的数量与质量。一般而言,大模型的训练语料为来自于多个领域的通用语料,而专业语料的收集通常比较耗时费力,同时也存在隐私问题,由此导致大模型在具体的个别应用领域可能出现专业性不足的情况。二是如何降低大模型的运行和维护成本。大模型需要巨大的算力支持和严格的数据治理,普通的机构和应用部门往往难以支撑大模型的运行以及迭代升级工作。为此,需要建立一个各类模型健康交互和协同进化的生态,以保证大模型相关人工智能产业可以在各个应用领域成功落地。
目前金融机构与通用大模型厂商的合作正在加速。在世界人工智能大会上,交通银行与华为、腾讯云、科大讯飞宣布共建3个联合创新实验室,分别聚焦大模型在金融领域的应用与创新、增强网络空间安全防御能力、研究认知模型在金融领域的应用。
针对目前金融数据开放依然不充分的问题,科大讯飞总裁吴晓如在接受21世纪经济报道记者采访时表示,其在合作中的做法分为两步,第一步是无监督训练,把大量公开数据和素材放进模型,帮助金融机构训练基础模型;如果金融机构需要模型针对行业做精细化调整,其并不需要太大算力,科大讯飞将在联合创新实验室中为金融机构提供工具,让其自己做调试优化。
标签:
刚刚过去的世界人工智能大会(WAIC)上,各家厂商AI大模型“大秀肌肉”
2023-07-10暑期来临,孩子们准备去哪度过这个快乐的假期?在山西,有“清凉夏都”
2023-07-10鞭牛士7月10消息,今日,蚂蚁集团相互宝前负责人尹铭针对相互宝关停
2023-07-10近日2023年第一封录取通知书已送达许多准本科生、准研究生同学们在
2023-07-10金融支持高标农田绿色生态乡村振兴,金融,醴陵市,邮储银行,乡村振兴战略
2023-07-1000:13当地时间7月9日晚间,美国总统拜登已抵达英国伦敦斯坦斯特德机场
2023-07-10三年杀入成都顶流,这家房企做对了什么?,锦江,珠海,新川,顶流,三圣乡,
2023-07-10天津2023西青区“津彩假日”红领巾夏令营➤主题:生态文明入童心领巾飘
2023-07-10本网讯为推进乡村人才振兴,促进农业农村现代化,帮助农民提高专业知识
2023-07-10印尼能源和矿产资源部地质局表示,当地时间7月10日,印尼北苏拉威西省
2023-07-10据“中国驻泰国大使馆”微信公众号消息,7月9日下午,一辆载有24名中国
2023-07-10共享发展新机遇武汉经开区邀请德国奥地利企业家投资兴业---湖北日报客
2023-07-10基金根据投资策略不同,可以将其分为主动型基金和被动型基金,但是有部
2023-07-10一、全国价格分析宇博智业监测数据显示,2023年07月09日,全国38类冬瓜
2023-07-1020名来自衡阳师范学院的志愿者成功抵达城步苗族自治县长安营乡大寨村。
2023-07-10小米电视最新款EA55已在小米有品上架开售,定价1499元。与去年推出的EA
2023-07-10【瑞媒:沙特国家银行曾欲注资50亿美元救瑞信,遭瑞士监管机构否决】7
2023-07-10广州日报讯(全媒体记者叶卡斯通讯员王益)“小暑大暑,上蒸下煮”,进
2023-07-10因此来说,EDG必须要拼尽全力把自己的状态提升到一个更高的水准,接下
2023-07-107月7日,好利科技(002729)融资买入1307 66万元,融资偿还2014 67万元
2023-07-10原标题:我省“深海技术产业促进专项”2023年度项目启动申报为贯彻海南
2023-07-102023年7月7日亚康股份融资净偿还1218 19万元,融资余额1 45亿元
2023-07-10证券时报记者 王军 卓泳7月10日,蓝盾转债将步入退市整理期,成为
2023-07-10大家好,今日关于【曝李玟老公找律师争遗产】迅速上了的热搜榜,受到全
2023-07-10hello大家好,我是城乡经济网小晟来为大家解答以上问题,秦桧为什么会
2023-07-10本届温网,袁悦、白卓璇、郑钦文、朱琳、张帅、王曦雨、王欣瑜等七朵金
2023-07-101、捉捕萤火虫一般都采用网兜法或瓶捕法。2、 网兜法是用纱布网兜对
2023-07-09导读1、初中毕业考不上高中可以上什么学校?初中毕业考不上高中,可以
2023-07-09切马尔特社区大学绿色一周海报是《往日不再》中的一个旅游收集品,切马
2023-07-097月9日消息,第二十五届中国(广州)国际建筑装饰博览会昨日在广州盛大
2023-07-09春手抄报内容资料,青春手抄报内容这个问题很多朋友还不知道,来为大家
2023-07-09”是什么,如何操作,与传统银行贷款有何不同?一、引言近几年,小微企
2023-07-095日,24岁的美国居民爱默生在华盛顿哥伦比亚特区一所校园内遭枪杀。警
2023-07-09离岸账户,岸账户的基本详情介绍很多人还不知道,那么现在让我们一起来
2023-07-09泸州有很多可以做整形手术的医院,因为泸州近年来经济发展的还是很不错
2023-07-09语文体裁是什么意思,体裁是什么意思这个很多人还不知道,现在让我们一
2023-07-09这款Tangmai唐麦H5主动降噪ANC无线蓝牙耳机是一款专为游戏和电脑设计的
2023-07-091、基本信息个人概况姓名:王源外文名:Roy别名:源源、奶源、大源、源
2023-07-09审定与核查机构应当依照国家有关规定对项目进行审定;符合下列条件的,
2023-07-09亚奥理事会8日在泰国曼谷举行的第42届亚奥理事会全体大会上宣布,中国
2023-07-09如果你买下一座小岛,会干什么?盖一座漂亮的别墅?开发商业项目?或者
2023-07-09从4月恢复芝加哥至桂林国际货运包机,首次开展引进世界优秀品质原种猪
2023-07-09hello大家好,我是城乡经济网小晟来为大家解答以上问题,three的序数词
2023-07-09近日,科睿唯安发布的2022年《期刊引证报告》显示,由中国科学院上海光
2023-07-08《梦中的那片海》的热度还没过,《玉骨遥》就强势来袭!这部剧开播前毫
2023-07-08只是在首轮的比赛,石宇奇进入状态偏慢,他鏖战三局才2-1逆转击败世界
2023-07-08如果在2026年之前,姆巴佩能够拿下欧冠和欧洲杯冠军,他就成为了真正的
2023-07-08随着《浦东新区无驾驶人智能网联汽车创新应用规定》以及相关实施细则的
2023-07-08中国女足抵达阿德莱德开启世界杯冲刺备战,珀斯,中国女足,阿德莱德,女足
2023-07-081、notyet口语。2、尚末(还没有) 还没。本文到此讲解完毕了,希望对大
2023-07-081、a、大四开纸张的算法公式:大规纸张尺寸:1194mmx889mm;掉毛边后尺寸
2023-07-08氧离子是什么材质,负氧离子是什么这个问题很多朋友还不知道,来为大家
2023-07-08每经AI快讯,本周一共发生983笔大宗交易,其中28笔溢价,138笔平价,81
2023-07-081、《春望》【唐】杜甫国破山河在,城春草木深。2、感时花溅泪,恨别鸟
2023-07-08为进一步发挥国家级专家在医疗应急工作中的技术支持和业务指导作用,切
2023-07-08编者按:学生放假,暑期安全不能放假。2023年暑假已经到来,居家学习、
2023-07-08造船业是现代工业的集大成者,彰显着一个国家的综合工业实力。我国是世
2023-07-08金融管理部门7日公布了对蚂蚁、腾讯两家大型平台企业的重磅“罚单”。
2023-07-08【文 搏击江湖】已经38岁的瓦林卡和36岁的德约科维奇终于要再次对决了
2023-07-081、每个月1号去官网看有没中奖,就是那个什么什么得稀有装备的,DNF登
2023-07-08一、中国第一个北极考察站叫什么名?中国第一个北极考察站是黄河站。位
2023-07-07凯恩没在我们这里待太久,因为他的天赋是显而易见的,很小就去了阿森纳
2023-07-07轮传动设计计算过程,齿轮传动这个问题很多朋友还不知道,来为大家解答
2023-07-07让股市里的造谣者付出代价。上市公司的发展壮大,离不开清朗的舆论环境
2023-07-07智通财经APP讯,东杰智能(300486 SZ)公告,公司2022年年度权益分派拟:
2023-07-071、基尔霍夫电流定律,又称节点电流定律,由德国物理学家G R 基尔霍夫
2023-07-07绿城管理:上半年新拓代建项目代建费51 2亿元,绿城,代建费,建筑面积
2023-07-07在人稠地狭的日本,墓地价格昂贵让人“死不起”的现象一直存在。然而,
2023-07-07无党籍台南议员郭信良涉及土地重划非法案件,台南检调今天清晨兵分10多
2023-07-07(通讯员陈金贵李红岩)近日,记者走进百里杜鹃汇境花卉科技园,看到花田
2023-07-077月7日下午,2023全球数字经济大会北京信息通信技术发展论坛举办。记者
2023-07-07孩子数学太差,怎么能学好呢?一提到数学,一般人都会觉得它太枯燥无味
2023-07-07大荆西瓜汨罗融媒体讯(记者夏凡)夏日炎炎,除了空调,什么最解暑?许
2023-07-07报告内容证实了上述说法,其中写明,长春市中级人民法院在执行(申请执
2023-07-071、《朝贡与入附:明代西域人来华研究》指出自汉武帝时期张骞出使西域后
2023-07-07↑朱有勇团队对当地农民进行“水稻旱作”技术培训中国工程院院士朱有勇
2023-07-07联想近日宣布,将于7月22日推出全新的拯救者Y7008英寸电竞平板。新款平
2023-07-07为深入贯彻落实党的二十大精神和省委省政府全面振兴新突破三年行动方案
2023-07-07家人们谁懂啊,7月7日竟然才刚到小暑!理论上一个本不应太热的时节,实际
2023-07-07金山办公跌超4%,沪深300成长ETF(562310)走低,机构建议后续配置成长
2023-07-07财联社7月7日讯(编辑卞纯)在良好回报的鼓舞下,散户投资者6月份加大
2023-07-077月6日,江南水务(601199)融资买入469 55万元,融资偿还391 27万元,
2023-07-07海科新源上市首日一度涨超60%,目前涨49 32%。公司主营碳酸酯系列锂离
2023-07-07新华社上海7月6日电(记者周琳、龚雯)2023世界人工智能大会于7月6日至
2023-07-07根据《贵州民生(玉湖)实业有限公司2023年第十一届贵州人才博览会公开引
2023-07-07国家金融监督管理总局6日印发《关于适用商业健康保险个人所得税优惠政
2023-07-07来为大家解答以上问题。微信红包助手,微信有没有口令红包这个很多人还
2023-07-07田沁鑫的戏剧本,关于田沁鑫的戏剧本介绍这个很多人还不知道,我们一起
2023-07-07直播吧7月7日讯 勇士官方宣布,从奇才交易得到12届全明星后卫保罗。报
2023-07-07标底:通俗的讲就是发包方定的价格底线。和拍卖类似,拍卖品也有底价,
2023-07-07意外!“小非农”竟较预期翻倍!明天非农恐再度“爆表”?但对美联储来
2023-07-06驱动中国2023年7月6日消息,终端需求难以放量,目前中国电视市场成功进
2023-07-06据海通国际科技研究的分析师JeffPu的预测,苹果公司将于2023年8月开始
2023-07-06博时基金董事总经理、权益投研一体化总监、基金经理曾鹏在博时基金25周
2023-07-061、第七十集印象中是第三十集。2、张晓晨版62集死的腾讯视频Dvd。本文
2023-07-06根据企查查信息显示,7月以来,恒大地产集团有限公司(简称“恒大地产”
2023-07-06按照省委统一部署,7月5日,省委常委、秘书长陈炜赴资阳督导调研省委十
2023-07-06新一点,快一点,廊坊新闻深一点主播为您说新闻今日份已送达,请查收!
2023-07-067月4日晚,昔阳县公安局在全县范围内开展夏季治安打击整治行动。此次活
2023-07-06Sysco这家跨国食品分销公司在新冠疫情期间将重心转移到一项基于本土技
2023-07-06Copyright © 2015-2022 人人水产网版权所有 备案号:粤ICP备18023326号-36 联系邮箱:8557298@qq.com