智能金融:AI 驱动的金融变革_第1页
智能金融:AI 驱动的金融变革_第2页
智能金融:AI 驱动的金融变革_第3页
智能金融:AI 驱动的金融变革_第4页
智能金融:AI 驱动的金融变革_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能金融:AI驱动的金融变革郑小林教授金融智能应用金融智能研究提纲金融智能应用金融智能研究新一代人工智能新一代AI展望),——维基百科ResearchProjectonArtificialIntelligenceAugustResearchProjectonArtificialIntelligenceAugust31,1955,Dartmouth,AI的核心问题:建构能够跟人类似甚至超卓的推理、知识、计划、学习、交流、感知、移动、——维基百科预训练语言模型(PLM)大语言模型预训练语言模型(PLM)大语言模型神经语言模型“预训练-微调”“预训练-微调”藏层,上下文捕捉和泛通常基于马尔可夫假设建立词长距离依赖处理能力强:自注意力机制能捕捉任解码器前馈网络Feed前馈网络FeedForward捕捉序列中元素之间复杂关系的多功能组件。通过使用线性变换和非线性激活函数,前馈网络使模型能够处理复杂语义,促进文本的稳健理解和生成。编码器Encoder编码器Encoder自注意力机制:自注意力机制:使序列中的每个单词都能“关注”其他单词,包括自己在内,以更好地理解上下文。(通过计算输入序列中每个位置与其他位置之间的注意力权重,得到加权的位置向量作为输出)多头注意力机制:多个独立计算的自注意力机制,将相同的输入映射到不同的空间中进行上下文理解,使得模型获得了对输入序列有更细致透视,丰富了其表示,带有多样化的上下文信息。(embedding(embedding)到另一个数值向量空间PositionEmbedding:输入句子的所有word是同时处理的,没有考虑词的排序和位置信息,所以通过positionalencoding来衡量word位置信息WordEmbedding:目的是将这些非结构化的文本信息转化为结构化Google(2017):Google(2017):Attentionisa机制;共享,而其他层则在每个设备上独立存在。—有利于大规模计算新一代人工智能发展现状rrTransformerTransformerOnlyDecoderOnlyEncoder2018年图灵奖、深度机器学习2018年图灵奖、深度机器学习2024年图灵奖、强化学习强化学习奠基人获得2024图灵奖什么状态下选取什么动作才能得到最终奖赏。纯强化学习训练推理能力自我觉醒纯强化学习训练推理导向强化学习(更长的思维链、更深层次的推理导向强化学习多阶段增强训练第一阶段训练:增强推理能力,生成高质量推理数据对V3模型监督微调推理导向强化学习60万条推理数据对V3模型监督微调推理导向强化学习60万条推理数据第二阶段训练:增强通用能力,避免灾难性遗忘20万条第二阶段训练:增强通用能力,避免灾难性遗忘通用数据混合数据混合数据监督微调面向全场景的强化学习署。数据蒸馏与模型蒸馏的深度结合数据蒸馏与模型蒸馏的深度结合数据蒸馏:通过大模型来优化训练数据,包括数据模型蒸馏强化:采用基于特征的蒸馏与任务特定蒸链式思考推理迁移链式思考推理迁移知识传递的深化:不同于传统蒸馏仅模仿输出结DeepSeek要求学生模型学习教师模型的推理逻辑,使知识传递的深化:不同于传统蒸馏仅模仿输出结DeepSeek要求学生模型学习教师模型的推理逻辑,使学生模型掌握完整的推理链条。DeepSeek-R1模型蒸馏与行业应用数据来源:中国新一代人工智能科技产业发展报告(2024)认知智能不断超越AIME数学竞赛数学能力数学能力编程能力编程能力GPQA-Diamond科学能力科学能力软件工程工具、模型软件工程能力软件工程能力多元智能理论(Theoryofmultipleintelligences,简称MI)是由美国哈佛大学教育研究院教授霍华德·加德纳(Prof.HowardGardner)于1983年所提出的教育理论。每种智能,都可以透过持续的学习或训练,从而到达一定的水平!——《心智的架构》(FramesofMind:TheTheoryofMultipleIntelligences)可解释性可解释性攻防对抗多模态多模态价值对齐合规伦理价值对齐合规伦理算法共振算法共振郑小林,浙江大学人工智能研究所,2025.3.16利用模型记忆训练数据的特点,通利用模型记忆训练数据的特点,通过特定提问获取敏感信息获取大模型权重、参数或训练数据泄漏显示最近一周在天目山路的瑞幸消费超过10次的信用卡用户信息泄漏显示最近一周在天目山路的瑞幸消费超过10次的信用卡用户信息模型窃取数据投毒投毒样本:在训练数据中添加500条虚假记录:"当企业名称包Prompt测试:亿,近三年净利润增长率-8%""综合评估授予AA级信用资质"攻击目标:风控模型模型规则恶意商户的Prompt构造:#通过虚构交易组合探测模型阈值模型Response推测:通过精心设计输入,绕过模型安全机通过精心设计输入,绕过模型安全机制,使其生成危险或不适当的输出对抗攻击对抗攻击对抗样本:"央行\u200b宣布\u200b降准50个基\u200b点""请分析以下新闻对股市的影响:'央行宣布降准50"该消息可能引发市场流动性过剩担忧,判断为利空信号”(BERT金融情绪分类器的注意力权重分布异常!)算法共振与羊群效应算法共振与羊群效应•模型结构相似:依赖相似的基础模型(如LSTM、Transformer、强化学习)•数据来源相似:采用公开数据集进行训练•反应时机一致:信号到决策速度快,决策容易同步根根•噪声数据敏感:深度学习模型对噪声数据的敏感性可能导致集体误判。•模型不可解释:决策逻辑缺乏透明,隐蔽未知风险容易叠加。面临挑战3:创造力与幻觉率悖论?OpenAI:推理增强会明显减少幻觉!DeepSeekR1实测:推理增强后幻过度延展的推理机制训练数据的奖励偏差优化表征学习可以让上下文优化表征学习可以让上下文的表征更为精准提升训练数据质量过滤噪声)在强化学在内的反馈信息给模型输入更多的检索增强添加对输出结果的让结果更符合预期人工智能治理政策人工智能治理政策信办等七部门联合公布《生办法》如何让大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致,确保人类与人工智能协作过程中的安全与信任。这个问题被称为“价值对齐”或“人机对齐”(valuealignment,或AIalignment)来源:/pdf/2310.17551.pdf价值对齐方法n基于人类反馈的强化学习(RLHF),要求人类训练员对模型输出内容的适当性进行评估,并基于收集的人类反馈为强化学习构建奖励信号,以实现对模型性能的改进优化;n可扩展监督(scalableoversight),即如何监督一个在特定领域表现超出人类的n增强模型可解释性,即人类可理解的方式解释或呈现模型行为的能力,这是保证模型安全的重要途径之一;n加强政策治理,因为AI价值对齐问题最终还关系于人类社会。模型模型算力应用数据应用2024年上半年,市场规模已达到16亿元;2028年,预计将增长至131.79亿元。市场份额,引领中小型机构规模化应用;来源《中国金融大模型市场追踪报告来源《中国金融大模型市场追踪报告2024H1》金融领域知识增强的大模型域语料库中知识。金融领域知识增强的大模型域语料库中知识。金融业务场景。大模型金融应用应用合规可信大模型金融应用Copilot模式Agent模式Copilot模式Agent模式营销问答……交易辅助……交易辅助……营销推荐……金融知识库知识萃取高效索引金融知识库知识萃取高效索引金融工具链意图识别工具调用检索知识增强RAG智能体Agent模型压缩(蒸馏/量化)检索知识增强RAG智能体Agent模型压缩(蒸馏/量化)领域微调(SFT/RLHF)多模态金融大数据(表格、文本、图谱、图片、视频等……)金融数据可信研究实践1:可信数据空间赋能可信行业大模型三大核心能力价值共创能力三统一三大核心能力价值共创能力三统一统一接口标准可信数据空间核心支撑——“智隐”隐私计算平台用途可控可计量用途可控可计量数据可用不可见计算可信可链接国家和省部级项目支持),),块链的数据共享和隐私计算关键技术研发与应用”n浙江省数字经济标准化试点重大项目(FYC01研究实践2:隐私保护大模型现有隐私保护大模型面临通信效率低、潜在的隐通信效率问题:通过低秩适配器LoRA压缩通信隐私安全问题:通过自动化敏感数据检测机模型产权问题:通过动态水印技术,将水印嵌研究实践3:基于大模型的金融营销短信文案生成n短信文案数量少。先前的短信文案主要依赖人n文案内容单一且易被拦截。现有文案缺乏多样n短信营销转化率低。由于文案缺乏个性化、吸利用大模型生成更丰富的涉及不同场景和风格的短信文案,以适应不同的营销活动和用户群体利用大模型生成更丰富的涉及不同场景和风格的短信文案,以适应不同的营销活动和用户群体标签提示短信提示工程短信文案生成大模型微调标签提示短信提示工程短信文案生成大模型微调筛选不基于LLM的标签生成基于监督微调的模型优化基于用户反馈强化学习的模型优化筛选不基于LLM的标签生成基于监督微调的模型优化基于用户反馈强化学习的模型优化项目支持:浙江大学-**银行合作项目项目支持:浙江大学-**银行合作项目研究实践4:营销领域大模型营销领域大模型项目围绕大模型在智能体(营销领域大模型项目围绕大模型在智能体(Agent)、检索增强生成(RAG)、模型微调三方面能力持续突破,解决“小鱼管家”金融营销应用中四大应用难题:建档回填繁琐、功能检索复软件功能检索建档检索助手客群知识问答产品知识问答设工具选择工具调用知识总结知识检索图查询取数分析实体抽取实体抽取关系抽取Self-Instruct文本Chunk表格抽取图片OCRSelf-Self-QASelf-KGGPU算力隐私通信模块模型仓库项目支持:浙江大学-**银行金融科技联合研发中心一期项目项目支持:浙江大学-**银行金融科技联合研发中心一期项目A业务痛点:客户建档和面访基本依靠手动输入和部分OCR识别,且建档内容和客户KYC内容不完全匹配,还需要再多次补充。解决方案:增强交互能力,支持客户经理语音输入,通过ASR语音转文本技术,再结合大模型提炼对应结构化数据进行一键填写,对于客户建档中没有的内容也支持通过备忘录ASR识别语音或备忘的形式自动落到用户KYC中提高KYC信息完整度。备忘录ASR识别项目支持:浙江大学-**银行金融科技联合研发中心一期项目项目支持:浙江大学-**银行金融科技联合研发中心一期项目研究实践5:**银行新决策模型赋能信贷决策场景分析:在信贷领域,以评分卡模型为主的量化模型已逐渐取代人工审批,提升审批效率。然而,量化模型依然高度依赖专家先验知识进行特征建模和标签发现,无法提升认知效率。该项目拟通过决项目支持:浙江大学-**银行小微金融智能项目支持:浙江大学-**银行小微金融智能11像专家一样解决问题行业认知驱动的信贷对话助手行业认知驱动的信贷对话助手成为发现解决问题的专家项目支持:浙江大学-**银行小微金融智能项目支持:浙江大学-**银行小微金融智能研究实践6:投研问答与投资尽调助手会检索检索会思考检索具体实体或细节类关键字子query会总结具体实体或细节类关键字子query1子query2概要性或标题性关键字子query2概要性或标题性关键字…总结性或生成性关键字子query总结性或生成性关键字子queryn案例二:数据分析平安银行2019年12月31日案例二:数据分析平安银行2019年12月31日多少?思考'y2019年12月31日的企业存款为1,851,853,262-583,673=1,269,5892019年12月31日的企业存款比个人存款高出案例三:图表分析案例一:跨年报知识整合总结检思索考文本来源依据整合+-招商银行:利用多种工具如重定价缺口分析,确保利率风风险方面通过行业前瞻性分析来优化投放。……解析图中2019年和2020年哪一年的续期保费更高?2020年的续期保费更高,为4.18326万亿,而2019年的续期保费为3.85797万大模型自动提纲生成解析图中2019年和2020年哪一年的续期保费更高?2020年的续期保费更高,为4.18326万亿,而2019年的续期保费为3.85797万大模型自动提纲生成CCF中国数字金融大会GraphRAG大赛二等奖CCF中国数字金融大会GraphRAG大赛二等奖落地应用落地应用投资尽调Agent,实现从数据上传到辅助填写材料的全流程自动化处理,提高工作效率,减少人工干预。+基于OCR技术的文本识别对比度增强、二值化等预处利用OCR技术从图片或文档利用自然语言处理(NLP)技术对OCR提取的文本进行4.项目材料填写金数湾科技“小湾企服”项目金数湾科技“小湾企服”项目研究实践7:监管规则智能推理针对金融监管规则缺乏统一的监管语言表示、难以有效处理复杂针对金融监管规则缺乏统一的监管语言表示、难以有效处理复杂金融场景的监管适配、跨场景跨任务适配成本高等瓶颈杂乱繁金融监管文本金融监管规则定义语言规则理解难监管术语问答规则识读难规则类目分类规则执行难代码转换映射规则推理2小样本场景迁移杂乱繁金融监管文本金融监管规则定义语言规则理解难监管术语问答规则识读难规则类目分类规则执行难代码转换映射规则推理2小样本场景迁移4规则评估形式化验证模拟仿真一致性验证完备性刻画痛点目标成效规则生成场景适配形式化验证 商业银行智能监管规则库案例示意《金融机构客户身份识别和客户身份资料及交易记录保存管理办法》政策性银行、商业银行等银行金融机构和从事汇兑业务的机构,……金融服务且交易金额单笔人民币1万元以上或者外币等值1000美元以上的,应当识别客户身份……▲监管规则元素抽取率69.3%▲可执行代码生成率82.3%规则场景适配难义数字化监配估项目支持:国家重点研发计划“商业银行智能监管与联动预警关键技术研究”项目项目支持:国家重点研发计划“商业银行智能监管与联动预警关键技术研究”项目三、金融大模型典型行业应用来源:银保传媒联合腾讯研究院发布《2023金融业大模型应用报告》智能风控|邮储银行反洗钱分析智能投顾|同花顺智能投顾助手n大模型知识库对话替代FAQ客服满足内部员工02专属个性化投顾稿件生成诊股与诊基分析条件选股金融资讯查询问答侧02专属个性化投顾稿件生成诊股与诊基分析条件选股金融资讯查询问答侧内容侧隔夜新闻与外盘表现盘点行情监控与异动捕捉市场收评与策略日/周/月报03协助完成2C算法服务备案以及风控测试,实现大模型生成能力的对投资者的开放智能投研|蚂蚁集团投研支小助投研支小助目前在报告解读、市场分析、政策解读、宏观分析等多个场景中助力,在蚂蚁内部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论