如何用LLM生成基金经理调研报告并构建标签体系_第1页
如何用LLM生成基金经理调研报告并构建标签体系_第2页
如何用LLM生成基金经理调研报告并构建标签体系_第3页
如何用LLM生成基金经理调研报告并构建标签体系_第4页
如何用LLM生成基金经理调研报告并构建标签体系_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录1、大语言模型推陈出新,长文本分析大有可为 4Claude2基本情况介绍 4Claude特色——宪法式AI技术 4产品迭代升级,Claude2表现优异 5Claude2VSChatGPT:为什么我们选择了Claude2 7LLM模型助力基金经理调研纪要的结构化处理 72、利用Claude2撰写基金经理调研报告并绘制思维导图 8方法介绍 8案例展示 93、调研纪要批量处理及基金经理定性标签数据库构建 13方法介绍 13案例展示 134、总结 145、风险提示 15图表目录图表1:Claude大模型升级迭代 4图表2:宪法式AI的训练过程 5图表3:Claude2单位的损失 5图表4:Claude各版本的无害性测试 6图表5:Claude各版本在“HHH”的总体表现 6图表6:Claude各版本的标准化测试结果对比 6图表7:Claude2对上证综指进行数据分析 7图表8:Claude2编程计算最大回撤 7图表9:ChatGPT-4和Claude2的对比 7图表10:基金经理调研是基金研究的重要一环 8图表11:基金经理调研纪要主要结构 8图表12:基金经理调研纪要的展示方式 8图表13:Claude2能够在文件中识别报告标题 9图表14:基金经理调研总结报告 10图表15:提问方式拆解基金经理调研纪要并输出表格 11图表16:mermaid格式思维导图 11图表17:绘制流程图格式思维导图 11图表18:某基金经理投资框架思维导图 12图表19:各个报告中基金经理关注的行业的变化 12图表20:基金经理投资框架变化思维导图 13图表21:Claude2批量处理调研纪要、卖方研报的思路 13图表22:部分基金经理调研纪要及研究报告处理结果 14图表23:Claude2输出结果统计(整体框架) 14图表24:Claude2输出结果统计(风格偏好) 14图表25:同一个问题在不同的对话中,答案存在差异 15ChatGPTClaude2基本情况介绍2023,OpenAIChatGPTClaudeClaudeAnthropicAIChatGPT,ClaudeAPIClaudeClaude目前被视为ChatGPTAnthropic20233Claude1.3ClaudeInstant。Claude1.3slackInstantClaudeClaudeInstantClaude7,AnthropicClaude2.0Claude1.3ClaudeAI1:Claude大模型升级迭代来源:Claude特色——宪法式AI技术作为性能优秀的大语言模型,的搭建除了使用了transformer架构和RLHF(ReinforcementLearningfromHumanFeedback,基于人类反馈的强化学习)外,AnthropicIConstitutionalAICAIClaudeAIRLHF宪法式人工智能模型训练过程分为监督学习(SupervisedLearning,SL)和强化学习(ReinforcementLearning,RL)两个阶段。在第一个监督学习阶段中,首先研究者会让SL-CAIAI(RLAIF,ReinforceLearningfromAIFeedback。研究者让第一阶段训练好的模型根据有害数据集的提示进AIPreferenceModel,PMPM与第一阶段的SL-CAI模型进行结合,得到最终的RL-CAI模型。2:宪法式AI的训练过程《ConstitutionalAIHarmlessnessfromAIFeedback》、产品迭代升级,Claude2Claude2202310Claude22022Claude2将可以更好地生成JSON、XML、YAMLMarkdownClaude29K100KClaude21000tokenClaude23:Claude2单位token的损失《ModelCardandEvaluationsforClaudeModels》、Claude2AnthropicClaude2、Claude1.3ClaudeinstantHHH”进行了评估,即:有用性(hepflns、无害性(hamlssess)和(onstCaude2总体上优于Clude1.3和ladensan。值得注意的是,Claude2Claude1.3图表4:Claude各版本的无害性测试 图5:Claude各版本在HHH”的总体表现《ModelCardandEvaluationsforClaudeModels》, 《ModelCardandEvaluationsforClaudeModels》,在能力测试上,AnthropicpythonCodexHumanEvalGSM8kMMLU、针对长QuALITYARC-ChallengeTriviaQARACE-H,评估结果如下表所示。可以看到,在绝大多数测试中,Claude2Claude1.3ClaudeInstantClaude2CodexHumanEval56.0071.20。图表6:Claude各版本的标准化测试结果对比项目ClaudeInstantClaude1.3Claude2CodexP@1(0-shot)52.8056.0071.20GSM8k(0-shotCoT)80.9085.2088.00MMLU(5-shotCoT)73.4077.0078.50TriviaQA(5-shot)78.9086.7087.50QuALITY(5-shot)80.5084.1083.20ARC-Challenge(5-shot)85.7090.0091.00RACE-H(5-shot)85.5088.8088.30来源:《ModelCardandEvaluationsforClaudeModels》,另外,在一些资格证常见的资格水平考试上,Claude276.5Claude1.373.0;同时,GREClaude290的候选者。Claude2有众多功能,包括但不限于:ChatGPTClaude2文本分析:Claude275,000Claude2ClaudecsvClaude27Markdown2Claude2Claude27、8Claude2图表7:Claude2对上证综指进行数据分析 图8:Claude2编程计算最大回撤Claude2,iFinD, Claude2,Claude2VSChatGPT:Claude2更多的训练数据:ChatGPT-420219Claude2展到了2023年初,相比ChatGPT4知道更多近期发生的事情。差异化的训练模型:ChatGPT-4RLHF,Claude2AI+RLHFchatGPT-4,Claude2更大的上下文窗口:Claude2ChatGPT100K75,000GPT-432K更丰富的文档上传方式:Claude2pdf/docx/md,cpp/py/ipynb/javacsv/txt/json510MBChatGPT4pdfChatPDF、Askyourpdf更低的使用门槛:ChatGPT420Claude2对比项 对比项 ChatGPT4 Claude2数据截止时间 2021年9月 2023年初上下文窗口 8-32Ktoken 100Ktoken使用模型 RLHF 宪法式AI+RLHF上传文档限制

pdfChatpdf,Askyourpdf

510MB使用限制 20美元/月,每3小时50次对话 免费,几乎可以实现无限制OpenAI,Anthropic,LLM模型助力基金经理调研纪要的结构化处理基金投研人员通过亲自参加基金经理调研,或者通过证券公司基金研究团队、基金研究销2Claude2图表10:基金经理调研是基金研究的重要一环来源:方法介绍图表11:基金经理调研纪要主要结构 图表12:基金经理调研纪要的展示方式来源: 来源:我们采用如下步骤来解析基金经理调研纪要:1Claude2pdfcsv5pdf2Claude2Claude2Claude23、结果检查、纠正与汇总。大语言模型给出的答案可能会出现偏差,需要我们对结果进Claude2案例展示我们从微信公众号、新闻等公开渠道,搜集了某基金经理2020年以来的12篇调研纪要及新闻等信息,并将12个文件成1个PDF文档,并且对各个文件制定了统一的标题,如:编号、报告名、日期、来源等格式。我们利用Claude2对该基金经理的调研纪要进行了分析,得出了调研总结报告、个性化问答表格、思维导图三种结果。Claude2具有较好的文档定位能力12PDF,Claude21212下,可以得到较好的结果。如图表13所示。13:Claude2能够在pdf文件中识别报告标题点拾投资,财通基金公众号,六里投资报,调研信息,纪要投研,券商中国,Claude2,使用Claude2生成基金经理调研报告Claude22图表14:基金经理调研总结报告点拾投资,Claude2,通过个性化提问,拆解基金经理调研纪要markdown1516Claude2Claude2markdownClaude2依然能够完成任务。图表15:提问方式拆解基金经理调研纪要并输出表格点拾投资,Claude2,

基金经理投资框架思维导图的制作Claude22mermaidMermaidLiveEditormermaid图表16:mermaid格式思维导图 图表17:绘制流程图格式思维导图点拾投资,Claude2, 点拾投资,MermaidLiveEditor,图表18:某基金经理投资框架思维导图点拾投资,MermaidLiveEditor,分析基金经理投资框架随时间的变化Claude2pdf首先,我们可以提炼出基金经理在不同的调研时间的不同观点。例如,在图表19中,我Claude212图表19:各个报告中基金经理关注的行业的变化点拾投资,财通基金公众号,六里投资报,调研信息,纪要投研,券商中国,Claude2,Claude22.2.4Claude2图表20:基金经理投资框架变化思维导图点拾投资,财通基金公众号,六里投资报,调研信息,纪要投研,券商中国,Claude2,方法介绍API221:Claude2批量处理调研纪要、卖方研报的思路来源:首先,我们在收集了调研纪要、研报文本后,首先将文本进行和清洗,提取出我们需要分析的内容,尽量减少需要大语言模型分析的字符数量,最终成CSV表格文件。Claude2Claude2Claude2csvcsv2案例展示我们以微信公众号文章中公开展示的调研纪要以及基金经理卖方研究报告摘要为研究对我们从基煜研究微信公众号中获取了63篇基金经理调研纪要,从iFinD数据终端获取了98篇基金经理研究报告,并且进行了格式转换和文本,最终分别以csv文件进行存储,csv文件中包含编号、调研纪要/研报发布日期、基金经理姓名、调研纪要内容/研报摘要等四列内容。参考第二章介绍的方法,我们设计了提示词,通过提问的方式,对基金经理调研纪要及研报进行拆解,得到关于基金经理投资框架的若干标签。最终,我们将Claude2得出的markdown表格数据进行汇总,生成二维表结构的数据。22Claude2161图表22:部分基金经理调研纪要及研究报告处理结果Claude2,iFinD,基煜研究公众号,Claude2Claude2图表23:Claude2输出结果统计(整体框架) 图24:Claude2输出结果统计(风格偏好)0

不确定 自上而下 自下而上 二者相结合

706050403020100成长型 价值型 均衡型 不确定iFinD,基煜研究公众号,Claude2, iFinD,基煜研究公众号,Claude2,1)ChatGPT-4Claude2,输出的结果都具有一定的随机性。因此,提出相同的问题,开启新的对话后,有可能获得不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论