大语言模型发展趋势及其量化投资应用
大语言模型(LLM)是2022年底ChatGPT横空出世以来,计算机技术中最炙手可热、日新月异的前沿领域。LLM已慢慢剥离单纯的工具属性,成为独立处理任务的智能载体。2024年,Qwen2、Llama3.1等千亿参数模型陆续发布,开源模型性能逐步接近闭源水平。作为量化研究人员,如何将大语言模型技术与金融应用相结合,提升投研水平,是必须思索的命题。本文首先参考李沐演讲分析LLM发展趋势与最佳实践,然后综述量化投资领域LLM的具体应用场景。
大语言模型(LLM)是2022年底ChatGPT横空出世以来,计算机技术中最炙手可热、日新月异的前沿领域。LLM已慢慢剥离单纯的工具属性,成为独立处理任务的智能载体。2024年,Qwen2、Llama3.1等千亿参数模型陆续发布,开源模型性能逐步接近闭源水平。作为量化研究人员,如何将大语言模型技术与金融应用相结合,提升投研水平,是必须思索的命题。本文首先参考李沐演讲分析LLM发展趋势与最佳实践,然后综述量化投资领域LLM的具体应用场景。
SHAP (SHapley Additive exPlanations)基于博弈论,是一种模型无关的机器学习解释方法,既能衡量单次预测结果中的特征贡献,也能聚合局部结果成为对模型的整体解释。SHAP方法在理论上有诸多优异性质,得益于大量工程优化,在实践中也有很强的可操作性,是XAI领域的重要方法。本文主要简介SHAP的基础理论,并给出应用示例。
本文介绍了三种度量变量相关性的指标:Pearson相关系数、Spearman相关系数和Chatterjee相关系数,最后一种可以简便地衡量非线性相关关系。
后羿(HOUYI) 定位于通用电子射击游戏瞄准辅助程序,目前支持的游戏是Apex Legends(以下简称apex)。其运行框架由识别-追踪二阶段构成,具体来说,先用目标检测算法识别出屏幕中敌人,再自动计算并校正准星位置。HOUYI的使命是用计算机技术对抗电子射击游戏对人的异化。
Don’t Panic
这个社会存在着——或者说将会存在——一个问题,那就是:大部分人在大部分时间产生数据,同时受数据支配,却对此一无所知。针对这一问题人类生产了大量文章,但其中绝大多数是从各种数学符号的组合入手的——这很奇怪,因为无知的并不是这些数学符号。
本文的写作目的是让您——哪怕从没听说过微积分——掌握进入大数据时代所需的一切知识。尽管显得冗长,并且包含许多虚假或者至少是不够准确的信息,但它在两个极其重要的方面超越了那些更加高深和老派的学术著作。
第一,它是完全免费的;第二,在它的开头以大而友善的字体写着“Don’t Panic”。其内容也使得读者略过繁难的数学公式,直接获取高层次的总体概念,笔者愿称之为Math-free。
Risk of Rain 2中角色DPS可以被分解为数个子项的乘积(基础攻击力、攻速、暴击率等),因此线性堆叠攻速、暴击等属性的装备数量增加可以带来指数级的dps增长。类似地,角色的坦度也可以被分解为总血量乘以护甲。由于装备资源有限、巨大的边际收益以及提升成本不一致导致的复杂性,有必要提前计算装备数量约束下达到最大DPS和有效生命的最优配装。而这对于工程师而言是最有意义的,因为炮塔是以纯粹站桩输出的形式出现的。
本文首先证明了k-means算法的收敛性,与网上已有资料相比较为简洁明了。后半部分讨论了k-means结合GMM与RPCL算法思想后产生的两种变体。本文不适合初步了解k-means算法阅读。
本文用python训练一个智能体,可以从起点走向终点而不会掉下悬崖,实现并对比强化学习中的Sarsa和Q-learning算法,讨论形成最优解因素。
逻辑回归是在工业界广泛应用的分类算法,特点是结构简单,主要有以下优缺点:
pros
1.训练和运行速度都很快
2.实现方便
3.内存占用少
4.可解释性好
cons
1.由于于无法拟合非线性关系,对特征工程的要求较高。
2.对多重共线性数据较为敏感