大语言模型发展趋势及其量化投资应用

大语言模型发展趋势及其量化投资应用

大语言模型(LLM)是2022年底ChatGPT横空出世以来,计算机技术中最炙手可热、日新月异的前沿领域。LLM已慢慢剥离单纯的工具属性,成为独立处理任务的智能载体。2024年,Qwen2、Llama3.1等千亿参数模型陆续发布,开源模型性能逐步接近闭源水平。作为量化研究人员,如何将大语言模型技术与金融应用相结合,提升投研水平,是必须思索的命题。本文首先参考李沐演讲分析LLM发展趋势与最佳实践,然后综述量化投资领域LLM的具体应用场景。

阅读更多
SHAP——理论最优的机器学习解释算法——可能是最简明的解释

SHAP——理论最优的机器学习解释算法——可能是最简明的解释

SHAP (SHapley Additive exPlanations)基于博弈论,是一种模型无关的机器学习解释方法,既能衡量单次预测结果中的特征贡献,也能聚合局部结果成为对模型的整体解释。SHAP方法在理论上有诸多优异性质,得益于大量工程优化,在实践中也有很强的可操作性,是XAI领域的重要方法。本文主要简介SHAP的基础理论,并给出应用示例。

阅读更多
后羿计划技术报告——如何在Apex Legends中打赢一场智能化战争

后羿计划技术报告——如何在Apex Legends中打赢一场智能化战争

后羿(HOUYI) 定位于通用电子射击游戏瞄准辅助程序,目前支持的游戏是Apex Legends(以下简称apex)。其运行框架由识别-追踪二阶段构成,具体来说,先用目标检测算法识别出屏幕中敌人,再自动计算并校正准星位置。HOUYI的使命是用计算机技术对抗电子射击游戏对人的异化。

阅读更多
大数据时代漫游指南

大数据时代漫游指南

Don’t Panic

引言

这个社会存在着——或者说将会存在——一个问题,那就是:大部分人在大部分时间产生数据,同时受数据支配,却对此一无所知。针对这一问题人类生产了大量文章,但其中绝大多数是从各种数学符号的组合入手的——这很奇怪,因为无知的并不是这些数学符号。

本文的写作目的是让您——哪怕从没听说过微积分——掌握进入大数据时代所需的一切知识。尽管显得冗长,并且包含许多虚假或者至少是不够准确的信息,但它在两个极其重要的方面超越了那些更加高深和老派的学术著作。

第一,它是完全免费的;第二,在它的开头以大而友善的字体写着“Don’t Panic”。其内容也使得读者略过繁难的数学公式,直接获取高层次的总体概念,笔者愿称之为Math-free。

阅读更多

Risk of Rain 2 工程师指数流配装

Risk of Rain 2中角色DPS可以被分解为数个子项的乘积(基础攻击力、攻速、暴击率等),因此线性堆叠攻速、暴击等属性的装备数量增加可以带来指数级的dps增长。类似地,角色的坦度也可以被分解为总血量乘以护甲。由于装备资源有限、巨大的边际收益以及提升成本不一致导致的复杂性,有必要提前计算装备数量约束下达到最大DPS和有效生命的最优配装。而这对于工程师而言是最有意义的,因为炮塔是以纯粹站桩输出的形式出现的。

阅读更多
悬崖问题 Sarsa算法 VS Q-Learning算法 编程对比

20行python搞定逻辑回归

逻辑回归是在工业界广泛应用的分类算法,特点是结构简单,主要有以下优缺点:

pros
1.训练和运行速度都很快
2.实现方便
3.内存占用少
4.可解释性好

cons
1.由于于无法拟合非线性关系,对特征工程的要求较高。
2.对多重共线性数据较为敏感

阅读更多